2022年卫生统计学期末复习重点,DOC.pdf
《2022年卫生统计学期末复习重点,DOC.pdf》由会员分享,可在线阅读,更多相关《2022年卫生统计学期末复习重点,DOC.pdf(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、卫生统计学期末复习提要一、期末考试有关问题的说明出题的指导思想、原则及题目类型出题的指导思想是:全面考核学生对本课程的基本概念、基本方法,基本技能的掌握情况,考核学生运用所学的知识和方法综合分析与解决实际问题的能力。出题的原则是:不超过教学大纲的内容,难度适中但覆盖面较广,基本知识占,稍难或灵活的题目占。凡自学的章节不考。答题要求选择题:要求选择无误,每题只选一个最佳答案。计算分析题:要求完整地写出计算步骤(包括计算公式)、用计算器计算出正确结果,并能对所得结果作出相应的分析结论。二、期末复习范围和重点绪言重点复习的名词:计量资料: 对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称
2、为计量资料(measurement data ) 。计量资料亦称定量资料、测量资料。计数资料 :将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data) 。计数资料亦称定性资料或分类资料。总体 (population):表示大同小异的对象(某个测量值)全体。样本 (sample) :从研究总体中随机抽取的一部分有代表性的个体变异 (variation):同一总体内的个体间存在差异。抽样误差 : 消除了系统误差并控制了随机测量误差之后,样本数值仍和总体指标的数值有差异,这种误差称之。概率 : 某事件出现机会大小的量。重点复习的问题:、根据计量、计数、等级资料的概念正确
3、识别统计资料的类型。等级资料: 将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料 (ordinal data) ,等级资料又称有序变量。等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。、统计工作的步骤及搜集资料的来源和要求。1设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研究中最关键的一环,是今后工作应遵循的依据。2收集资料:应采取措施使能取得准确可靠的原始数据。3整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。4分析资料:计算有关指标,反映事
4、物的综合特征,阐明事物的内在联系和规律。分析资料包括统计描述和统计推断。、抽样研究的原因及目的,产生抽样误差的原因。一般复习的名词:同质:一些个体处于同一总体么就是指他们大同小异,具有同质性。参数: :参数( paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。随机化抽样:随机抽样(rand
5、om sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。样本含量:一般复习的问题:、卫生统计学的内容及学习卫生统计学的意义。、统计工作各个步骤的基本内容和关系。集中趋势与离散趋势精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 1 页,共 12 页 - - - - - - - - - - 重点复习的名词:频数分布表 :当变量值个数较多时,对各变量值出现的频率列表即为频率分布表(frequency dis
6、tribution table )。中位数(median ,M):将原始观察值从小到大或者从大到小排序后,位次居中的那个数。重点复习的问题:、对频数分布特征的描述。频数分布分为集中趋势(central tendency)和离散趋势 (tendency of dispersion)。常用描述定量变量集中趋势的统计指标包括算数均数、几何均数、中位数。算数均数适用于对称分布,特别是正态分布的资料; 几何均数适用于可经对数转换为对称分布的资料;中位数适用于各种分布资料,常用于描述偏峰分布的资料。常用的描述定量变量离散趋势的统计指标包括极差、四分位数间距、方差、标准差和变异系数。极差只利用最大值和最小值
7、的信息,易受样本含量的影响,很不稳定;四分位数间距适用于各种分布资料;方差和标准差适用于对称分布,特别是正态分布的资料;变异系数常用于量纲不同时,或均数相差较大时变量间变异程度的比较。实际应用中,常将算数均数和标准差结合对正态分布资料进行统计描述;常将中位数和四分位数间距结合对偏峰分布资料进行统计描述。、平均指标:算术均数、几何均数、中位数的意义及应用条件,算术均数的计算。、变异指标:全距、标准差、变异系数的意义及应用条件,标准差和变异系数的计算。精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 2 页,共
8、 12 页 - - - - - - - - - - 、正态分布的两个参数及正态曲线下面积的分布规律。正态分布的特征:服从正态分布的变量的频数分布由 、 完全决定。(1) 是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以x = 为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于 。(2) 描述正态分布资料数据分布的离散程度,越大,数据分布越分散,越小,数据分布越集中。也称为是正态分布的形状参数,越大,曲线越扁平,反之,越小,曲线越瘦高。正态曲线下面积的分布规律:如果用其标准差作为衡量单位,则以均数为中心,正负1个标准差内,即(- ,+)区间内,正态分布曲线下的面积为总面
9、积的68.27%;正负 2个标准差内,即(-2,+2 )区间内,面积为95.44%;正负 3个标准差,即(-3, +3)区间内,面积为99.74%。这是由正态分布的性质所决定的。一般复习的问题:、除 外,正态分布的其余特点。、变换的形式和作用。、查阅标准正态曲线下面积表的方法。均数的抽样误差及标准误重点复习的名词:均数的抽样误差:抽样造成的这种样本均数与样本均数之间、样本均数与总体均数之间的差异。标准误 :用于表示均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。总体均数的可信区间:用统计量 X 和Sx确定一个有概率意义的区间,以该区间具有较大的可信度包含总体均数。
10、重点复习的问题:、标准误的意义、计算及应用。标准误:用于表示均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。标准误的计算公式:在实际应用中可通过增加样本含量n来减小样本均数的标准误,从而降低抽样误差。对于任意分布,在样本含量足够大时,其样本均数的分布近似于正态分布,且样本均数的均数等于原分布的均数,均数的标准误由公式XnXsnsXsns精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 3 页,共 12 页 - - - - - - - - - - 计算。、标准差与标准误的区别与联
11、系。样本均数标准误的大小与标准差成正比,与样本含量n的平方根成反比,即在同一总体中随机抽样,样本含量n越大,抽样误差越小。、总体均数可信区间的意义和计算。根据总体标准差是否已知及样本含量n的大小, 总体均数置信区间的计算有t分布和Z分布(标准正态分布)两种方法。1. t分布方法当总体标准差未知时,正态总体N( , 2)的样本均数的t变换结果服从t分布,若 “ 砍去 ”t分布双侧尾部面积= 0.05 = 5% ,故有 95% 的t值满足不等式:t0.05/2, t0.05/2, t0.05/2, t/2, 或 + t/2, 2 正态分布近似方法(1)当总体标准差已知时,总体均数的双侧置信区间为
12、Z/2(2)当未知但n足够大时(n 50) ,t分布的极限分布是标准正态分布,可用z/2 代替公式( 5-9 )中的t/2, ,则总体均数的双侧置信区间为 Z/2同理 , 与( 5-8 )和( 5-9 )式相对应 , 单侧置信区间则为z或z + z或 + z、总体均数可信区间与正常值范围的区别。参考值范围总体均数的置信区间意义绝大多数人某项指标的数值范围指一定的置信度估计总体均数所在的范围计算正态分布双侧Z/2单侧 ,( - Z/2 S, ) 或( - , + Z/2 S)偏峰分布双侧, PxP100-x单侧 ,(PX, ) 或(- ,P100-X) 正态分布未知:双侧, t/2,v单侧, (
13、 - t/2,v , ) 或(- , + t/2,v ) 已知:双侧,Z/2单侧, ( - Z, ) 或(- , + Z) 正态分布或偏峰分布未知但 n 足够大:双侧Z/2XXsXsXXsXXXsXsXXsXXsXXsXXXXsXXXXXXXsXsXXsXXXXsXXsXXsXXXXXXXXXXsXsXs精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 4 页,共 12 页 - - - - - - - - - - 单侧 ( - Z, )或( - , + Z/)应用判断某项指标正常与否估计总体均数所在的范围一
14、般复习的问题:、抽样误差的规律。、提高对总体均数可信区间估计精度的办法。均数的假设检验重点复习的名词:检验假设:零假设(null hypothesis),又称原假设。检验水准 :根据问题的背景,规定一个“小”的概率,若 P值小于 ,就认为“ P值较小”,若 P值 不小于 ,就认为“ P值较大”。通常取 =0.05 或 0.01 以保证犯假阳性错误的概率不超过0.05 或 0.01 。这个 称为检验水准。假设检验中的值:在零假设成立的条件下,出现统计量目前值及更不利于零假设数值的概率。可比性:第类错误和第类错误:假阳性错误称为第I 类错误( type I error ) ,指拒绝了实际上成立的H
15、0,这类“弃真”的错误称为I 型错误,其概率大小用a 表示;假阴性错误称为第II 类错误( type II error) ,指接受了实际上不成立的H0,这类“存伪”的误称为II 型错误,其概率大小用b 表示。重点复习的问题:、值;分布与标准正态分布的关系。、假设检验的基本思想和步骤。基本思想:把握“小概率事件在一次抽样试验中是几乎不可能发生”的原理。步骤:建立假设、选用单侧或双侧检验、确定检验水准;选用适当检验方法,计算统计量;确定P 值并作出推断结论。、样本均数与总体均数比较的检验。、两大样本均数比较的检验。、配对设计三种形式的特点及检验的。、。配对设计三种形式的特点:1)异体配对:两个受试
16、对象。2)自身配对:同一受试对象的两个部位分别接受两种处理。 3)统一受试对象接受某种处理之前和之后的数据,也可以视为自身配对。、假设检验时需注意的问题。(重点是可比性和犯第类及第类错误的含义与概率) 可比性:I 类错误: H0为真(实际无差别) ,假设检验结果拒绝H 0,接受 H 1(推论有差别)所犯的错误称为I 类错误( type I error) , I 类错误的概率记作a 。II 类错误: H1为真(实际有差别) ,假设检验结果拒绝H 1 ,接受 H 0(推论无差别)所犯的错误称为II 类错误( type II error) ,II 类错误的概率记作 。 1- 称为检验效能,过去称把握
17、度(power of test ) ,即两总体确有差别,按a水准能发现该差别的能力。一般复习的名词:自由度、假设检验。精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 5 页,共 12 页 - - - - - - - - - - 一般复习的问题:、配对设计的检验。、两小样本均数比较的检验。、检验的应用条件。方差分析一般复习的问题:、方差分析的基本思想。、完全随机设计的特点和方差分析法。、配伍组设计的特点和方差分析法。、多个样本均数的两两比较。相对数重点复习的名词:构成比:( proportion)说明某一事
18、物内部各组成部分所占的比重或分布。率: (rate )说明一定时期内某现象发生的频率或强度。相对比:,是 A、B 两个有关指标之比,说明A 是 B 的若干倍或百分之几。比=A/B 动态数列: (dynamic series)是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用以说明事物在时间上的变化和发展趋势。重点复习的问题:、构成比、率、相对比、定基比、环比的计算。比=A/B 定基比,即统一用某个时间的指标作基数,其它各时间的指标都与之相比;环比,即以前一个时间的指标作基数,以相邻的后一个时间的指标与之相比。、下述指标的意义及计算: 死因构成,发病率,患病率,死亡率,病死率。
19、死因构成 (proportion of dying of a specific cause)指全部死亡人数中,死于某死因者所占的百分比,说明各种死因的相对重要性。死因构成比=同年某死因死亡数/ 同年内死亡总数*100% (频率型)发病率 (incidence rate,IR)表示在一定时期内,在可能发生某病的一定人群中新发生某病的强度。某病发病率=时期内新发生的某病病例数/ 年平均人口数 *1 年 (强度型)患病率 (prevalence rate,PR) 指某时点上受检人数中现患某种疾病的频率,通常用于描述病程较长或发病时间不易明确的疾病的患病情况。患病率=现患病人数 / 检查人口数(频率型
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 卫生 统计学 期末 复习 重点 DOC
限制150内