《最新卫生统计学卡方检验幻灯片.ppt》由会员分享,可在线阅读,更多相关《最新卫生统计学卡方检验幻灯片.ppt(60页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、卫生统计学卡方检验卫生统计学卡方检验Dec 1,2009第一节 样本率和总体率的比较一、直接计算概率法一、直接计算概率法例例91 根据以往经验,新生儿染色体异根据以往经验,新生儿染色体异常率一般为常率一般为1,某医院观察了当地,某医院观察了当地400名名新生儿,只有新生儿,只有l例染色体异常,问该地新例染色体异常,问该地新生儿染色体异常率是否低于一般生儿染色体异常率是否低于一般? knkknkxP)()(1Dec 1,2009H0: 1= 2 H1: 1 2 =0.05X1=90,n1=660,X2=140, n2=640p1=90/660=0.1364, p2=140/640=0.2188
2、0212. 021 ppS89. 30212. 0|2188. 01364. 0|u因为因为u0.05/2=1.96,uu0.05/2,P0.05,所以拒绝所以拒绝H0。Dec 1,2009U 检检 验验 2 检检 验验两个率(或两两个率(或两类构成)是否类构成)是否相等相等两个或多个两类构成两个或多个两类构成(或率)或(或率)或 两个或多两个或多个多类构成总体的构个多类构成总体的构成比(或率)或行变成比(或率)或行变量和列变量是否独立量和列变量是否独立满足正态性满足正态性条件条件无正态无正态性要求性要求Dec 1,2009例例94 叙述见例叙述见例93,将上述资料整理,将上述资料整理成表格如
3、下:成表格如下:表表91 某市某市2000年城乡居民的两周患病率年城乡居民的两周患病率Dec 1,2009 2检验的基本思想检验的基本思想 一、四格表资料的一、四格表资料的 2检验检验组别组别阳性数阳性数阴性数阴性数合计合计I组组aba+b=n1.II组组cdc+d=n2.合计合计a+c=n.1b+d=n.2a+b+c+d=nDec 1,2009 基本步骤基本步骤H0:城乡居民的两周总体患病率相同:城乡居民的两周总体患病率相同即即 1 1 2 2 H1:城乡居民的两周总体患病率不同城乡居民的两周总体患病率不同即即 1 1 2 2, 0.050.051、建立假设、建立假设Dec 1,2009TT
4、A22)( 2、实际频数与理论频数的差值服从、实际频数与理论频数的差值服从 2分布:分布:计算计算 2值的基本公式:值的基本公式: (R1)()(C1) 3、查表,判断结果,下结论。查表,判断结果,下结论。Dec 1,2009A: actual value 实际数实际数T: theoretical value 理论数理论数Dec 1,2009 H0: 1 2 理论数理论数T为假设的总合计率已知的条件下,为假设的总合计率已知的条件下,所估计的理论频数,在目前的情况下,将所估计的理论频数,在目前的情况下,将样本现有的合计患病率作为总合计率样本现有的合计患病率作为总合计率 的最的最佳估计,即佳估计,
5、即17.69%Dec 1,2009城区理论两周患病频数为 17.69%660=230 660/1300=116.77城区理论两周非患病频数为82.31%660=1070 660/1300=543.33农村理论两周患病频数为 17.69% 640=230 640/1300=113.23农村理论两周非患病频数为82.31%640=1070 640/1300=526.77理论频数理论频数TRC的计算公式为:的计算公式为: TRCnRnC/nDec 1,2009 H0:该市城乡居民的两周总体患病率相同,:该市城乡居民的两周总体患病率相同,1=2H1:该市城乡居民的两周总体患病率率不同,:该市城乡居民的
6、两周总体患病率率不同,12 =0.0515.1577.52677.52650023.11323.11314023.54323.54357077.11677.11690222222)()()()()(TTA查附表查附表12可知,可知,=1时,时, ,本例,本例 ,按照,按照=0.05的检验水准,拒绝的检验水准,拒绝H0假假设,接受设,接受H1假设。即该市城乡居民的总体两周患病假设。即该市城乡居民的总体两周患病率不同。根据现有资料看出,农村的患病率高于城率不同。根据现有资料看出,农村的患病率高于城区。区。88. 7,84. 321 ,005. 021 ,05. 0005. 0,21 ,005. 0
7、2PDec 1,2009 当当H0为真时,一般情况下,两样本率不会为真时,一般情况下,两样本率不会相差太大,相应的理论频数相差太大,相应的理论频数(T) 和实际频和实际频数数(A)相差也不会太大,当相差也不会太大,当T和和A相差较大相差较大时,超出了实际误差范围,就有理由怀疑时,超出了实际误差范围,就有理由怀疑H0的成立。的成立。Dec 1,2009Dec 1,2009 0 .0 0 .1 0 .2 0 .3 2 0 1 2 3 4 5 6 7 8 9 1 0 = 1 = 3 = 5 1 1 与与u u、t t、F F分布一样,分布一样, 2 2 分布是分布是一个连续型的分布,只有一个参数一个
8、连续型的分布,只有一个参数 决定它的形状;决定它的形状;2 2 越大,曲线趋于对称,越大,曲线趋于对称, , 2 2 分布趋向正态分布;分布趋向正态分布;3 3 卡方图形的面积分布有规律性,卡方图形的面积分布有规律性, 记为自由度为记为自由度为 时,时, 2 2 分布曲线分布曲线下右侧尾部面积为下右侧尾部面积为时时 2 2 的界值;的界值;4 4 2 值反映了理论频数和实际频数值反映了理论频数和实际频数的吻合程度;的吻合程度;2,Dec 1,2009)()()()(22dbcadcbanbcad二、四格表的专用公式二、四格表的专用公式对于四格表资料,通过推导可将式对于四格表资料,通过推导可将式
9、94转换转换成四格表的专用公式:成四格表的专用公式:组别组别阳性数阳性数阴性数阴性数合计合计I组组aba+b=n1.II组组cdc+d=n2.合计合计a+c=n.1b+d=n.2a+b+c+d=nDec 1,2009表表92 某市某市2000年城乡居民的两周患病率年城乡居民的两周患病率分组两周患病合计有无城区90(a)570(b)660(a+b)农村140(c)500(d)640(a+c)合并230(a+c)1070(b+d)1300(n)145.1510702306406601300)14057050090(22Dec 1,2009 分类资料为间断的,不连续分布。故计算的分类资料为间断的,不
10、连续分布。故计算的 2值不连续,对于四格表资料来说,当值不连续,对于四格表资料来说,当n40,且且有有1T5T5时时,求出的概率可能偏小,因此需进求出的概率可能偏小,因此需进行连续性校正:行连续性校正:22(0.5)A TT三、三、四格表资料校正四格表资料校正 1. 2值的校正值的校正x1、x2xkN( , 2 2)ikxukiikxuuu12222212Dec 1,2009TTA22)( 2、四格表、四格表 2检验的条件检验的条件(1)当)当n40,且每个格子的理论频,且每个格子的理论频数数T5 时,可用基本公式:时,可用基本公式:)()()()(22dbcadcbanbcadDec 1,2
11、009注:对于两个率的比较,注:对于两个率的比较, 2检验和检验和检验是检验是等价的,等价的, 22。(3)T1或或n40时,需用确切概率法。时,需用确切概率法。(2)当总合计数)当总合计数n40,而有,而有1T40且有一个格子的且有一个格子的1T5,需要用校正,需要用校正公式。公式。3、得出、得出P值,作出统计推断值,作出统计推断本例本例 20.05,尚不能拒绝,尚不能拒绝H0,还不能,还不能认为两种药物的疗效有差别。认为两种药物的疗效有差别。Dec 1,2009 ! ! ! !abcdacbdPa b c d四、确切概率法四、确切概率法有理论频数有理论频数T1或总例数或总例数n40,或者或
12、者 2检验所得到的检验所得到的P值接值接近检验水准近检验水准 时,则应采用直接计算概率法时,则应采用直接计算概率法(exact probability/Fishers exact method)进行检验。进行检验。 确切概率法的基本思想是:在周边合计数不变的条件下,表中的实际频数有多种组合,利用公式计算各种组合的概率,然后计算单侧或双侧概率,与检验水准做比较,作出统计推断。 n!Dec 1,2009双侧检验:双侧检验:将现有样本概率记为将现有样本概率记为Pr,则所,则所有概率小于等于有概率小于等于Pr的四格表的概率和即为的四格表的概率和即为确切概率法的结果。确切概率法的结果。单侧检验:单侧检验
13、:则将相应方向上所有概率小于则将相应方向上所有概率小于等于等于Pr的四格表的概率相加即可,如果的四格表的概率相加即可,如果 1 2 ,将,将Pr上方所上方所有概率小于等于有概率小于等于Pr的四格表的概率相加。的四格表的概率相加。 Dec 1,2009Dec 1,2009Dec 1,2009配对四格表资料示意配对四格表资料示意甲法甲法乙法乙法合计合计aba+bcdc+d合计合计a+cb+da+b+c+d 第四节第四节 配对四格表资料配对四格表资料Dec 1,2009例例97 120份痰液标本,每份分别份痰液标本,每份分别接种在甲乙两种培养基中,观察结接种在甲乙两种培养基中,观察结核杆菌的生长情况
14、,结果为甲培养核杆菌的生长情况,结果为甲培养基阳性率为基阳性率为70%,乙培养基阳性率,乙培养基阳性率为为60%,共同阳性率为,共同阳性率为45%。试比。试比较两种培养基的效果有无差别?较两种培养基的效果有无差别?Dec 1,2009表表96 甲乙两种培养基的培养结果甲乙两种培养基的培养结果 Dec 1,20091、建立检验假设、建立检验假设H0:两种方法检验的阳性率相同,即总体:两种方法检验的阳性率相同,即总体B=CH1:两种方法检验的阳性率不同,即总体:两种方法检验的阳性率不同,即总体BC =0.052、计算检验统计量、计算检验统计量在在H0成立的条件下,成立的条件下,b、c的理论频的理论
15、频数数 ,代入公式,代入公式95有有 2/ )(cbTTcb2222222cbcbccbcbbDec 1,2009)()(22cbcb)() 1(22cbcb当当b+c40时时 当当b+c40时时 本例本例b+c40,代入上式得代入上式得 2=3.00查界值表得:查界值表得: 20.05,1 =3.84, 2=3.00 0.05,不拒绝,不拒绝H0假设,尚不能认为两种方法检出假设,尚不能认为两种方法检出细菌的阳性率不同。细菌的阳性率不同。3、得出、得出P值和结论值和结论Dec 1,2009TTA22)() 1(22CRnnAn 第五节第五节 行行列表资料的列表资料的 2检验检验 (多组率或构成
16、比比较)(多组率或构成比比较)基本公式基本公式: :专用公式:专用公式:Dec 1,2009一、多组率的比较一、多组率的比较 例例98 某医生用三种方案治疗老年慢性支气管某医生用三种方案治疗老年慢性支气管炎,结果见表炎,结果见表97,问三种方案的总体疗效是,问三种方案的总体疗效是否相同?(假设三组影响慢性支气管炎的其它否相同?(假设三组影响慢性支气管炎的其它因素齐同)因素齐同)表表97 三种不同方案治疗慢性支气管炎的疗效三种不同方案治疗慢性支气管炎的疗效Dec 1,20091、建立检验假设、建立检验假设H0:三种方法的有效率相等:三种方法的有效率相等H1:三种方法的有效率不等或不全相等:三种方
17、法的有效率不等或不全相等 =0.052、计算理论值和检验统计量、计算理论值和检验统计量 94.24) 170150207087302118757(2812222=(3-1)(2-1)=2 3、确定、确定P值,作出统计推断值,作出统计推断 查查 2界值表,得界值表,得P0.05,拒绝拒绝H0,可以认为三种方法有效率不等,可以认为三种方法有效率不等或不全相等。或不全相等。Dec 1,2009二、多个构成比比较二、多个构成比比较例例99 某医院研究胃溃疡和十二指肠溃疡患者与某医院研究胃溃疡和十二指肠溃疡患者与健康输血员血型构成有无不同,资料见表健康输血员血型构成有无不同,资料见表98,问其血型分布是
18、否相同?问其血型分布是否相同? 表表98 胃、十二指肠溃疡患者与健康输血员血型构成胃、十二指肠溃疡患者与健康输血员血型构成Dec 1,20091、建立检验假设、建立检验假设H0:胃、十二指肠溃疡患者与健康输血员的血型总:胃、十二指肠溃疡患者与健康输血员的血型总体构成相同体构成相同H1:胃、十二指肠溃疡患者与健康输血员的血型总:胃、十二指肠溃疡患者与健康输血员的血型总体构成不相同体构成不相同 =0.052、计算检验统计量、计算检验统计量76. 6) 116818762120239669923947(42622223)14)(12(3、确定、确定P值,作出统计推断值,作出统计推断Dec 1,200
19、9适用条件适用条件:不能有:不能有0.05。按。按 =0.05的水准,尚不能拒绝的水准,尚不能拒绝H0,因此,因此不能认为两种方法培养结核杆菌的结果有关不能认为两种方法培养结核杆菌的结果有关Dec 1,2009eeapppK1KAPPA值计算公式 kiiiaNAp1/kiiieNnnp12/pa为观察一致率,公式:为观察一致率,公式:pe为期望一致率,公式:为期望一致率,公式:其中其中k为等级数,为等级数,Aii为表格中从左上角到右下角为表格中从左上角到右下角的对角线上的实际数,的对角线上的实际数,ni+和和n+i分别是第分别是第i行和第行和第i列的合计,列的合计,N为总合计。为总合计。Dec
20、 1,2009 k值是总体K值的点估计 0K 1 Kappa值的判定:nk0.75, 一致性好n0.4 k0.75,中度一致nK0.4, 一致性差Dec 1,20091.Kappa标准误:标准误:kiiiiieeeKnnnnNppNpS132)(1)1 (12.总体总体Kappa的可信区间:的可信区间:SuK2/3.样本样本Kappa值与总体值与总体Kappa值等于值等于0的统计学检验:的统计学检验:KSKu Dec 1,2009为了检验为了检验CT与核磁共振对胆囊癌在诊断上的一致性,某医生与核磁共振对胆囊癌在诊断上的一致性,某医生用两种方法共检测了用两种方法共检测了100例胆囊癌患者(后经病
21、理诊断证例胆囊癌患者(后经病理诊断证实),诊断结果如下,问实),诊断结果如下,问CT与核磁共振对胆囊癌诊断上的一与核磁共振对胆囊癌诊断上的一致性(相关性)如何?致性(相关性)如何?Dec 1,2009Dec 1,2009Dec 1,2009例例912 某研究者按两种血型系统统计某地某研究者按两种血型系统统计某地6094人的血型分布,结果见下表,问两种血型的分人的血型分布,结果见下表,问两种血型的分布有无关系?布有无关系?(一)双向无序列联表表表911 6094人人MN血型和血型和ABO血型的分布血型的分布Dec 1,2009例例913 某医生观察依沙酰胺治疗皮肤真菌感染某医生观察依沙酰胺治疗皮肤真菌感染的临床试验,结果见表的临床试验,结果见表912。试分析该病的。试分析该病的疗效是否与病程有关?疗效是否与病程有关? Dec 1,2009(三)双向有序且属性相同的列联表(三)双向有序且属性相同的列联表 例例914 某研究者收集了某研究者收集了147例冠心病病人,分别例冠心病病人,分别用对比法和核素法检查病人的室壁收缩运动情况,用对比法和核素法检查病人的室壁收缩运动情况,结果见下表。问两种方法的检查结果是否一致?结果见下表。问两种方法的检查结果是否一致? 60 结束语结束语
限制150内