《卡方检验...ppt》由会员分享,可在线阅读,更多相关《卡方检验...ppt(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、行列表资料的假设检验行列表资料的假设检验卡方检验卡方检验(chi square test)流行病学与卫生统计学系刘 芬阶平楼230,2014.3引言:计量资料和计数资料的统计推断引言:计量资料和计数资料的统计推断 计量资料计量资料 计数资料计数资料样本均数的标准差(标准误)样本均数的标准差(标准误)率,构成比,相对比率,构成比,相对比 样本均数、总体均数比较样本均数、总体均数比较 样本率与总体率的比较样本率与总体率的比较两个样本均数比较两个样本均数比较 两个样本率比较两个样本率比较 t 检验检验 2 检验检验 多个样本率的比较:多个样本率的比较:2检验检验样本率或构成比的比较样本率或构成比的比
2、较卡方检验卡方检验两个样本率的比较两个样本率的比较,最常用的方法是卡方检验最常用的方法是卡方检验-2 是希腊字母是希腊字母,读读kai2检验检验用于两个样本率的比较用于两个样本率的比较用于多个样本率之间比较用于多个样本率之间比较两组或多组资料内部构成之间差别的检验两组或多组资料内部构成之间差别的检验还可用于某一频数分布是否符合某一理论分布还可用于某一频数分布是否符合某一理论分布的判定的判定研究变量分别为分组变量和结果变量每个格子中的数字为两变量各分类所对应的频数调查了调查了n=200n=200个不同年龄组对手表显示的偏好程度个不同年龄组对手表显示的偏好程度数字数字显显示示钟钟面面显显示示不确不
3、确定定30岁岁或以或以下下90 40 10 30岁岁以上以上10 40 10 卡方检验卡方检验 2检验检验(Chi-square test)是现代统计学的是现代统计学的创始人之一,英国人创始人之一,英国人K.Pearson(1857-1936)于)于1900年提出的一种具有广泛用途的年提出的一种具有广泛用途的统计方法,可用于两个或多个率间的比较、统计方法,可用于两个或多个率间的比较、计数资料的关联度分析、拟合优度检验等等。计数资料的关联度分析、拟合优度检验等等。本章仅限于介绍两个和多个率或构成比比本章仅限于介绍两个和多个率或构成比比较的较的2检验及配对设计的卡方检验检验及配对设计的卡方检验。1
4、 卡方检验的概念和原理卡方检验的概念和原理例例:某医生用某医生用A、B两种药物治疗下呼吸道感染,两种药物治疗下呼吸道感染,A药药治疗治疗74例,有效例,有效68例,例,B药治疗药治疗63例,有效例,有效52例,如例,如表所示。问两种药的有效率是否有差别表所示。问两种药的有效率是否有差别?两种药物治疗下呼吸道感染有效率的比较两种药物治疗下呼吸道感染有效率的比较药物药物 有效有效 无效无效 合计合计 有效率有效率(%)A 68 6 74 91.89B 52 11 63 82.54合计合计 120 17 137 87.59在此表中在此表中 这个四格表内的数这个四格表内的数据是全表的基本数据据是全表的
5、基本数据,其它数据都可由这四其它数据都可由这四个基本数据计算出来个基本数据计算出来,这种资料就称为四这种资料就称为四格表资料(格表资料(fourfold table).卡方检验和卡方检验和t检验一样检验一样,需计算检验统计量需计算检验统计量:卡方值,它就是依据四格表计算出来的卡方值,它就是依据四格表计算出来的.6865211卡方检验的基本思想可以由卡方卡方检验的基本思想可以由卡方检验的基本公式来理解:检验的基本公式来理解:上式中上式中A为为实际频数实际频数,即上述四格表中数字;,即上述四格表中数字;T则为则为理论频数理论频数,依据理论假设计算出来。,依据理论假设计算出来。理论频数理论频数 T
6、是根据检验设是根据检验设 ,且用合并率,且用合并率 来估计而定的。来估计而定的。H0:两种药物有效率相同:两种药物有效率相同 根据这一假设,可算出两种药物合计根据这一假设,可算出两种药物合计的有效率为:的有效率为:87.59%,74例例A药药“假如假如按这一有效率按这一有效率”,则理论上有效人数应,则理论上有效人数应为为74*87.59%=64.82(人人)同理可计算出同理可计算出B药有效的人数的理论数为药有效的人数的理论数为63*87.59%=55.18(人人)同时算出无效的理论人数,则得到了公同时算出无效的理论人数,则得到了公式中的理论值式中的理论值“T”例题整理结果例题整理结果 两种药物
7、治疗下呼吸道感染有效率的比较两种药物治疗下呼吸道感染有效率的比较 药物药物 有效有效 无效无效 合计合计 有效率有效率(%)A 68(64.82)6(9.18)74 91.89 B 52(55.18)11(7.82)63 82.54 合计合计 120 17 137 87.59实际计算时常根据下式来算理论数实际计算时常根据下式来算理论数:式中式中R表示某一行表示某一行,C表示某一列表示某一列;如如T 11表示第表示第1行第行第1列理论数列理论数.同理,同理,T 12,T 21,T 22表达的含义?表达的含义?式中,式中,TRC 为第为第R 行行C 列的理论频数列的理论频数 n R 为相应的行合计
8、为相应的行合计 n C 为相应的列合计为相应的列合计计算出各格子的理论数后,把每个格子的实际数与理论数代入前面公式,即可算出卡方值.检检验验统统计计量量 值值反反映映了了实实际际频频数数与与理理论频数的吻合程度。论频数的吻合程度。若若检检验验假假设设H0:1=2成成立立,四四个个格格子子的的实实际际频频数数A 与与理理论论频频数数T 相相差差不不应应该该很很大大,即即统统计计量量 不不应应该该很很大大。如如果果 值值很很大大,即即相相对对应应的的P 值值很很小小,若若 ,则则反反过过来来推推断断A与与T相相差差太太大大,超超出出了了抽抽样样误误差差允允许许的的范范围围,从从而而怀怀疑疑H0的的
9、正正确确性性,继继而而拒绝拒绝H0,接受其对立假设,接受其对立假设H1,即,即12。由公式(由公式(9-1)还可以看出:)还可以看出:值的大小还取决于值的大小还取决于 个数的多少(严格地说是自由度个数的多少(严格地说是自由度的大小)。由于各的大小)。由于各 皆皆是是正正值值,故故自自由由度度愈愈大大,值值也也会会愈愈大大;所所以以只只有有考考虑虑了了自自由由度度的的影影响响,值值才才能能正正确确地地反反映映实实际际频频数数A和和理理论论频频数数T 的吻合程度。的吻合程度。检检验验的的自自由由度度取取决决于于可可以以自自由由取取值值的的格格子子数数目目,而而不不是是样样本本含含量量n n。四四格
10、格表表资资料料只只有有两两行行两两列列,=1=1,即即在在周周边边合合计计数数固固定定的的情情况况下下,4 4个个基基本本数数据据当当中中只只有有一一个个可可以以自自由由取值。取值。卡方分布卡方分布统计学中的几种主要分布统计学中的几种主要分布:正态分布、标准正态分布(正态分布、标准正态分布(U分布)分布)t 分布分布F分布分布2分布分布 2分布分布(chi-square distribution)Z服从标准正态分布,Z2服从自由度为1的2分布。2 2分布的形状依赖于自由度的大小,随着自由度的增加,曲线逐渐接近于对称,当自由度趋于时,2 2分布逼近正态分布。3.847.8112.59P P0.0
11、50.05的临界值的临界值2分布的概率密度曲线分布的概率密度曲线 (1)分布是一种连续型分布:按分布的密度函数可给出分布是一种连续型分布:按分布的密度函数可给出自由度自由度=1,2,3,的一簇分布曲线的一簇分布曲线(图)。(图)。(2)分布的一个基本性质是可加性:分布的一个基本性质是可加性:如果两个独立的如果两个独立的随机变量随机变量X1和和X2分别服从自由度分别服从自由度1和和2的分布,即的分布,即 ,那么它们的和(,那么它们的和(X1+X2)服从自由度()服从自由度(1+2)的)的 分布,分布,即即 。分布的特点分布的特点附表3给出了自由度取不同值时,分布单侧尾部面积的界值 ,它满足条件
12、根据定义,当自由度 时,分布的界值为标准正态分布界值的平方。2 四格表卡方检验的步骤四格表卡方检验的步骤(1)假设假设,确定检验水准确定检验水准H0:两种药物的有效率相同两种药物的有效率相同 即即1=2H1:两种药物的有效率不同两种药物的有效率不同 即即12 =0.05(2)计算统计量计算统计量(3)确定自由度和确定自由度和P值值四格表的自由度四格表的自由度=1,卡方界值为卡方界值为3.842.740.05(4)作出推断性的结论作出推断性的结论按按=0.05水准水准,接受接受H 0,尚不能认为两种药的有效率不同尚不能认为两种药的有效率不同.2 四格表专用公式四格表专用公式为计算方便,用四格表专
13、用公式计算卡方值.假设四格的数字分别为a,b,c,d,如图,则用下式来计算卡方值:此式不必计算理论数,比较方便,结果也更为准确.abcd 分分布布是是一一连连续续型型分分布布,而而四四格格表表资资料料属属离离散散型型分分布布,由由此此计计算算得得的的 统统计计量量的的抽抽样样分分布布亦亦呈呈离离散散性性质质。为为改改善善 统统计计量量分分布布的的连连续续性性,英英国国统统计学家计学家Yates F.建议进行连续性校正。建议进行连续性校正。3 3 四格表资料检验的校正公式四格表资料检验的校正公式 4 四格表专用公式适用条件关于四格表卡方检验校正与否的问题关于四格表卡方检验校正与否的问题,传统的传
14、统的习惯是习惯是:(1)当当n40,且各格子的理论数且各格子的理论数T均均5时时,可不必校可不必校正正.(2)当当n40,但最小理论数但最小理论数5 T1时时,应计算校正应计算校正的卡方值的卡方值.(3)当当n40,或或T1时需改用四格表的确切概率法时需改用四格表的确切概率法.连续性校正仅用于连续性校正仅用于 的四格表资料,当的四格表资料,当 时时,一般不作校正。,一般不作校正。练练习习1 将将116例例癫癫痫痫患患者者随随机机分分为为两两组组,一一组组70例例接接受受常常规规加加高高压压氧氧治治疗疗(高高压压氧氧组组),另另一一组组46例例接接受受常常规规治治疗疗(常常规规组组),治治疗疗结
15、结果果见见下下表表,。问两种疗法的有效率有无差别?问两种疗法的有效率有无差别?表2 两种疗法治疗癫痫的效果 本例 ,故用四格表资料 检验的校正公式 ,查 界值表得 。按 检验水准不拒绝 ,尚不能认为两组有效率不等。本资料若不校正时,本资料若不校正时,结论与之相反。结论与之相反。当n40,T1 Fisher确切概率法由R.A.Fisher提出(1934年)其理论依据是超几何分布,并非2检验的范畴 确切概率法的原理:由四格表中资料,计算各种情况的精确的概率后,与检验水准比较进行判断.实际应用中常用它作为四格表资料假设检验的补充四格表资料的Fisher确切概率法第二节第二节 两相关样本率检验两相关样
16、本率检验(McNemar检验)检验)配对四格表资料的配对四格表资料的 检验检验与计量资料推断两总体均数是否与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,有差别有成组设计和配对设计一样,计数资料推断两个总体率(构成比)计数资料推断两个总体率(构成比)是否有差别也有成组设计和配对设计,是否有差别也有成组设计和配对设计,即即四格表资料四格表资料和和配对四格表资料配对四格表资料。例9-4 用两种不同的方法对53例肺癌患者进行诊断,收集得到的结果如表9-4所示,问两种方法的检测结果有无差别?甲法乙法合计+-+25(a)2(b)27-11(c)15(d)26合计361753表表9-4 9-4
17、 两种方法诊断肺癌的检测结果两种方法诊断肺癌的检测结果 上述配对设计实验中,就每个对子而上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有言,两种处理的结果不外乎有四种可能四种可能:两种方法均两种方法均+(甲(甲乙乙)数数(a);两种方法均两种方法均-(甲(甲乙乙)数数(d);其中一种其中一种+(甲(甲乙乙)数数(b);其中一种其中一种+(甲(甲乙乙)数数(c)。其中,其中,a,d 为两法观察结果一致的两种情况,为两法观察结果一致的两种情况,b,c为两法观察结果不一致的两种情况。为两法观察结果不一致的两种情况。差异性检验差异性检验也称也称McNemar检验(检验(McNemars te
18、st)检验统计量为检验统计量为如果b+c40,则用校正的x2解:1、建立检验假设 H0:b=c,即两种方法的总体检出率相同;H1:bc,即两种方法的总体检出率不同;2、确定检验水准=0.05。3、计算统计量2 值 因为b+c=2+11=1340,所以,要使用连续性校正公式 4、确定P 值 自由度=1,=3.84 P0.05 5、判断结果,作出统计推断 按=0.05的水准拒绝H0,差异有统计学意义。可以认为两种方法的阳性检出率不同。根据表9-4,甲法阳性检出率为27/53=50.9%,乙法阳性检出率为36/53=67.9%,可认为乙法阳性检出率高于甲法。注意:注意:本本法法一一般般用用于于样样本
19、本含含量量不不太太大大的的资资料料。因因为为它它仅仅考考虑虑了了两两法法结结果果不不一一致致的的两两种种情情况况(b,c),而而未未考考虑虑样样本本含含量量n和和两两法法结结果果一一致致的的两两种种情情况况(a,d)。所所以以,当当n很很大大且且a与与d的的数数值值很很大大(即即两两法法的的一一致致率率较较高高),b与与c的的数数值值相相对对较较小小时时,即即便便是是检检验验结结果果有有统统计计学意义,其实际意义往往也不大。学意义,其实际意义往往也不大。练练习习2 2 为比较两种检验方法(中和法与血凝法)检测关节痛病人之抗“O”结果,观测105例关节痛患者,结果如下表。问其检验结果有无差别?表
20、 中和法与血凝法检验结果的比较 中和法 血 凝 法 合计 54 8 62 4 39 43 合计 58 47 105解:1、建立检验假设H0:b=c,即在对关节痛病人之抗“O”检测时血凝法与中和法检结果相同;H1:bc,即在对关节痛病人之抗“O”检测时血凝法与中和法检结果不同;2、确定检验水准=0.05。3、计算统计量2 值 因为b+c=8+4=120.05 5、判断结果,作出统计推断 按=0.05的水准不拒绝H0,差异无统计学意义。所以不能认为在对关节痛病人之抗“O”检测时血凝法与中和法检验结果不同。第三节 行列(RC)表资料的2检验RC表的2检验通用公式例 9-8 三个不同民族血型样本的频数
21、分布地区 A B O AB 合计汉族 60 70 45 100 275 回族 43 32 19 31 125满族 19 23 22 20 84合计 122 125 86 151 484 解:1、建立检验假设 H0:民族与血型无关;H1:民族与血型有关;2、确定检验水准=0.05。3、计算统计量2 值 4、确定P 值 自由度=6,P0.05 5、判断结果,作出统计推断 按=0.05的水准拒绝H0,差异有统计学意义。可以认为民族与血型有关联。RC表2检验的应用注意事项 1.对RC表,若较多格子(1/5以上)的理论频数小于5或有一个格子的理论频数小于1,则易犯第一类错误。出现某些格子中理论频数过小时
22、怎么办?(1)增大样本含量(最好!)(2)删去该格所在的行或列(丢失信息!)(3)根据专业知识将该格所在行或列与别的行或列合并。(丢失信息!甚至出假象)(4)改用Fisher确切概率法。例13:某年某地各年龄组钩虫感染情况年龄(岁)年龄(岁)感染人数感染人数 未感染人数未感染人数 合计合计0-0-6(12.8)6(12.8)94(87.2)94(87.2)1001005-5-14(16.2)14(16.2)112(109.8)112(109.8)12612610-10-28(29.2)28(29.2)199(197.8)199(197.8)22722715-15-15(7.4)15(7.4)4
23、3(50.6)43(50.6)585820-20-3(3(3.03.0)20(20.0)20(20.0)232325-25-2(2(2.82.8)20(19.2)20(19.2)222230-30-3(3(2.12.1)13(13.9)13(13.9)161635-35-4(4(3.13.1)20(20.9)20(20.9)242440-40-0(0(1.21.2)9(7.8)9(7.8)9 945-45-2(2(1.41.4)9(9.6)9(9.6)11115050及以上及以上7(7(4.94.9)31(33.1)31(33.1)3838合计合计8484570570654654221/5=4
24、.4相邻的行合并之后做2检验年龄(岁)年龄(岁)感染人数感染人数 未感染人数未感染人数 合计合计0-0-6(12.8)6(12.8)94(87.2)94(87.2)1001005-5-14(16.2)14(16.2)112(109.8)112(109.8)12612610-10-28(29.2)28(29.2)199(197.8)199(197.8)22722715-15-15(7.4)15(7.4)43(50.6)43(50.6)585820-20-5(5.8)5(5.8)40(39.2)40(39.2)454530-30-7(5.1)7(5.1)33(34.9)33(34.9)404040
25、-40-2(2.6)2(2.6)18(17.4)18(17.4)20205050及以上及以上7(4.9)7(4.9)31(33.1)31(33.1)3838合计合计8484570570654654注意事项(续)2值分割在行在行列的列的 2 2检验中,若检验中,若P P 0.0540,1T5时n40或或T1时,不能用,不能用 2检验四格表资料的Fisher确切概率法当n40,T1 Fisher确切概率法其理论依据是超几何分布,并非2检验的范畴 实际应用中常用它作为四格表资料假设检验的补充(2)配对资料的)配对资料的 2检验检验配对设计资料陈述形式配对设计资料陈述形式甲乙+-+ab-cd差异性检验差异性检验(3)行)行列表资料的列表资料的 2检验检验行行列表列表.总样本量不能太小,至少50例;理论数不能小于1;理论数在15间的不能多于1/5的总格子数。
限制150内