第七章卡方检验春.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第七章卡方检验春.ppt》由会员分享,可在线阅读,更多相关《第七章卡方检验春.ppt(92页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章卡方检验春现在学习的是第1页,共92页 2 2检验检验(Chi-square test)(Chi-square test)是现代统计学的创始人是现代统计学的创始人之一,英国人之一,英国人K.K.Pearson Pearson(1857-19361857-1936)于)于19001900年年提出的一种具有广泛用途的统计方法,可用于提出的一种具有广泛用途的统计方法,可用于资料分布的资料分布的拟合优度检验拟合优度检验、两个或多个率或构成两个或多个率或构成比间的比较比间的比较等等。等等。现在学习的是第2页,共92页现在学习的是第3页,共92页现在学习的是第4页,共92页现在学习的是第5页,共92
2、页现在学习的是第6页,共92页 第一节第一节 四格表资料的四格表资料的 检验检验现在学习的是第7页,共92页目的:目的:推断两个总体率(构成比)是推断两个总体率(构成比)是 否有差别否有差别现在学习的是第8页,共92页 1 1基本思想基本思想 例例7-17-1 某某院院欲欲比比较较异异梨梨醇醇口口服服液液(试试验验组组)和和氢氢氯氯噻噻嗪嗪+地地塞塞米米松松(对对照照组组)降降低低颅颅内内压压的的疗疗效效。将将200200例例颅颅内内压压增增高高症症患患者者随随机机分分为为两两组组,结结果果见见表表7-17-1。问问两组降低颅内压的总体有效率有无差别?两组降低颅内压的总体有效率有无差别?现在学
3、习的是第9页,共92页表表7-1 7-1 两组降低颅内压有效率的比较两组降低颅内压有效率的比较 现在学习的是第10页,共92页 本例资料经整理成图本例资料经整理成图7-27-2形式,即有两个处理形式,即有两个处理组,每个处理组的例数由发生数和未发生数两部组,每个处理组的例数由发生数和未发生数两部分组成。表内有分组成。表内有 四个基本数据,其余数四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料。据均由此四个数据推算出来的,故称四格表资料。现在学习的是第11页,共92页 图图7-2 7-2 四格表资料的基本形式四格表资料的基本形式 现在学习的是第12页,共92页基本思想:可通过基本思
4、想:可通过 检验的基本公式来理解。检验的基本公式来理解。式中,式中,A为实际频数(为实际频数(actual frequencyactual frequency),),T为理论频数(为理论频数(theoretical frequencytheoretical frequency)。)。式中,式中,TRC 为第为第R 行行C 列的理论频数列的理论频数 nR 为相应的行合计为相应的行合计 nC 为相应的列合计为相应的列合计T为在无效假设前提下(两总体率相等,等于合计率)推为在无效假设前提下(两总体率相等,等于合计率)推算的预期值。算的预期值。现在学习的是第13页,共92页 如上例,无效假设是试验组与
5、对照组降低颅内压的总体如上例,无效假设是试验组与对照组降低颅内压的总体有效率相等,有效率相等,均等于合计的有效率均等于合计的有效率87%87%。那么在这个前那么在这个前提下,理论上,提下,理论上,试验组的试验组的104104例颅内压增高症患者中有效例颅内压增高症患者中有效者应为者应为104(174/200)=90.48104(174/200)=90.48,无效者为,无效者为104(26/200)=13.52104(26/200)=13.52;同理,;同理,对照组的对照组的9696例颅内压增高例颅内压增高症患者中有效者应为症患者中有效者应为96(174/200)=83.5296(174/200)
6、=83.52,无效者为,无效者为96(26/200)=12.4896(26/200)=12.48。现在学习的是第14页,共92页 检检验验统统计计量量 值值反反映映了了实实际际频频数数与与理理论论频频数数的的吻吻合合程度。程度。若若检检验验假假设设H H0 0:1 1=2 2成成立立,四四个个格格子子的的实实际际频频数数A A 与与理理论论频频数数T T 相相差差不不应应该该很很大大,即即统统计计量量不不应应该该很很大大。如如果果 值值很很大大,即即相相对对应应的的P P 值值很很小小,若若 ,则则反反过过来来推推断断A A与与T T相相差差太太大大,超超出出了了抽抽样样误误差差允允许许的的范
7、范围围,从从而而怀怀疑疑H H0 0的的正正确确性性,继继而而拒拒绝绝H H0 0,接受其对立假设,接受其对立假设H H1 1,即,即1 12 2。现在学习的是第15页,共92页 由公式(由公式(7-17-1)还可以看出:)还可以看出:值的大小还取决于值的大小还取决于 个数的多少(严格地说是自由度个数的多少(严格地说是自由度的大小)。由于各的大小)。由于各 皆皆是是正正值值,故故自自由由度度愈愈大大,值值也也会会愈愈大大;所所以以只只有有考考虑虑了了自自由由度度的的影影响响,值值才才能能正正确确地地反反映映实实际际频频数数A A和和理理论论频频数数T T 的的吻合程度。吻合程度。检检验验的的自
8、自由由度度取取决决于于可可以以自自由由取取值值的的格格子子数数目目,而而不不是是样样本本含含量量n n。四四格格表表资资料料只只有有两两行行两两列列,v=1v=1,即即在在周周边边合合计计数数固定的情况下,固定的情况下,4 4个基本数据当中只有一个可以自由取值。个基本数据当中只有一个可以自由取值。现在学习的是第16页,共92页 (1 1)分布是一种连续型分布:按分布的密度函数可给出自由度分布是一种连续型分布:按分布的密度函数可给出自由度=1=1,2 2,3 3,的一簇分布曲线的一簇分布曲线 (图(图7-17-1)。)。(2 2)分布的一个基本性质是可加性:分布的一个基本性质是可加性:如果两个独
9、立的随机变如果两个独立的随机变量量X X1 1和和X X2 2分别服从自由度分别服从自由度1 1和和2 2的分布,即的分布,即 ,那么它们的和(,那么它们的和(X X1 1+X X2 2 )服从自由度()服从自由度(1 1+2 2 )的)的 分布,分布,即即 。2 2 分布分布现在学习的是第17页,共92页(3)界值:当界值:当v v确定后,确定后,分布曲线下右分布曲线下右侧尾部的面积为侧尾部的面积为a a时,横轴上相应的时,横轴上相应的 值,值,记作记作 (见附表见附表8)8)。值愈大,值愈大,p p值愈小;值愈小;反之,反之,值愈小,值愈小,p p值愈大。值愈大。现在学习的是第18页,共9
10、2页现在学习的是第19页,共92页(1 1)建立检验假设,确定检验水平。建立检验假设,确定检验水平。H H0 0:1 1=2 2 即试验组与对照组降低颅内压的即试验组与对照组降低颅内压的总体总体有效率有效率 相等相等H H1 1:1 12 2 即试验组与对照组降低颅内压的即试验组与对照组降低颅内压的总体总体有效率有效率 不相等不相等=0.05=0.053.3.假设检验步骤假设检验步骤现在学习的是第20页,共92页(2)求检验统计量值现在学习的是第21页,共92页以以v=1v=1查附表查附表8 8的的 界值表得界值表得P0.005P0.005。按。按a a=0.05=0.05检验水准拒检验水准拒
11、绝绝H H0 0,接受,接受H H1 1,可以认为两组降低颅内压总体有效率不等,可以认为两组降低颅内压总体有效率不等,即可认为异梨醇口服液降低颅内压的有效率高于氢氯噻嗪即可认为异梨醇口服液降低颅内压的有效率高于氢氯噻嗪+地塞米松的有效率。地塞米松的有效率。现在学习的是第22页,共92页二、四格表资料检验的专用公式二、四格表资料检验的专用公式现在学习的是第23页,共92页 分分布布是是一一连连续续型型分分布布,而而四四格格表表资资料料属属离离散散型型分分布布,由由此此计计算算得得的的统统计计量量 的的抽抽样样分分布布亦亦呈呈离离散散性性质质。为为改改善善 统统计计量量 分分布布的的连连续续性性,
12、则需行连续性校正。则需行连续性校正。现在学习的是第24页,共92页三、四格表资料检验的校正公式三、四格表资料检验的校正公式 现在学习的是第25页,共92页四格表资料 检验公式选择条件:,专用公式;,校正公式;,直接计算概率。现在学习的是第26页,共92页 例例7-27-2 某某医医师师欲欲比比较较胞胞磷磷胆胆碱碱与与神神经经节节苷苷酯酯治治疗疗脑脑血血管管疾疾病病的的疗疗效效,将将7878例例脑脑血血管管疾疾病病患患者者随随机机分分为为两两组组,结结果果见见表表7-27-2。问问两两种种药药物物治治疗疗脑脑血血管管疾疾病病的有效率是否相等?的有效率是否相等?现在学习的是第27页,共92页表表7
13、-2 7-2 两种药物治疗脑血管疾病有效率的比较两种药物治疗脑血管疾病有效率的比较现在学习的是第28页,共92页本例 ,故用四格表资料 检验的校正公式 v=1,查 界值表得0.05P0.10。按a=0.05检验水准不拒绝 H0,尚不能认为两种药物治疗脑血管疾病的有效率不等。现在学习的是第29页,共92页 本资料若不校正时,本资料若不校正时,结论与之相反。结论与之相反。现在学习的是第30页,共92页第二节第二节配对四格表资料的配对四格表资料的 检验检验现在学习的是第31页,共92页 与计量资料推断两总体均数是否有差与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,计数资别有成组设计和配
14、对设计一样,计数资料推断两个总体率(构成比)是否有差料推断两个总体率(构成比)是否有差别也有成组设计和配对设计,即别也有成组设计和配对设计,即四格表四格表资料资料和和配对四格表资料配对四格表资料。现在学习的是第32页,共92页 例例7-37-3 某某实实验验室室分分别别用用乳乳胶胶凝凝集集法法和和免免疫疫荧荧光光法法对对5858名名可可疑疑系系统统红红斑斑狼狼疮疮患患者者血血清清中中抗抗核核抗抗体体进进行行测测定定,结结果果见见表表7-37-3。问两种方法的检测结果有无差别?。问两种方法的检测结果有无差别?现在学习的是第33页,共92页 表表7-3 7-3 两种方法的检测结果两种方法的检测结果
15、 现在学习的是第34页,共92页上述配对设计实验中,就每个对子而言,两种处上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有理的结果不外乎有四种可能四种可能:两种检测方法皆为阳性数两种检测方法皆为阳性数(a a);两种检测方法皆为阴性数两种检测方法皆为阴性数(d d);免疫荧光法为阳性,乳胶凝集法为免疫荧光法为阳性,乳胶凝集法为 阴性数阴性数(b b);乳胶凝集法为阳性,免疫荧光法为乳胶凝集法为阳性,免疫荧光法为 阴性数阴性数(c c)。现在学习的是第35页,共92页其中,其中,a a,d d 为两法观察结果一致的两种情况,为两法观察结果一致的两种情况,b b,c c为两法观察结果不一
16、致的两种情况。为两法观察结果不一致的两种情况。检验统计量为检验统计量为 b+c40现在学习的是第36页,共92页注意:注意:本本法法一一般般用用于于样样本本含含量量不不太太大大的的资资料料。因因为为它它仅仅考考虑虑了了两两法法结结果果不不一一致致的的两两种种情情况况(b b,c c),而而未未考考虑虑样样本本含含量量n n和和两两法法结结果果一一致致的的两两种种情情况况(a a,d d)。所所以以,当当n n很很大大且且a a与与d d的的数数值值很很大大(即即两两法法的的一一致致率率较较高高),b b与与c c的的数数值值相相对对较较小小时时,即即便便是检验结果有统计学意义,其实际意义往往也
17、不大。是检验结果有统计学意义,其实际意义往往也不大。现在学习的是第37页,共92页检验步骤:检验步骤:,用校正公式 v1,查 界值表得0.01P0.025。按a=0.05检验水准拒绝H0,接受H1,可以认为两种方法的检测结果不同,免疫荧光法的阳性检测率较高。现在学习的是第38页,共92页第三节第三节四格表资料的四格表资料的FisherFisher确切概率法确切概率法 现在学习的是第39页,共92页条件:条件:n40n40,或,或T1T1,或或PPa a时,时,理论依据:超几何分布理论依据:超几何分布 (非(非 检验检验 的范畴的范畴)现在学习的是第40页,共92页 例例7-47-4 某医师为研
18、究乙肝免疫球蛋白预某医师为研究乙肝免疫球蛋白预防胎儿宫内感染防胎儿宫内感染HBVHBV的效果,将的效果,将3333例例HBsAgHBsAg阳性孕妇随机分为预防注射组和阳性孕妇随机分为预防注射组和非预防组,结果见表非预防组,结果见表7-47-4。问两组新生。问两组新生儿的儿的HBVHBV总体感染率有无差别?总体感染率有无差别?现在学习的是第41页,共92页表7-4 两组新生儿HBV感染率的比较 现在学习的是第42页,共92页一、基本思想 在四格表周边合计数固定不变的条件下,计算表在四格表周边合计数固定不变的条件下,计算表内内4 4个实际频数变动时的各种组合之概率个实际频数变动时的各种组合之概率
19、;再按;再按检验假设用单侧或双侧的累计概率检验假设用单侧或双侧的累计概率 ,依据所取的,依据所取的检验水准检验水准 a a 做出推断。做出推断。现在学习的是第43页,共92页 1 1各各组组合合概概率率P Pi i的的计计算算 在在四四格格表表周周边边合合计计数数不不变变的的条条件件下下,表表内内4 4个个实实际际频频数数 a a,b b,c c,d d 变变动动的的组组合合数数共共有有“周周边边合合计计中中最最小小数数+1+1”个个。如如例例7-47-4,表表内内4 4个个实实际际频频数数变变动动的的组组合合数数共共有有9+1=109+1=10个个,依次为:依次为:现在学习的是第44页,共9
20、2页各组合的概率各组合的概率P Pi i服从超几何分布,其和为服从超几何分布,其和为1 1。计算公式为现在学习的是第45页,共92页 2 2累计概率的计算累计概率的计算 (单、双侧单、双侧检验不同检验不同)设现有样本四格表中的其概率为设现有样本四格表中的其概率为P P*,其余组合四格表的概率记为,其余组合四格表的概率记为P Pi i。现在学习的是第46页,共92页(1 1)单侧检验)单侧检验 现有四格表及其以左的所有四格表组合的累现有四格表及其以左的所有四格表组合的累计概率为左侧概率,记为计概率为左侧概率,记为P PL L;现有四格表及其以右的所有四格表组合的现有四格表及其以右的所有四格表组合
21、的累计概率为右侧概率,记为累计概率为右侧概率,记为P PR R;若备选假设若备选假设H1 H1 为为 单侧为单侧为P PR R;若备选假设若备选假设H1 H1 为为 单侧为单侧为P PL L;现在学习的是第47页,共92页(2 2)双侧检验)双侧检验 计算满足计算满足PiP*PiP*条件的各种条件的各种组合下四格表的累计概率。组合下四格表的累计概率。现在学习的是第48页,共92页二、二、检验步骤(本例检验步骤(本例n n3340330.050.12100.05按按a a=0.05=0.05检验水准不拒绝检验水准不拒绝H H0 0,尚不能认为预防注,尚不能认为预防注射与非预防的新生儿射与非预防的
22、新生儿HBVHBV的感染率不等。的感染率不等。现在学习的是第50页,共92页表7-5 例7-4的 Fisher确切概率法计算表 现在学习的是第51页,共92页 例例7-57-5 某某单单位位研研究究胆胆囊囊腺腺癌癌、腺腺瘤瘤的的P P5353基基因因表表达达,对对同同期期手手术术切切除除的的胆胆囊囊腺腺癌癌、腺腺瘤瘤标标本本各各1010份份,用用免免疫疫组组化化法法检检测测P P5353基基因因,资资料料见见表表7-67-6。问问胆胆囊囊腺腺癌癌和和胆胆囊囊腺腺瘤瘤的的P P5353基基因因表表达达阳阳性性率率有有无无差别?差别?现在学习的是第52页,共92页表表7-6 7-6 胆囊腺癌与胆囊
23、腺瘤胆囊腺癌与胆囊腺瘤P53P53基因表达阳性率的比较基因表达阳性率的比较 现在学习的是第53页,共92页本例 a+b+c+d=10,由表7-7可看出,四格表内各种组合以i=4和i=5的组合为中心呈对称分布。表表7-7 7-7 例例7-57-5的的FisherFisher确切概率法计算表确切概率法计算表*为现有样本现在学习的是第54页,共92页(1 1)计算现有样本的)计算现有样本的P P*。P P*=0.02708978*=0.02708978。(2 2)计算满足各组合下四格表的概率)计算满足各组合下四格表的概率P Pi i。(3 3)计算满足)计算满足P Pi iP P*条件的四格表的累条
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 章卡方 检验
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内