《医学统计学第七章卡方检验.ppt》由会员分享,可在线阅读,更多相关《医学统计学第七章卡方检验.ppt(100页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、医学统计学第七章卡方检验1现在学习的是第1页,共100页 目的目的: 推断两个总体率或构成比之间有无差别推断两个总体率或构成比之间有无差别 多个总体率或构成比之间有无差别多个总体率或构成比之间有无差别 多个样本率的多重比较多个样本率的多重比较 两个分类变量之间有无关联性两个分类变量之间有无关联性 频数分布拟合优度的检验。频数分布拟合优度的检验。 检验统计量检验统计量: 应用应用:计数资料:计数资料2现在学习的是第2页,共100页第一节第一节 四格表资料的四格表资料的 检验检验23现在学习的是第3页,共100页目的:目的:推断两个总体率(构成比)是推断两个总体率(构成比)是 否有差别否有差别 (
2、和(和u u检验等价)检验等价)要求:要求:两样本的两分类个体数排列成四两样本的两分类个体数排列成四 格表资料格表资料4现在学习的是第4页,共100页 (1)分布是一种连续型分布:按分布的密度函数可给出自由度分布是一种连续型分布:按分布的密度函数可给出自由度=1,2,3,的一簇分布曲线的一簇分布曲线 (图(图7-1)。)。 (2) 分布的一个基本性质是可加性:分布的一个基本性质是可加性: 如果两个独立的随机变如果两个独立的随机变量量X1和和X2分别服从自由度分别服从自由度1和和2的分布,即的分布,即 ,那么,那么它们的和(它们的和( X1+X2 )服从自由度()服从自由度( 1+2 )的)的
3、分布,即分布,即 。 2一、一、 检验的基本思想检验的基本思想 1 分布分布22122212,XX212()XX(3)2界界值值:当当确确定定后后,2分分布布曲曲线线下下右右侧侧尾尾部部的的面面积积为为时时,横横轴轴上上相相应应的的2值值,记记作作2, (见见附附表表 8)。2值值愈愈大大,P 值值愈愈小小;反反之之,2值值愈愈小小,P 值值愈愈大大。 12225现在学习的是第5页,共100页00.10.20.30.40.502468101214162()f216106现在学习的是第6页,共100页2 检验的基本思想检验的基本思想例例7-1 某院欲比较异梨醇口服液(试验组)和氢氯噻某院欲比较异
4、梨醇口服液(试验组)和氢氯噻嗪嗪+地塞米松(对照组)降低颅内压的疗效。将地塞米松(对照组)降低颅内压的疗效。将200例颅例颅内压增高症患者随机分为两组,结果见表内压增高症患者随机分为两组,结果见表7-1。问两组降。问两组降低颅内压的总体有效率有无差别?低颅内压的总体有效率有无差别?27现在学习的是第7页,共100页表表7-1 两组降低颅内压有效率的比较两组降低颅内压有效率的比较 8现在学习的是第8页,共100页 组 别有 效无 效合 计有效率(%) 试验组99(90.48)a5(13.52)b104(a+ b)95.20 对照组75(83.52)c21(12.48)d96(c+d)78.13
5、合 计174(a+c)26(b+d)200(n)87.00表表7-2 两组降低颅内压有效率的比较两组降低颅内压有效率的比较 9现在学习的是第9页,共100页 本例资料经整理成图本例资料经整理成图7-2形式,即有两形式,即有两个处理组,每个处理组的例数由发生数和个处理组,每个处理组的例数由发生数和未发生数两部分组成。表内有未发生数两部分组成。表内有 四个四个基本数据,其余数据均由此四个数据推算基本数据,其余数据均由此四个数据推算出来的,故称四格表资料。出来的,故称四格表资料。99 5 75 21 10现在学习的是第10页,共100页处理组处理组 发生数发生数 未发生数未发生数 合计合计 甲甲 a
6、 b a+b 乙乙 c d c+d 合合 计计 a+c b+d n 图图7-2 四格表资料的基本形式四格表资料的基本形式11现在学习的是第11页,共100页基本思想:可通过基本思想:可通过 检验的基本公式来理检验的基本公式来理解。解。22(),()(1)A TT行数-1 列数式中,式中,A为实际频数(为实际频数(actual frequency),), T为理论频数(为理论频数(theoretical frequency)。)。212现在学习的是第12页,共100页理论频数由下式求得:理论频数由下式求得:R CRCn nTn式中,式中,TRC 为第为第R 行行C 列的理论频数列的理论频数 nR
7、 为相应的行合计为相应的行合计 nC 为相应的列合计为相应的列合计13现在学习的是第13页,共100页 理论频数理论频数 是根据检验假设是根据检验假设 ,且用合,且用合 并率来估计并率来估计 而定的。而定的。 如上例,无效假设是试验组与对照组降低颅内压的总体如上例,无效假设是试验组与对照组降低颅内压的总体有效率相等,均等于合计的有效率有效率相等,均等于合计的有效率87%。那么理论上,。那么理论上,试验组的试验组的104例颅内压增高症患者中有效者应为例颅内压增高症患者中有效者应为104(174/200)=90.48,无效者为,无效者为104(26/200)=13.52;同理;同理,对照组的,对照
8、组的96例颅内压增高症患者中有效者应为例颅内压增高症患者中有效者应为96(174/200)=83.52,无效者为,无效者为96(26/200)=12.48。 T012:H14现在学习的是第14页,共100页 检验统计量检验统计量 值反映了实际频数与理值反映了实际频数与理论频数的吻合程度。论频数的吻合程度。 若检验假设若检验假设H0:1=2成立,四个格子的实际频数成立,四个格子的实际频数A 与理论频数与理论频数T 相差不应该很大,即统计量相差不应该很大,即统计量 不应该很大。不应该很大。如果如果 值很大,即相对应的值很大,即相对应的P 值很小,若值很小,若 ,则反过,则反过来推断来推断A与与T相
9、差太大,超出了抽样误差允许的范围,相差太大,超出了抽样误差允许的范围,从而怀疑从而怀疑H0的正确性,继而拒绝的正确性,继而拒绝H0,接受其对立假设,接受其对立假设H1,即,即12 。P2215现在学习的是第15页,共100页 由公式(由公式(7-1)还可以看出:)还可以看出: 值的大小还取决于值的大小还取决于 个数的多少(严格地说是自由度个数的多少(严格地说是自由度的大小)。由于各的大小)。由于各 皆是正值,故自由度皆是正值,故自由度愈大,愈大, 值也会愈大;所以只有考虑了自由值也会愈大;所以只有考虑了自由度度的影响,的影响, 值才能正确地反映实际频数值才能正确地反映实际频数A和理论频数和理论
10、频数T 的吻合程的吻合程度。度。 检验的自由度取决于可以自由取值的格检验的自由度取决于可以自由取值的格子数目,而不是样本含量子数目,而不是样本含量n n。四格表资料只。四格表资料只有两行两列,有两行两列,=1=1,即在周边合计数固定的情,即在周边合计数固定的情况下,况下,4 4个基本数据当中只有一个可以自由个基本数据当中只有一个可以自由取值。取值。 22()A TT2()A TT22216现在学习的是第16页,共100页(1) 建立检验假设,确定检验水平。建立检验假设,确定检验水平。H0:1=2 即试验组与对照组降低颅内压的即试验组与对照组降低颅内压的总体总体有效率相等有效率相等H1:12 即
11、试验组与对照组降低颅内压的即试验组与对照组降低颅内压的总体总体有效率不相等有效率不相等=0.05。3. 假设检验步骤假设检验步骤17现在学习的是第17页,共100页(2)求检验统计量值)求检验统计量值 48.90200/17410411T,52.1348.9010412T 52.8348.9017421T,48.1252.132622T。 22222(9990.48)(513.52)(7583.52)(21 12.48)90.4813.5283.5212.4812.861) 12)(12(18现在学习的是第18页,共100页以以=1 查附表查附表 8 的的2界值表得界值表得005. 0P。按。
12、按05. 0检验水准拒绝检验水准拒绝 0H,接受接受1H, 可以认为两组降低颅内压总体, 可以认为两组降低颅内压总体有效率不等,即可认为异梨醇口服液降有效率不等,即可认为异梨醇口服液降低颅内压的有效率高于氢氯噻嗪低颅内压的有效率高于氢氯噻嗪+地塞地塞米松的有效率。米松的有效率。 19现在学习的是第19页,共100页二、四格表资料检验的专用公式二、四格表资料检验的专用公式22()()()()()ad bc na b a c b d c d22(99 21 5 75) 20012.86104 96 174 26 20现在学习的是第20页,共100页 分布是一连续型分布,而四格表资分布是一连续型分布
13、,而四格表资料属离散型分布,由此计算得的统计量料属离散型分布,由此计算得的统计量 的抽样分布亦呈离散性质。为改善的抽样分布亦呈离散性质。为改善 统计统计量量 分布的连续性,则需行连续性校正。分布的连续性,则需行连续性校正。22221现在学习的是第21页,共100页三、四格表资料检验的校正公式三、四格表资料检验的校正公式 22(0.5)cA TT22()2()()()()cn|ad -bc|-n=a+b c+d a+c b+d22现在学习的是第22页,共100页四格表资料 检验公式选择条件:40,5nT2 ,专用公式; ,校正公式; ,直接计算概率。40,15nT401nT或 连续性校正仅用于连
14、续性校正仅用于 的四格表资料,当的四格表资料,当 时时,一般不作校正。,一般不作校正。 21223现在学习的是第23页,共100页例例7-2 某医师欲比较胞磷胆碱与神某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为两组,结果例脑血管疾病患者随机分为两组,结果见表见表7-3。问两种药物治疗脑血管疾病的。问两种药物治疗脑血管疾病的有效率是否相等?有效率是否相等?24现在学习的是第24页,共100页表表7-3 两种药物治疗脑血管疾病有效率的比较两种药物治疗脑血管疾病有效率的比较25现在学习的是第25页,共100页012112:,:,
15、0.05HH 本例,故用四格表资料检验的校正公式2278,4.67nT但214. 31464265278)2/78186846(22c ,查界值表得。按 检验水准不拒绝,尚不能认为两种药物治疗脑血管疾病的有效率不等。 1210. 005. 0 P05. 00H26现在学习的是第26页,共100页本资料若不校正时,本资料若不校正时, 结论与之相反。结论与之相反。24.350.05P,27现在学习的是第27页,共100页第二节第二节配对四格表资料的配对四格表资料的 检验检验228现在学习的是第28页,共100页 与计量资料推断两总体均数是否有差与计量资料推断两总体均数是否有差别有成组设计和配对设计
16、一样,计数资料别有成组设计和配对设计一样,计数资料推断两个总体率(构成比)是否有差别也推断两个总体率(构成比)是否有差别也有成组设计和配对设计,即有成组设计和配对设计,即四格表资料四格表资料和和配对四格表资料配对四格表资料。29现在学习的是第29页,共100页例例7-3 某实验室分别用乳胶凝集某实验室分别用乳胶凝集法和免疫荧光法对法和免疫荧光法对58名可疑系统红斑狼名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果疮患者血清中抗核抗体进行测定,结果见表见表7-4。问两种方法的检测结果有无差。问两种方法的检测结果有无差别?别?30现在学习的是第30页,共100页乳胶凝集法免疫荧光法合计11(a)
17、12(b)232(c)33(d)35合计134558 表表7-4 两种方法的检测结果两种方法的检测结果 31现在学习的是第31页,共100页 上述配对设计实验中,就每个对子而言,上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有两种处理的结果不外乎有四种可能四种可能:两种检测方法皆为阳性数两种检测方法皆为阳性数(a);两种检测方法皆为阴性数两种检测方法皆为阴性数(d);免疫荧光法为阳性,乳胶凝集法为免疫荧光法为阳性,乳胶凝集法为 阴性数阴性数(b);乳胶凝集法为阳性,免疫荧光法为乳胶凝集法为阳性,免疫荧光法为 阴性数阴性数(c)。32现在学习的是第32页,共100页其中,其中,a, d
18、 为两法观察结果一致的两种情况,为两法观察结果一致的两种情况, b, c为两法观察结果不一致的两种情况为两法观察结果不一致的两种情况。cbcb22)(,1 cbcbc22) 1(,1= 检验统计量为检验统计量为33现在学习的是第33页,共100页注意:注意:本法一般用于本法一般用于样本含量不太大样本含量不太大的资料。因的资料。因为它仅考虑了两法结果不一致的两种情况为它仅考虑了两法结果不一致的两种情况(b, c),而未考虑样本含量,而未考虑样本含量n和两法结果一致的两种和两法结果一致的两种情况情况(a, d)。所以,当。所以,当n很大且很大且a与与d的数值很大的数值很大(即两法的一致率较高),(
19、即两法的一致率较高),b与与c的数值相对较的数值相对较小时,即便是检验结果有统计学意义,其实际小时,即便是检验结果有统计学意义,其实际意义往往也不大。意义往往也不大。34现在学习的是第34页,共100页0H:CB ,1H:CB ,05. 04014212 cb,用校正公式 79. 5212) 1212(22c1 ,查2界值表得025. 001. 0 P。按05. 0检验水准拒绝0H,接受1H,可以认为两种方法的检测结果不同,免疫荧光法的阳性检测率较高。检验步骤:检验步骤:35现在学习的是第35页,共100页第三节第三节四格表资料的四格表资料的Fisher确切概率法确切概率法 36现在学习的是第
20、36页,共100页条件:条件:理论依据:理论依据:超几何分布超几何分布 (非(非 检验检验 的范畴的范畴)40n,或1T, 或P时,237现在学习的是第37页,共100页例例7-4 某医师为研究乙肝免疫球蛋白某医师为研究乙肝免疫球蛋白预防胎儿宫内感染预防胎儿宫内感染HBV的效果,将的效果,将33例例HBsAg阳性孕妇随机分为预防注射组和非阳性孕妇随机分为预防注射组和非预防组,结果见表预防组,结果见表7-5。问两组新生儿的。问两组新生儿的HBV总体感染率有无差别?总体感染率有无差别? 38现在学习的是第38页,共100页表7-5 两组新生儿HBV感染率的比较39现在学习的是第39页,共100页一
21、、基本思想在四格表周边合计数固定不变的条在四格表周边合计数固定不变的条件下,计算表内件下,计算表内4个实际频数变动时的各个实际频数变动时的各种组合之概率种组合之概率 ;再按检验假设用单侧;再按检验假设用单侧或双侧的累计概率或双侧的累计概率 ,依据所取的检验,依据所取的检验水准水准 做出推断。做出推断。 iPP40现在学习的是第40页,共100页 (1)(2)(3)(4)(5)0221212203194189283746556 ad-bc=-198 ad-bc=-165 ad-bc=-132 ad-bc=-99 ad-bc=-66(6)(7)(8)(9)(10)51761671581491347
22、3829110011 ad-bc=-33 ad-bc=0 ad-bc=33 ad-bc=66 ad-bc=99 1各组合概率Pi的计算在四格表周边合计数不变的条件下,表内4个实际频数a,b,c,d 变动的组合数共有“周边合计中最小数+1”个。如例7-4,表内4个实际频数变动的组合数共有9+1=10个,依次为:41现在学习的是第41页,共100页各组合的概率Pi服从超几何分布,其和为1。计算公式为() ()!()!()! ! ! ! !iabcdacbdPa b c d n!为阶乘符号 42现在学习的是第42页,共100页 2累计概率的计算累计概率的计算 ( 单、双侧单、双侧检验不同检验不同)设
23、现有样本四格表中的交叉积差*a db cD,其概率为 P*,其余组合四格表的交叉积差记为 Di,概率记为Pi。43现在学习的是第43页,共100页(1) 单侧检验 若现有样本四格表中0*D, 须计算满足*DDi和*PPi条件的各种组合下四格表的累计概率。 若0*D, 则计算满足*DDi和*PPi条件的各种组合下四格表的累计概率。44现在学习的是第44页,共100页(2) 双侧检验 计算满足|*DDi和*PPi条件的各种组合下四格表的累计概率。若遇到dcba或dbca时,四格表内各种组合的序列呈对称分布,此时按单侧检验规定条件只计算单侧累计概率,然后乘以 2即得双侧累计概率。45现在学习的是第4
24、5页,共100页二、检验步骤(二、检验步骤( )本例4033n0H:21,1H:21,05. 01计算现有样本四格表的D*和 P*及各组合下四格表的 Di, 见表 7-5。 本例*66,0.08762728DP 。 2 计算满足|*DDi条件的各组合下四格表的概率 Pi。46现在学习的是第46页,共100页3计算同时满足66|iD和*PPi条件的四格表的累计概率。本例1P、2P、3P、4P、5P和10P满足条件,累计概率为12345100.12100.05PPPPPPP按05. 0检验水准不拒绝 H0, 尚不能认为预防注射与非预防的新生儿 HBV 的感染率不等。47现在学习的是第47页,共10
25、0页表7-6 例7-4的Fisher确切概率法计算表48现在学习的是第48页,共100页例7-5某单位研究胆囊腺癌、腺瘤的P53基因表达,对同期手术切除的胆囊腺癌、腺瘤标本各10份,用免疫组化法检测P53基因,资料见表7-7。问胆囊腺癌和胆囊腺瘤的P53基因表达阳性率有无差别?49现在学习的是第49页,共100页病 种阳性阴性合计胆囊腺癌6410胆囊腺瘤1910合 计71320表表7-7 胆囊腺癌与胆囊腺瘤胆囊腺癌与胆囊腺瘤P53基因表达阳性率的比较基因表达阳性率的比较 50现在学习的是第50页,共100页0H:21,1H:21,05. 0 本例a+b+c+d=10,由表7-7可看出,四格表内
26、各种组合以i=4和i=5的组合为中心呈对称分布。表7-8 例7-5的Fisher确切概率法计算表 *为现有样本51现在学习的是第51页,共100页(1)计算现有样本的D*和P*及各组合下四格表的Di。本例D*=50,P*=0.02708978。(2)计算满足Di50条件的各组合下四格表的概率Pi。(3)计算同时满足Di50和PiP*条件的四格表的累计概率。本例为P7和P8,(4)计算双侧累计概率P。 P0.05,按=0.05检验水准不拒绝H0,尚不能认为胆囊腺癌与胆囊腺瘤的P53基因表达阳性率不等。780.027089780.001547990.0286PP782 ()0.057PPP52现在
27、学习的是第52页,共100页例 7-5 中,若专业上有理由认为胆囊腺癌不会低于胆囊腺瘤的 P53基因表达阳性率, 则进行单侧检验,0H:21,1H:21,05. 0,由表 7-7 计算单侧概率0286. 087PPP,05. 001. 0 P,单侧检验拒绝 H0,接受 H1,可以认为胆囊腺癌的 P53基因表达阳性率高于胆囊腺瘤。注意:注意:53现在学习的是第53页,共100页第四节第四节行列表资料的 检验 254现在学习的是第54页,共100页行行列表资料列表资料多个样本率比较时,有R行2列,称为R2表;两个样本的构成比比较时,有2行C列,称2C表;多个样本的构成比比较,以及双向无序分类资料关
28、联性检验时,有行列,称为RC表。55现在学习的是第55页,共100页检验统计量检验统计量22(1)(1)(1)RCAnn n行数列数56现在学习的是第56页,共100页一、多个样本率的比较一、多个样本率的比较57现在学习的是第57页,共100页 疗法有效无效合计有效率(%) 物理疗法组199720696.60 药物治疗组1641818290.11 外用膏药组1182614481.94 合计4815153290.41 例7-6 某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表7-9。问三种疗法的有效率有无差别?表7-9 三种疗法有效率的比较58现在学习的是第58
29、页,共100页0H:321,即三种疗法有效率相等1H:三种疗法有效率不全相等 05. 0 04.21) 15114426512067481206199(5322222 2) 12)(13(查2界值表得005. 0P。 按05. 0检验水准拒绝0H, 接受1H,可以认为三种疗法治疗周围性面神经麻痹的有效率有差别。检验步骤:59现在学习的是第59页,共100页二、样本构成比的比较60现在学习的是第60页,共100页例7-7某医师在研究血管紧张素I转化酶(ACE)基因I/D多态(分3型)与2型糖尿病肾病(DN)的关系时,将249例2型糖尿病患者按有无糖尿病肾病分为两组,资料见表7-10。问两组2型糖
30、尿病患者的ACE基因型总体分布有无差别?表7-9 DN组与无DN组2型糖尿病患者ACE基因型分布的比较61现在学习的是第61页,共100页检验步骤检验步骤0H:两组总体构成比相同1H:两组总体构成比不同05. 0 91. 7) 15713836120111487211142(2492222 2) 13)(12(查2界值表得025. 001. 0 P。按05. 0检验水准拒绝0H,接受1H,可认为 DN 与无 DN 的 2 型糖尿病患者的 ACE 基因型分布不同。 62现在学习的是第62页,共100页三、双向无序分类资料的关联性检验 表中两个分类变量皆为无序分类变量的行列表资料,又称为双向无序表
31、资料。CRCR63现在学习的是第63页,共100页 注意: 双向无序分类资料为两个或多个样本,做差别检验(例7-7);若为单样本,做关联性检验。64现在学习的是第64页,共100页例7-8测得某地5801人的ABO血型和MN血型结果如表7-11,问两种血型系统之间是否有关联?表7-11 某地5801人的血型MN 血型ABO血型MNMN合计O4314909021823A3884108001598B4955879502032AB13717932348合计1451166626845801(单样本,做关联性检验)65现在学习的是第65页,共100页表7-10资料,可用行列表资料检验来推断两个分类变量之
32、间有无关系(或关联);若有关系,可计算Pearson列联系数C进一步分析关系的密切程度:22Cn 列联系数C取值范围在01之间。0表示完全独立;1表示完全相关;愈接近于0,关系愈不密切;愈接近于1,关系愈密切。266现在学习的是第66页,共100页检验步骤0H:两种血型系统间无关联1H:两种血型系统间有关联05. 02222431490325801(1)1823 14511823 1666348 2684213.16(4 1)(3 1)667现在学习的是第67页,共100页查2界值表得 P0.05。按05. 0检验水准拒绝0H,接受1H,可认为两种血型系统间有关联,其 Pearson 列联系数
33、为22213.160.18835801213.16Cn由于列联系数C=0.1883,数值较小,故认为两种血型系统间虽然有关联性,但关系不太密切。68现在学习的是第68页,共100页四、行列表资料检验的注意事项269现在学习的是第69页,共100页1行列表中的各格T1,并且1T5的格子数不宜超过1/5格子总数,否则可能产生偏性。处理方法有三种:增大样本含量以达到增大理论频数的目的,属首选方法,只是有些研究无法增大样本含量,如同一批号试剂已用完等。70现在学习的是第70页,共100页根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。这样做会损失信息及损害样
34、本的随机性。注意注意:不同年龄组可以合并,但不同血型就不能合并。改用双向无序RC表的Fisher确切概率法(可用SAS软件实现)。71现在学习的是第71页,共100页2 2多个样本率比较,若所得统计推断为拒绝多个样本率比较,若所得统计推断为拒绝H H0 0,接受接受H H1 1时,只能认为各总体率之间总的来说有差别,时,只能认为各总体率之间总的来说有差别,但不能说明任两个总体率之间均有差别。要进一步推但不能说明任两个总体率之间均有差别。要进一步推断哪两两总体率之间有差别,需进一步做多个样本率断哪两两总体率之间有差别,需进一步做多个样本率的多重比较(见第五节) 。的多重比较(见第五节) 。 72
35、现在学习的是第72页,共100页73现在学习的是第73页,共100页 第五节多个样本率间的多重比较74现在学习的是第74页,共100页当多个样本率比较的当多个样本率比较的2R表资料表资料2检验,推断检验,推断结论为拒绝结论为拒绝0H,接受,接受1H时,要进一步推断哪两两总时,要进一步推断哪两两总体率有差别,若直接用四格表资料的体率有差别,若直接用四格表资料的2检验进行多重检验进行多重比较,将会加大犯类错误的概率。因此,样本率间比较,将会加大犯类错误的概率。因此,样本率间的多重比较不能直接用四格表资料的的多重比较不能直接用四格表资料的2检验。多个样检验。多个样本率间的多重比较的方本率间的多重比较
36、的方法有法有2分割法、分割法、 ScheffeScheffe 可信 可信区间法和区间法和 SNKSNK 法。本节仅介绍一种基于法。本节仅介绍一种基于2分割法的多分割法的多个样本率间多重比较的方法,后两种方法可参阅有关个样本率间多重比较的方法,后两种方法可参阅有关书籍。书籍。 75现在学习的是第75页,共100页分割法分割法 276现在学习的是第76页,共100页一、基本思想多个样本率比较的资料可整理成k2表资料,若经行列表资料2检验的结论为拒绝0H,接受1H时,可不经任何处理,直接用分割法把k2表分成多个独立的四格表进行两两比较, 但必须重新规定检验水准。 其目的是为保证检验假设中 I 型错误
37、的概率不变。因分析目的不同,k个样本率两两比较的次数不同,故重新规定的检验水准的估计方法亦不同。通常有两种情况:77现在学习的是第77页,共100页1多个实验组间的两两比较 分析目的为 k 个实验组间,任两个率均进行比较时,须进行2k次独立的四格表2检验,再加上总的行列表资料的2检验,共12 k次检验假设。故检验水准用下式估计12=k+式中2) 1()!2( ! 2!2kkkkk,k为样本率的个数。78现在学习的是第78页,共100页2实验组与同一个对照组的比较 分析目的为各实验组与同一个对照组的比较,而各实验组间不须比较。其检验水准用下式估计2(1)k式中k为样本率的个数。由该式估计的检验水
38、准较保守(通常较小) 。79现在学习的是第79页,共100页表表 7-11 1时的时的2界值表(供多个样本率间的多重比较用)界值表(供多个样本率间的多重比较用) 2 P 2 P 2 P 6.24 0.01250 7.48 0.00625 8.21 0.00417 6.96 0.00833 7.88 0.00500 8.49 0.00358 7.24 0.00714 8.05 0.00455 8.73 0.00313 80现在学习的是第80页,共100页二、多个实验组间的两两比较81现在学习的是第81页,共100页例7-9对例7-6中表7-8的资料进行两两比较,以推断是否任两种疗法治疗周围性面神
39、经麻痹的有效率均有差别?82现在学习的是第82页,共100页检验步骤0H:21,即任两对比组的总体有效率相等1H:21,即任两对比组的总体有效率不等05. 0本例为3个实验组间的两两比较0.050.05/40.01253(3 1)/2 183现在学习的是第83页,共100页表7-12 三种疗法有效率的两两比较84现在学习的是第84页,共100页按0125. 0检验水准, 物理疗法组与药物治疗组拒绝0H,接受1H;物理疗法组与外用膏药组拒绝0H,接受1H;药物治疗组与外用膏药组不拒绝0H。可认为物理疗法与药物治疗、外用膏药的有效率均有差别,还不能认为药物治疗与外用膏药的有效率有差别。 结合表 7
40、-8 资料, 可认为物理疗法组的总体有效率高于其它两组,但尚不能认为药物治疗组与外用膏药组的总体有效率不等。 85现在学习的是第85页,共100页三、各实验组与同一个对照组的比较86现在学习的是第86页,共100页例7-10以表7-8资料中的药物治疗组为对照组,物理疗法组与外用膏药组为试验组,试分析两试验组与对照组的总体有效率有无差别?0H:CT,即各试验组与对照组的总体有效率相等1H:CT,即各试验组与对照组的总体有效率不等05. 0 本例为各实验组与同一对照组的比较0125. 0) 13(205. 087现在学习的是第87页,共100页物理疗法组与药物治疗组比较:76. 62,0125.
41、0P 外用膏药组与药物治疗组比较:59. 42,0125. 0P按0125. 0检验水准, 物理疗法组与药物治疗组拒绝0H,接受1H,可认为物理疗法组与药物治疗组的总体有效率有差别;外用膏药组与药物治疗组不拒绝0H, 尚不能认为两总体有效率有差别。结合表 7-8资料,物理疗法的有效率高于药物治疗。88现在学习的是第88页,共100页第六节有序分组资料的线性趁势检验一、R*C表资料的分类及其检验方法的选择89现在学习的是第89页,共100页(1)双向无序RC表:目的为多个率或构成比的比较,可用RC列联表2检验;(2)单向有序RC表:有两种形式 A) RC表中分组变量是有序的(如年龄),而指标变量
42、是无序的(如肿瘤的类型),研究目的通常是分析不同年龄组各种疾病的构成情况,可用RC列联表2检验; B) RC表中分组变量是无序的(如治疗方法),而指标变量是有序的(如疗效),目的研究不同疗法的疗效,宜用秩和检验。90现在学习的是第90页,共100页(3)双向有序属性相同的双向有序属性相同的RC表表(22配对设计的扩大):配对设计的扩大):目的是分析两种测定结果的概率分布有无差别宜用有关目的是分析两种测定结果的概率分布有无差别宜用有关T统计量统计量。如研究目的是分析两种检测方法的一致性,宜用如研究目的是分析两种检测方法的一致性,宜用一致性检一致性检验验(Kappa检验)检验)(4)双向有序属性不
43、同的双向有序属性不同的RC表表A) 若目的为分析不同年龄组患者疗效之间有无差别时,可视为单若目的为分析不同年龄组患者疗效之间有无差别时,可视为单向有序向有序RC表资料,选用表资料,选用秩和检验秩和检验;B) 若研究目的为分析两有序分类变量间是否存在相关关系,宜用若研究目的为分析两有序分类变量间是否存在相关关系,宜用等级相关分析等级相关分析,或,或Pearson积差相关分析积差相关分析;C) 若研究目的为分析两有序分类变量间是否存在线性变化若研究目的为分析两有序分类变量间是否存在线性变化趋势,宜用有序分组资料的趋势,宜用有序分组资料的线性趋势检验线性趋势检验。91现在学习的是第91页,共100页
44、二、有序分组资料的线性趁势检验二、有序分组资料的线性趁势检验基本思想:首先计算基本思想:首先计算 R R* *C C表资料的表资料的 值,然后将总值,然后将总 值分解为线性回归与偏离线性回归分量。若两分量均有统计值分解为线性回归与偏离线性回归分量。若两分量均有统计学意义,说明两个分类变量存在相关关系,但关系不是线性学意义,说明两个分类变量存在相关关系,但关系不是线性关系;若线性回归分量有统计学意义,偏离线性回归分量无关系;若线性回归分量有统计学意义,偏离线性回归分量无统计学意义时,说明两个分类变量存在相关关系,且关系为统计学意义时,说明两个分类变量存在相关关系,且关系为线性关系。线性关系。22
45、92现在学习的是第92页,共100页计算步骤:计算步骤:1 1、首先计算总、首先计算总 值值2 2、线性回归分量、线性回归分量3 3、计算偏离线性回归分量、计算偏离线性回归分量2xxyybxxxybnllsllbsb2222,1,回归回归线性总偏离线性总偏离,-22293现在学习的是第93页,共100页例例7-11 7-11 某研究者欲研究年龄与冠状动某研究者欲研究年龄与冠状动脉硬化等级之间的关系,将脉硬化等级之间的关系,将278278例尸解例尸解资料整理成表资料整理成表7-137-13,问年龄与冠状动脉,问年龄与冠状动脉硬化等级是否存在线性变化趋势?硬化等级是否存在线性变化趋势?94现在学习
46、的是第94页,共100页年龄 冠状动脉硬化等级合计-+ + + +207022429830272493634016231375950920151458合计12289412627895现在学习的是第95页,共100页H0:年龄与冠状动脉硬化等级无线性变化趋势H1:年龄与冠状动脉硬化等级有线性变化趋势变异来源自由度P总变异71.43259 0.005线性回归分量63.18001 0.005偏离线性回归分量8.25258 0.25.5296现在学习的是第96页,共100页第七节频数分布拟合优度的检验297现在学习的是第97页,共100页医学研究实践中,常需推断某现象频数分布是否符合某一理论分布。如正
47、态性检验就是推断某资料是否符合正态分布的一种检验方法,但只适用于正态分布。Pearson值能反映实际频数和理论频数的吻合程度,故检验可用于推断频数分布的拟合优度,且应用广泛。如正态分布,二项分布,Poisson分布,负二项分布等。2298现在学习的是第98页,共100页二、二、 拟合优度检验(拟合优度检验(goodness of fit test)拟合优度检验拟合优度检验:根据样本的频数分布检验其总体:根据样本的频数分布检验其总体分布是否等于某给定的理论分布。分布是否等于某给定的理论分布。第七节第七节 2 2分布和拟合优度检验分布和拟合优度检验检验假设:检验假设:H H0 0:总体分布等于给定
48、的理论分布:总体分布等于给定的理论分布H H1 1:总体分布不等于给定的理论分布:总体分布不等于给定的理论分布计算统计量:计算统计量: 为理论频数为理论频数为实际频数,为实际频数, TATTA,22 现在学习的是第99页,共100页例例8-1 对下表所示数据作正态分布拟合优度检验对下表所示数据作正态分布拟合优度检验第七节第七节 2 2分布和拟合优度检验分布和拟合优度检验表表 7-1 1367-1 136例体模骨密度测量值频数分例体模骨密度测量值频数分布表及拟合优度检验布表及拟合优度检验组段A(X1)(X2)P(X)T=nP(X)(A-T)2/T1.228-20.000690.004660.00
49、3970.54053.941431.234-20.004660.022750.018092.46010.086051.240-70.022750.080760.058017.88890.100161.246-170.080760.211860.1311017.82940.038591.252-250.211860.420740.2088828.40830.408921.258-370.420740.655420.2346831.91670.809611.264-250.655420.841340.1859225.28550.003221.270-160.841340.945200.1038614.12440.249061.276-40.945200.986100.040905.56180.438581.282-10.986100.997440.011351.54340.19130合 计6.2669200. 201. 026. 1240. 1 Z40. 101. 026. 1246. 1 Z现在学习的是第100页,共100页
限制150内