医学统计学列联表资料分析.ppt
关于医学统计学列联表资料分析1现在学习的是第1页,共58页2第七章第七章 列联表资料分析列联表资料分析列联表:由两个或两个列联表:由两个或两个以上的变量进行交叉分以上的变量进行交叉分类的频数分布表。类的频数分布表。现在学习的是第2页,共58页3列联表(列联表(行行列表)资料模式列表)资料模式横向变量横向变量R类类, 纵向变量纵向变量C类类, 简称简称R C表表现在学习的是第3页,共58页4教学目的与要求教学目的与要求 l掌握:掌握:2检验的基本思想和用途检验的基本思想和用途四格表独立性检验四格表独立性检验配对四格表独立性检验配对四格表独立性检验l了解:了解:Fisher精确概率法的计算精确概率法的计算单变量拟合度检验单变量拟合度检验频数分布的拟合度检验频数分布的拟合度检验 现在学习的是第4页,共58页5教学内容提要教学内容提要 l重点讲解:重点讲解:2检验的基本思想检验的基本思想四格表独立性检验四格表独立性检验配对四格表独立性检验配对四格表独立性检验l介绍:介绍:Fisher精确概率法的计算精确概率法的计算拟合度检验拟合度检验 现在学习的是第5页,共58页6第一节第一节 列联表列联表 2检验检验l 2检验及原理检验及原理l四格表资料的四格表资料的 2检验检验l双向无序行双向无序行 列表的列表的 2检验检验l配对计数资料的配对计数资料的 2检验检验l四格表确切概率法四格表确切概率法现在学习的是第6页,共58页7n双向无序双向无序列联表资料列联表资料n单向有序单向有序列联表资料列联表资料n双向有序且属性相同双向有序且属性相同列联表资料列联表资料n双向有序且属性不同双向有序且属性不同列联表资料列联表资料一、列联表一、列联表(行(行列表)列表)资料类型资料类型现在学习的是第7页,共58页8n三组消化性溃疡住院病人四种证型的构成三组消化性溃疡住院病人四种证型的构成 1. 双向无序列联表资料双向无序列联表资料现在学习的是第8页,共58页92. 单向有序列联表资料单向有序列联表资料现在学习的是第9页,共58页103. 双向有序且属性不同列联表资料双向有序且属性不同列联表资料现在学习的是第10页,共58页114. 双向有序且属性相同列联表资料双向有序且属性相同列联表资料现在学习的是第11页,共58页12四四 格格 表表 资资 料料现在学习的是第12页,共58页13二、二、四格表资料的四格表资料的 2 检验检验 2检验是一种检验检验是一种检验实际频数实际频数(Actual frequecy)与)与理论频数理论频数(Theoretical frequecy )之间)之间偏离度偏离度的方法。的方法。 偏离度用偏离度用 2值(统计量)表示。值(统计量)表示。 2 = (A-T)2/T1. 2 检验的基本思想检验的基本思想现在学习的是第13页,共58页142. 四格表资料的四格表资料的 2 2检验检验 比较两个样本率、两种治疗方法之间的差异有无显著性。这类资比较两个样本率、两种治疗方法之间的差异有无显著性。这类资料由料由4 4个基本数据构成个基本数据构成:两种治疗方法的有效例数和无效例数,:两种治疗方法的有效例数和无效例数,统计学称这类资料为统计学称这类资料为四格表资料四格表资料。现在学习的是第14页,共58页152. 四格表资料的四格表资料的 2检验检验 四格表资料的模式四格表资料的模式 组组 别别阳阳 性性阴阴 性性合计合计甲甲aba+b乙乙cdc+d合计合计a+cb+dnA11 (T11)现在学习的是第15页,共58页16【例例7-2】为了解铅中毒病人是否有尿棕色素增加为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下,问铅中毒病人和对照人群的尿性检查,结果如下,问铅中毒病人和对照人群的尿棕色素阳性率有无差别?棕色素阳性率有无差别?两组人群尿棕色素阳性率比较两组人群尿棕色素阳性率比较现在学习的是第16页,共58页 建立检验假设和确定检验水准建立检验假设和确定检验水准 H H0 0:总体阳性率:总体阳性率1 1=2 2 H H1 1:1 12 2 =0.05 =0.05 计算检验统计量计算检验统计量iiiTTA22其中为其中为Ai实际频数实际频数,Ti为理论频数为理论频数, nR是行合计是行合计,nC是列合计,是列合计,n是四格之和。是四格之和。【例例7-2】假设检验步骤:假设检验步骤:现在学习的是第17页,共58页T11T12 理论频数理论频数是在是在H0成立的条件下每个格子理论成立的条件下每个格子理论上的数据上的数据。 (1=2= 两样本合计率)两样本合计率) 若若H0成立,则合计的阳性率为成立,则合计的阳性率为 38/73=52.05% 则铅中毒病人呈阳性的理论上应有则铅中毒病人呈阳性的理论上应有 T11=3638/73=18.74人人现在学习的是第18页,共58页 2值的大小决定于:值的大小决定于: (1)A-T的差值;的差值; (2)格子数(严格地说是)格子数(严格地说是df)的多少。)的多少。iiiTTA22 T12=17.26 T21=19.26 T22=17.74 =23.12 确定确定p值值 =(R-1)(C-1)=1 , 查查 2界值表(附表界值表(附表6)得得 P40,T值值 2=4.125 确定确定P值值 作推论作推论1486100309012044176220现在学习的是第23页,共58页【例例7-47-4】 某矿石粉厂当生产一种矿石粉石时,在数天内某矿石粉厂当生产一种矿石粉石时,在数天内即有部分工人患职业性皮肤炎,在生产季节开始,随机抽取即有部分工人患职业性皮肤炎,在生产季节开始,随机抽取1515名车间工人穿上新防护服,其余仍穿原用的防护服,生产名车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,检查两组工人的皮肤炎患病率,结果如下:进行一个月后,检查两组工人的皮肤炎患病率,结果如下:穿新旧两种防护服工人的皮肤炎患病率比较穿新旧两种防护服工人的皮肤炎患病率比较现在学习的是第24页,共58页问两组工人的皮肤炎患病率有无差别?问两组工人的皮肤炎患病率有无差别?dbcadcbannbcad2/22 H0:1=2;H1:12。=0.05 计算计算 最小的理论频数最小的理论频数T11=1511/43=3.84, 1T1140,所以宜用,所以宜用 2值的校正公式值的校正公式 =2.94 查查 2界值表,得界值表,得0.05p 0.10 按按=0.05水平不拒绝水平不拒绝H0,尚不能认为穿不同防护服,尚不能认为穿不同防护服的皮肤炎患病率有差别。的皮肤炎患病率有差别。 若不校正,若不校正, 2=4.33 p0.05现在学习的是第25页,共58页 【例例7-5 5】 研究复方哌唑嗪对高血压病治疗研究复方哌唑嗪对高血压病治疗效果的临床试验并与复方降压片和安慰剂作对效果的临床试验并与复方降压片和安慰剂作对照,结果如下表,问三种药物效果有无差别?照,结果如下表,问三种药物效果有无差别?组别组别 有效有效 无效无效 合计合计 有效率有效率% 复方哌唑嗪复方哌唑嗪30104075.00复方降压片复方降压片20103066.67安慰剂安慰剂7253221.88合计合计574510255.88三种药物治疗高血压病的有效率比较三种药物治疗高血压病的有效率比较现在学习的是第26页,共58页27 【例例7-67-6】某省为了解花生黄曲霉素污染,随机某省为了解花生黄曲霉素污染,随机观察了三个地区的花生受黄曲霉素观察了三个地区的花生受黄曲霉素B B1 1污染的情况,污染的情况,结果见下表。请问这三个地区花生的黄曲霉素结果见下表。请问这三个地区花生的黄曲霉素B B1 1污染率是否不同?污染率是否不同?某省三个地区花生的黄曲霉素某省三个地区花生的黄曲霉素B B1 1污染率污染率调查地区调查地区受检样品受检样品合计合计污染率()污染率()未污染未污染污染污染甲甲 6232979.3乙乙30144431.8丙丙 8 31127.3合计合计44408447.6现在学习的是第27页,共58页28三、双向无序列联表的三、双向无序列联表的 2 2检验检验 1. 列联表的列联表的 2值计算值计算 2 = = =(R-1)(C-1) TTA212nnACRn现在学习的是第28页,共58页29【例例7-57-5】三种药物治疗高血压病有效率比较三种药物治疗高血压病有效率比较 2. 多个率的比较多个率的比较组别组别 有效有效 无效无效 合计合计 有效率有效率% 复方哌唑嗪复方哌唑嗪30104075.00复方降压片复方降压片20103066.67安慰剂安慰剂7253221.88合计合计574510255.88现在学习的是第29页,共58页H0:三种药物的总体有效率相等,即:三种药物的总体有效率相等,即1=2=3 H1:1、2、3不相等或不全相等不相等或不全相等 =0.05 2=(2-1)(3-1)=2 查查 2界值表得界值表得 p0.005 按按=0.05水平拒绝水平拒绝H0,认为三种药物的治疗效,认为三种药物的治疗效果不相同或不全相同。果不相同或不全相同。 现在学习的是第30页,共58页31【例例7-7】 1979年某地爆发松毛虫病,年某地爆发松毛虫病,333例患者按年例患者按年龄以龄以14岁为界分成岁为界分成2组,资料如表,试考察两组病人病变组,资料如表,试考察两组病人病变类型的构成比有无差别?类型的构成比有无差别? 某地两组松毛虫病患者型别构成比较某地两组松毛虫病患者型别构成比较 3. 构成比的比较构成比的比较现在学习的是第31页,共58页32a. H0:两组患者中患各型松毛虫病的构成比相同:两组患者中患各型松毛虫病的构成比相同 H1:两组患者中患各型松毛虫病的构成比不同:两组患者中患各型松毛虫病的构成比不同 =0.05b. 2=70.14c. 查表得查表得p0.005d.按按=0.05水平水平拒绝拒绝H0,认为两组患者中患各型松毛虫病的构成比不同。,认为两组患者中患各型松毛虫病的构成比不同。3. 构成比的比较构成比的比较现在学习的是第32页,共58页行行列表的列表的 2检验要求理论频数检验要求理论频数T不宜太小,要求不宜有不宜太小,要求不宜有1/5以上的以上的格子的格子的T5,或有一个,或有一个T1。如果以上条件不能满足,可采用:如果以上条件不能满足,可采用: 增加样本含量增加样本含量 删去某行或某列删去某行或某列 合理地合并部分行或列合理地合并部分行或列 用用精确概率法精确概率法多个率或构成比比较的多个率或构成比比较的 2检验,结论为拒绝检验,结论为拒绝H0时,仅表示几组有差时,仅表示几组有差别,并非任别,并非任2组之间都有差别。若要了解之,可进行多个率之间的两组之间都有差别。若要了解之,可进行多个率之间的两两比较两比较(如如 2表的分割法表的分割法)。4. 行行列表的列表的 2检验检验注意事项注意事项 现在学习的是第33页,共58页345. 多个率多个率(构成比构成比)两两比较两两比较行行列表的分割(略)列表的分割(略) 【例例7-57-5】 三种药物治疗高血压病的有效率比较三种药物治疗高血压病的有效率比较 2=组别组别 有效有效 无效无效 合计合计 有效率有效率% 复方哌唑嗪复方哌唑嗪30104075.00复方降压片复方降压片20103066.67安慰剂安慰剂7253221.88合计合计574510255.88现在学习的是第34页,共58页35分割表分割表1 分割表分割表2 组别组别有效有效无效无效合计合计组别组别有效有效无效无效合计合计哌唑嗪哌唑嗪301040用药组用药组502070降压片降压片201030安慰剂安慰剂72532合计合计502070合计合计574510221=0.583 22=21.873【例例7-8】(续)(续) 哌唑嗪组与降压片组的有效率接近,将哌唑嗪组与降压片组的有效率接近,将此此2组合并,再与另一个样本比较,得到组合并,再与另一个样本比较,得到2个分割表:个分割表: 20.05,1=3.84现在学习的是第35页,共58页36 可以得出可以得出 21+ 22=22.456约等于原约等于原来的来的 2=22.36,两者不相等是由,两者不相等是由于分割表中理论频数的数值与总于分割表中理论频数的数值与总表中理论频数不同所致。表中理论频数不同所致。 结论:哌唑嗪与降压片总体结论:哌唑嗪与降压片总体有效率相同有效率相同,但与安慰剂的有效率但与安慰剂的有效率不相同。不相同。现在学习的是第36页,共58页37例题:例题: 考察一种新型透析疗法的效果考察一种新型透析疗法的效果病人序号病人序号透析前透析前透析后透析后 131.618.2 220.7 7.3 336.426.5 433.123.7 529.522.6 620.710.7 750.325.1 831.220.9 936.623.71028.116.5四、四、22列联表资料的列联表资料的 2检验检验 现在学习的是第37页,共58页38【例例7-8】用两种检验方法对某食品作沙门氏菌检验,结果如下,用两种检验方法对某食品作沙门氏菌检验,结果如下,试比较两种方法的阳性结果是否有差别?试比较两种方法的阳性结果是否有差别? 配对设计两种方法结果比较配对设计两种方法结果比较荧光抗体法荧光抗体法(甲法)(甲法)常规培养法(乙法)常规培养法(乙法)合计合计+-+160(a)26(b)186-5(c)48(d)53合计合计16574239现在学习的是第38页,共58页39配对设计的配对设计的计量资料计量资料(观察值)比较,比(观察值)比较,比较两总体均数的差异,用配对较两总体均数的差异,用配对 t检验检验配对设计的配对设计的计数资料计数资料,我们用,我们用22列联表列联表资料的资料的 2检验检验 现在学习的是第39页,共58页401. 22列联表资料的列联表资料的 2检验检验 配对四格表资料分析配对四格表资料分析(略略)()()独立性检验独立性检验(是否有关联)用四格(是否有关联)用四格表表 2检验法检验法 ()()优势性检验优势性检验(是否相同)用(是否相同)用McNemar检验法检验法 ()()一致性检验一致性检验用用Kappa检验法检验法现在学习的是第40页,共58页41【例例7-8】用两种检验方法对某食品作沙门氏菌检验,结果如下,用两种检验方法对某食品作沙门氏菌检验,结果如下,试比较两种方法的阳性结果是否有差别?试比较两种方法的阳性结果是否有差别? 配对设计两种方法结果比较配对设计两种方法结果比较荧光抗体法荧光抗体法(甲法)(甲法)常规培养法(乙法)常规培养法(乙法)合计合计+-+160(a)26(b)186-5(c)48(d)53合计合计16574239着眼于两法着眼于两法结果不一致的部分结果不一致的部分。现在学习的是第41页,共58页42两法两法结果不一致的部分结果不一致的部分: H0:总体:总体B=C; H:总体:总体BC检验统计量检验统计量当当b+c40时时 2=当当b+c40时时 2= =1 样本例数较少时还可以用精确概率法样本例数较少时还可以用精确概率法, 原理同原理同配对设计的符号检验。配对设计的符号检验。cbcb2cbcb1|2现在学习的是第42页,共58页43H0:甲法阳性乙法阴性例数与甲法阴性乙法阳性例数:甲法阳性乙法阴性例数与甲法阴性乙法阳性例数相同,即总体相同,即总体B=C;H1:总体:总体BC =0.05 2= =12.90查查 2界值表界值表 p0.005,拒绝,拒绝H0,认为两法检验结果不,认为两法检验结果不一样,荧光抗体法阳性结果高于常规培养法。一样,荧光抗体法阳性结果高于常规培养法。 荧光抗荧光抗体法体法常规培养法常规培养法合计合计+-+160(a)26(b)186-5(c)48(d)53合计合计16574239cbcb1|2现在学习的是第43页,共58页44配对(列联表)资料的配对(列联表)资料的 2检验检验 【例例7-9】 有有93份咽喉涂抹标本,每份标本分份咽喉涂抹标本,每份标本分别接种在甲乙两种白喉杆菌培养基上,观察其生别接种在甲乙两种白喉杆菌培养基上,观察其生长情况,结果如下表,试分析两种培养基的效果长情况,结果如下表,试分析两种培养基的效果是否不同?是否不同?表表5 甲乙两种培养基的生长情况甲乙两种培养基的生长情况乙培养法乙培养法甲培养法甲培养法合计合计阳性阳性阴性阴性阳性阳性3737 10104747阴性阴性1919 27274646合计合计565637379393现在学习的是第44页,共58页451. 建立假设建立假设 H0 : B=C ;H1 : BC 确定显著性水平确定显著性水平 =0.052. 计算统计量计算统计量: b+c=10+19=29 40, 校正公式:校正公式: 2 =(|b-c|- 1)2/ (b+c)=2.207 =(2-1)(2-1)=13. 确定确定P值值4. 作推断作推断现在学习的是第45页,共58页46五、四格表的确切概率法五、四格表的确切概率法【例例7-10】 在某牧区观察慢性布鲁氏病患者在某牧区观察慢性布鲁氏病患者植物血凝素皮肤试验反应,资料如下,问植物血凝素皮肤试验反应,资料如下,问活动型与稳定型布氏患者反应阳性率有无活动型与稳定型布氏患者反应阳性率有无差别?差别?现在学习的是第46页,共58页47五、四格表的确切概率法五、四格表的确切概率法n适用条件适用条件 n四格表资料四格表资料 n40 时;时;n四格表中有四格表中有A= 0时;时; n四格表中有四格表中有T1时;时;n用其它检验方法所得概率接近检验水准时。用其它检验方法所得概率接近检验水准时。现在学习的是第47页,共58页48五、四格表的确切概率法五、四格表的确切概率法【例例7-10】 在某牧区观察慢性布鲁氏病在某牧区观察慢性布鲁氏病患者植物血凝素皮肤试验反应,资料如患者植物血凝素皮肤试验反应,资料如下,问活动型与稳定型布氏患者反应阳下,问活动型与稳定型布氏患者反应阳性率有无差别?性率有无差别?现在学习的是第48页,共58页49五、四格表的确切概率法五、四格表的确切概率法n基本思想基本思想 现在学习的是第49页,共58页50H0:两型阳性率相等,即:两型阳性率相等,即1=2 H1:12在将原四格表周边数字(行和与列和)不变的情况下,变动在将原四格表周边数字(行和与列和)不变的情况下,变动a值,值,以得到不同情况:以得到不同情况:现在学习的是第50页,共58页51p为为| A- T|大于等于原来表中的大于等于原来表中的| A- T|值(值(0.14)的情)的情况下的况下的p(i)的和,即的和,即 p=p(0)+p(1)+p(4)=0.2668按按=0.05水准接受水准接受H0,认为两型阳性率相等。认为两型阳性率相等。 计算每种情况下的计算每种情况下的|A- T|和和|A- T|大于等于原来大于等于原来表中的表中的| A- T|值(值(0.14)的)的p(i)值,值,p(i)值按下列公值按下列公式来计算:式来计算:现在学习的是第51页,共58页52【例例7-11】 某医师为研究乙肝免疫球蛋白预防胎儿宫某医师为研究乙肝免疫球蛋白预防胎儿宫内感染内感染HBV的效果,将的效果,将33例例HBsAg阳性孕妇随机分为阳性孕妇随机分为预防注射组和非预防组,结果见下表。问两组新生儿的预防注射组和非预防组,结果见下表。问两组新生儿的HBV总体感染率有无差别?总体感染率有无差别?现在学习的是第52页,共58页532211T11=6 A-T=2.0现在学习的是第53页,共58页54第二节第二节 分类资料的拟合优度检验分类资料的拟合优度检验 此例只有两种分类。因此应有理论次数此例只有两种分类。因此应有理论次数= 总数分总数分类项数,即类项数,即=700.5=35(人)(人)= eefff202)(8 . 235)3528(35)3542(22= = 【例例7-12】随机抽取随机抽取70名学生,调查他们对高中名学生,调查他们对高中分文理科的意见,回答赞成的有分文理科的意见,回答赞成的有42人,反对的有人,反对的有28人。问对分科的意见有无差异?人。问对分科的意见有无差异?一、单变量拟合优度检验一、单变量拟合优度检验现在学习的是第54页,共58页55二、频数分布的拟合优度检验二、频数分布的拟合优度检验 1. 建立假设,确定检验水准:建立假设,确定检验水准: H0:评定结果服从正态分布,:评定结果服从正态分布, H1:评定结果不服从正态分布:评定结果不服从正态分布 =0.05 【例例7-13】 今对某校今对某校100名学生进行操行评定,分名学生进行操行评定,分优、良、中、差四等,评定结果为:优优、良、中、差四等,评定结果为:优19人、良人、良39人、中人、中35人、差人、差7人。试检验其分布的形式是否属于正人。试检验其分布的形式是否属于正态分布?态分布? 现在学习的是第55页,共58页2. 计算值:计算值:第一等分(优):第一等分(优):1.53之间的面积比率为:之间的面积比率为:0.49870.4332=0.0655,即,即7%。第二等分(良):第二等分(良):01.5之间面积比率为之间面积比率为0.4332,即,即43%。第三等分(中):第三等分(中):01.5之间面积比率为之间面积比率为0.4332。第四等分(差):第四等分(差):位于位于31.5之间的面积比率为:之间的面积比率为:0.49870.4332=0.0655,即,即7%。(1) 首先需求出理论次数。可将正态分布底线长度从首先需求出理论次数。可将正态分布底线长度从3至至3分为四个等分,每等分为分为四个等分,每等分为1.5,其面积比率,其面积比率为:为:现在学习的是第56页,共58页573. 统计推断统计推断n df= 4-1 = 3。 =7.81, n以以 0.05水准拒绝,认为此评定结果不服水准拒绝,认为此评定结果不服从正态分布。从正态分布。)3(05. 02243.227)77(43)4335(43)4339(7)719(2222 )3(05. 022(2) 根据各等分的面积比率,乘以总人数,即可得出根据各等分的面积比率,乘以总人数,即可得出理论次数。如:优的人数为理论次数。如:优的人数为7%100=7。(3) 计算计算2现在学习的是第57页,共58页感谢大家观看感谢大家观看现在学习的是第58页,共58页