卡方检验在统计学中的应用 (2)精.ppt
卡方检验在统计学中的卡方检验在统计学中的应用应用第1页,本讲稿共80页例例 某省观察三个地区的花生污染黄曲霉毒素某省观察三个地区的花生污染黄曲霉毒素B1的的情况,见下表,问三个地区花生污染黄曲霉毒素情况,见下表,问三个地区花生污染黄曲霉毒素B B1污染率有无差别?污染率有无差别?某省三个地区花生的黄曲霉毒素某省三个地区花生的黄曲霉毒素某省三个地区花生的黄曲霉毒素某省三个地区花生的黄曲霉毒素B B1 1污染率比较污染率比较污染率比较污染率比较第2页,本讲稿共80页 2检验检验n n用途n n推断两个或两个以上总体率(或构成比)之间有无差别n n推断两个分类变量间有无相关关系第3页,本讲稿共80页 2检验检验完全随机设计两样本率的比较行列表资料的2检验关联性分析第4页,本讲稿共80页完全随机设计的完全随机设计的两样本率比较两样本率比较第5页,本讲稿共80页例例6.1在某项治疗牙科术后疼痛控制的双盲在某项治疗牙科术后疼痛控制的双盲临床研究中,将临床研究中,将178例患者随机分成两组,例患者随机分成两组,A药组药组90人,有效人数为人,有效人数为68人。人。B药组药组88人,人,有效人数为有效人数为58人。资料整理如下表,问两人。资料整理如下表,问两种药有效率是否有差别?种药有效率是否有差别?第6页,本讲稿共80页178名病人随机分组A药组90人B药组88人第7页,本讲稿共80页患者患者编编号号处处理理疗疗效效1 1A A药药有效有效2 2B B药药有效有效3 3A A药药无效无效4 4A A药药有效有效5 5B B药药无效无效.第8页,本讲稿共80页表6.1 两种药物有效率的比较 处理 有效 无效 合计 A药 6 822 90 B药 5830 88 合计 126 52 178 68、2222、5858、3030是整个表的基本数据,是整个表的基本数据,其余数据都是从这四个基本数据相加而得的第9页,本讲稿共80页四格表资料四格表资料n n表6.1中资料是两组两分类资料,称为四格表(fourfold table),亦称22表(22 table)第10页,本讲稿共80页四格表基本格式四格表基本格式第11页,本讲稿共80页例例6.1在某项治疗牙科术后疼痛控制的双盲临在某项治疗牙科术后疼痛控制的双盲临床研究中,将床研究中,将178例患者随机分成两组,例患者随机分成两组,A药药组组90人,有效人数为人,有效人数为68人。人。B药组药组88人,人,有效人数为有效人数为58人。资料整理如下表,问两人。资料整理如下表,问两种药有效率是否有差别?种药有效率是否有差别?第12页,本讲稿共80页提出问题提出问题n n研究目的:A药与B药有效率有 无差别?75.5665.91n n能否说明A药有效率比 B药高?第13页,本讲稿共80页检验的基本思想检验的基本思想n n假设:A药与B药有效率相同。n n则可计算两组合计的有效率第14页,本讲稿共80页处理处理有效有效无效无效合计合计有效率有效率()A A药药686822229090B B药药585830308888合计合计126126525217817870.7970.79说明:理论上A药与药与B药有效率均为药有效率均为70.79%表6.1 两种药物有效率的比较 第15页,本讲稿共80页处理处理有效有效无效无效合计合计有效率有效率()A A药药26.226.29 9909070.7970.79B B药药62.2962.2925.725.71 1888870.7970.79合计合计126126525217817870.7970.79表6.1 理论频数计算(what is“理论频数”?)*第16页,本讲稿共80页计算理论频数计算理论频数n n两组合计的有效率为两组合计的有效率为70.79%(126/178)70.79%(126/178),则理论上:,则理论上:用用A A药治疗有效人数为:药治疗有效人数为:用用A A药治疗无效人数为:药治疗无效人数为:用用B B药治疗有效人数为:药治疗有效人数为:用用B B药治疗无效人数为:药治疗无效人数为:第17页,本讲稿共80页n n 为相应行的合计n n 为相应列的合计n n n 为总例数 第18页,本讲稿共80页表6.1 两种药物控制牙科术后疼痛有效率的比较 处理 有效 无效 合计 有效率(%)A药 68(63.71)22 (26.29)90 75.56 B药 58(62.29)30 (25.71)88 65.91 合计 126 52 17870.79 第19页,本讲稿共80页检验的基本思想检验的基本思想n n假设:A药与B药有效率相同。n n则可计算两组合计的有效率为70.79%(即126/178)n n说明:理论上A药与B药有效率均为70.79%第20页,本讲稿共80页n n如果假设成立,则实际频数和理论频数吻合 第21页,本讲稿共80页n n为消除符号的影响,则:n n考虑绝对数不能完全体现其对 值的贡献:n n考虑 值受格子数多少的影响,引入第22页,本讲稿共80页计算公式若检验假设成立,则实际数与理论数之差一般不会很大,2值应很小。第23页,本讲稿共80页确定确定P值值2与P值的对应关系可查2界值表(附表5)。2值愈大,P值愈小。第24页,本讲稿共80页四格表资料的四格表资料的 检验检验 n n基本思想:实际频数和理论频数吻合的程度 n n 检验的计算公式 A 为实际频数(actual frequency)T 为理论频数(theoretical frequency)第25页,本讲稿共80页例例例例6.1具体步骤具体步骤n n建立检验假设建立检验假设 HH0 0:1 1=2 2 即两种药有效率相同即两种药有效率相同 HH1 1:1 1 2 2 即两种药有效率即两种药有效率不不同同n n查查 2 2界值表界值表(附表附表5)5),得,得P P0.050.05。按。按=0.05=0.05水准,不拒绝水准,不拒绝HH0 0,差别无统计学意义,尚不能认为两药对控制牙科术,差别无统计学意义,尚不能认为两药对控制牙科术后疼痛的疗效不同。后疼痛的疗效不同。第26页,本讲稿共80页四格表专用公式四格表专用公式第27页,本讲稿共80页四格表基本格式四格表基本格式第28页,本讲稿共80页处理处理有效有效无效无效合计合计A A药药686822229090B B药药585830308888合计合计1261265252178178表6.1 两种药物控制牙科术后疼痛有效率的比较 第29页,本讲稿共80页四格表四格表 值的校正值的校正 n nT 5且n 40时,不需校正n n1 T5,且n 40时,需计算校正值,或改用确切概率计算法。n nT1或n40时,需用确切概率计算法。第30页,本讲稿共80页四格表四格表 值的校正值的校正 注:(1)这种校正称为连续性校正。(2)如检验所得P值近于检验水准时,最 好改用四格表确切概率法。第31页,本讲稿共80页例例6.2n n见P60,校正与未校正结果的比较第32页,本讲稿共80页计算最小理论频数计算最小理论频数第33页,本讲稿共80页计算最小理论频数(例计算最小理论频数(例6.2)第34页,本讲稿共80页 2检验检验完全随机设计两样本率的比较行列表资料的2检验关联性分析第35页,本讲稿共80页行行列表资料的列表资料的 2检验检验n n行列表(RC表),包括22、R2、2C,用于多个样本率或构成比的比较。n n基本原理和检验步骤与四格表2检验相似n n计算公式第36页,本讲稿共80页例6.4 将133例尿路感染患者随机分成3组,第1组44例,接受甲法治疗;第2组45例,接受乙法治疗,第3组44例,接受丙法治疗,结果如下表,问三种疗法尿培养阴转率有无差别?第37页,本讲稿共80页3种疗法对尿路感染患者的治疗效果种疗法对尿路感染患者的治疗效果疗疗法法阴阴转转人数人数阳性人数阳性人数合合计计阴阴转转率率()甲甲30301414444468.268.2乙乙9 93636454520.020.0丙丙32321212444472.772.7合合计计7171626213313353.453.4第38页,本讲稿共80页1、建立检验假设、建立检验假设:n nH0:3种疗法的阴转率相同,种疗法的阴转率相同,即即1=2=3 n nH1:3种疗法的阴转率种疗法的阴转率不等或不全相等n n=0.05第39页,本讲稿共80页2、计算检验统计量、计算检验统计量疗疗法法阴阴转转人数人数 阳性人数阳性人数合合计计甲甲303014144444乙乙9 936364545丙丙323212124444合合计计71716262133133第40页,本讲稿共80页n n查2界值得P0.05。按=0.05水准,不拒绝H0,差别无统计学意义,尚不能认为胃、十二指肠疾病患者与健康输血员血型分布构成不同。3、结论、结论第45页,本讲稿共80页行行列表检验时的注意事项列表检验时的注意事项 n n2检验要求理论频数不宜太小,一般认为行列表中不宜有1/5以上格子的理论频数小于5,或有一个理论频数小于1。n n关于单向有序行列表的统计处理。第46页,本讲稿共80页理论频数太小有三种处理办法理论频数太小有三种处理办法n n增加样本例数以增大理论频数。n n删去上述理论频数太小的行和列。n n将太小理论频数所在行或列与性质相近的邻行邻列中的实际频数合并,使重新计算的理论频数增大。第47页,本讲稿共80页行行列表检验时的注意事项列表检验时的注意事项 n n2检验要求理论频数不宜太小,一般认为行列表中不宜有1/5以上格子的理论频数小于5,或有一个理论频数小于1。n n关于单向有序行列表的统计处理。第48页,本讲稿共80页分组痊愈显效进步无效合计A组301432682B组281316461C组3212162282合计90396432225第49页,本讲稿共80页单向有序行列表的统计处理单向有序行列表的统计处理n n当效应按强弱(或优劣)分为若干个级别,比如分为-、+、+、+、+等6个等级,在比较各处理组的效应有无差别时,宜用第九章的秩和检验法。n n如作2检验只说明各处理组的效应在构成比上有无差异。第50页,本讲稿共80页行行列表检验时的注意事项列表检验时的注意事项n n当多个样本率(或构成比)比较的检验,结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说明它们彼此间都有差别,或某两者间有差别。第51页,本讲稿共80页 2检验检验完全随机设计两样本率的比较行列表资料的2检验关联性分析第52页,本讲稿共80页n n 对一组观察对象,分别观察其两种分类变量的表现,归纳成双向交叉排列的统计表,这类统计表用以描述行变量和列变量之间的关系,亦称为列联表(contingency table)。什么是关联性分析?什么是关联性分析?第53页,本讲稿共80页n n单一样本,按两种属性分级,故称双向有序列联表n n分析目的:推断两种属性标志间有无关系第54页,本讲稿共80页关联性分析关联性分析RC列联表22列联表第55页,本讲稿共80页例例6.6 6.6 某矿工医院探讨矽肺不同期次患者的胸某矿工医院探讨矽肺不同期次患者的胸部平片密度变化,部平片密度变化,492例患者资料整理如表例患者资料整理如表例患者资料整理如表例患者资料整理如表6.7,问矽肺患者肺门密度的增加与期次有无关系?问矽肺患者肺门密度的增加与期次有无关系?第56页,本讲稿共80页表表6.7 6.7 不同期次矽肺患者肺门密度级别分布不同期次矽肺患者肺门密度级别分布 第57页,本讲稿共80页1.建立检验假设建立检验假设n nH0:矽肺期次与肺门密度无关系;n nH1:矽肺期次与肺门密度有关系;n n=0.05 第58页,本讲稿共80页2.计算检验统计量计算检验统计量=(31)(31)=4第59页,本讲稿共80页作出统计推断作出统计推断n n查2界值得P0.005,按=0.05水准拒绝H0,接受H1,故可认为肺门密度与矽肺期次有关联。结合本资料可见肺门密度有随矽肺期次增高而增加的趋势。第60页,本讲稿共80页关联性分析关联性分析RC列联表22列联表(配对设计2检验)第61页,本讲稿共80页例例6.3 6.3 某研究室用甲乙两种血清学方法检查某研究室用甲乙两种血清学方法检查410例确诊的鼻咽癌患者例确诊的鼻咽癌患者,得结果如表得结果如表,问两种检验问两种检验结果之间有无联系结果之间有无联系?有无差别有无差别有无差别有无差别?第62页,本讲稿共80页患者患者编编号号甲法甲法检验结检验结果果乙法乙法检验结检验结果果1 1+2 2+3 3+4 45 5+.第63页,本讲稿共80页表表表表6.4 两种血清学方法检查结果两种血清学方法检查结果第64页,本讲稿共80页问题问题1n n两种方法有无关系关联性分析第65页,本讲稿共80页n n单一样本,按某种属性分级,故称双向有序列联表n n分析目的:推断两种属性标志间有无关系第66页,本讲稿共80页两法检验的结果有无关系两法检验的结果有无关系n n :甲乙两法检验的结果无关系 :甲乙两法检验的结果有关系 =0.05 n n查附表5,界值表,得P40b+c 40第72页,本讲稿共80页两法检验结果有无差别两法检验结果有无差别 n n :两总体两总体 :两总体两总体 n n 查查附附表表5,5,得得P0.005,P0.005,按按=0.05=0.05水水准准拒拒绝绝 ,可可认认为为甲甲乙乙两两种种血血清清学学阳阳性性检检出出率率不不相相同同,甲甲法法的的阳阳性性检检出率较高。出率较高。第73页,本讲稿共80页列联表检验时的注意事项列联表检验时的注意事项:n n理论数不能过小,其要求与前述RC表一致。第74页,本讲稿共80页RC表与列联表的不同之处表与列联表的不同之处n n列联表仅有一组观察对象,用来描述两变量的相关关系;n nRC表有两组观察对象,用来比较多个率或构成比。第75页,本讲稿共80页四格表资料的确切概率法四格表资料的确切概率法n n适用条件n n四格表若有理论频数小于四格表若有理论频数小于1,1,或或 n40n40时时n n用其他检验方法所得概率接近检验水准时用其他检验方法所得概率接近检验水准时第76页,本讲稿共80页例例 在某牧区观察慢性布鲁氏病患者植物血凝在某牧区观察慢性布鲁氏病患者植物血凝素素(PHA)皮肤试验反应,资料如下表。问活动皮肤试验反应,资料如下表。问活动型与稳定型布氏患者型与稳定型布氏患者PHA反应阳性率有无差别反应阳性率有无差别反应阳性率有无差别反应阳性率有无差别?第77页,本讲稿共80页表表表表 两型慢性布氏病的两型慢性布氏病的两型慢性布氏病的两型慢性布氏病的PHAPHA皮试反应皮试反应皮试反应皮试反应 第78页,本讲稿共80页 2检验的基本步骤检验的基本步骤 建立检验假设,确定检验水准 考察最小理论频数确定检验方法,计算检验统计量 确定P值,作出统计推断 第79页,本讲稿共80页作业作业3.123.133.143.15第80页,本讲稿共80页