《卡方检验(研).ppt》由会员分享,可在线阅读,更多相关《卡方检验(研).ppt(74页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2023/1/81第第十十章章胡利人胡利人广东医学院广东医学院流行病与卫生统计学教研室流行病与卫生统计学教研室2023/1/822检验是英国统计学家Pearson于1900年提出的一种应用范围很广的统计方法.Karl PearsonKarl Pearson2023/1/83卡方卡方检验的用途的用途推断两个或多个总体率或构成比之间有无差别两个分类变量间有无相关关系多个率的趋势检验频数分布的拟合优度检验2023/1/84 2 2 检验的基本思想检验的基本思想【例10-1】为比较西药与中药治疗慢性支气管炎的疗效,某医师将符合研究标准的110例慢性支气管炎患者随机分为两组,西药组86例,中药组24例。
2、服药一个疗程后,观察患者的疗效,问两种药有效率是否有差别?2023/1/85分析思想分析思想:假设两疗法相同,则两疗法的平均显效率平均显效率=53/110=48.18理论上西药组西药组 显效人数8648.18%=41.44 无效人数8641.44=44.56;中药组中药组 显效人数2448.18=11.56 无效人数2411.56=12.44。41.44 44.5611.56 12.442023/1/86实际频数数与理理论频数数存在差异,如该差异如果为抽样误差的许可范围,则两治疗组的显效率一致,否则,则两组的显效率不是来自同一总体,即两治疗组有效率不同。41.44 44.5611.56 12.
3、4441.44 44.5611.56 12.4441.44 44.5611.56 12.442023/1/87实际数与理论数相差的程度(或者说吻合的程度)又如何衡量呢?2023/1/88实际频数实际频数与与理论频数理论频数的差异可以表示为的差异可以表示为 值反映了实际频数与理论频数吻合的程度反映了实际频数与理论频数吻合的程度(差别的程度)。2023/1/89值服从自由度为的卡方分布2023/1/8102023/1/811如果检验假设H0成立,则实际数与理论数之差一般不会很大,2值应很小,2值对应的的概率P则比较大,反之亦然。因此若P,就怀疑假设H0,因而拒绝它;若P,则尚无理由拒绝它2023/
4、1/812第一节 22表的卡方检验基本数据的行数和列数均为2者,称为22表资料或四格表资料;基本数据的行数或列数大于2者,称为RC列联表资料或行列表资料。2023/1/813 2 检验(检验(Pearson 卡方检验卡方检验)基本公式:)基本公式:上式中A 为实际频数,T 为理论频数TRC 为第R 行C 列的理论频数为相应的行合计为相应的列合计 一、完全随机设计 检验 2023/1/814由计算公式由计算公式代入理论数代入理论数 四格表的专用计算公式:四格表的专用计算公式:2023/1/8152023/1/816【检验步骤】1.建立检验假设,确定检验水准H0:西药和中药的显效率相同,即1=2H
5、1:西药和中药的显效率不同,即12 =0.052023/1/8172.计算检验统计量2 值,2023/1/818 查2界值表,得2 0.05,1=3.84,2 2 0.05,1,P 40 且所有 T5 时,用普通的2检验当 n40 但有 1T5 时,用校正的2检验当n40或有T 2 0.05,1,P 0.05,按=0.05水准,拒绝H0,接受H1,差异有统计学意义,可以认为两药的有效率不等 确定P值,作出统计推断 2023/1/825表表10-3 不同药物治疗急性脑梗病人有效率比较不同药物治疗急性脑梗病人有效率比较 药物有效无效合计有效率(%)红花+丹参1414 2850.0丹参 210 12
6、16.7合计16244040.02023/1/826配对设计2检验【例10-3】某疾控中心采用IgM-PA法和ELISA法对125份可疑病例血清测定麻疹IgM抗体,IgM-PA法阳性率为64,ELISA法阳性率为60,两种方法一致阳性率为57.6。为比较两方法的测定阳性率是否有差异,将资料整理为表10-4,并用四格表2检验进行分析2023/1/827标本号123456.124125ELISA+IgM-PA+2023/1/8282023/1/829甲法的检出率乙法的检出率两检出率之差比较两种方法的检出率是否有差别,只需考察检查结果不一致的两个格子2023/1/830若H0成立,两种方法不一致的两
7、个格子理论频数都应该是 由2检验基本公式化简,2统计量为:2023/1/831若b+c40,校正公式为:2023/1/832【检验步骤】1.建立检验假设,确定检验水准H0:两种方法检测的阳性率相同,即B=CH1:两种方法检测的阳性率不同,即BC =0.05配对四格表资料的配对四格表资料的2检验也称检验也称McNemar检验检验2023/1/8332.计算检验统计量2 值,2023/1/834 查2界值表,得20.05,1=3.84,2 0.05,按=0.05水准,不拒绝H0,差异无统计学意义,尚不能认为两种方法的检测结果有差别 3.确定P值,作出统计推断 2023/1/835表表10-6 三种
8、药物治疗糖尿病的疗效比较三种药物治疗糖尿病的疗效比较组别有效无效合计有效率(%)降糖号35215662.50玉泉丸17133056.67割裂本脲29 13096.67合计813511669.82 行列(RC)表资料的 2 检验2023/1/836RC表2 检验的通用式RC表资料的卡方检验可用于:表资料的卡方检验可用于:多个样本率的比较两组构成比的比较多组构成比的比较2023/1/837表表10-6 三种药物治疗糖尿病的疗效比较三种药物治疗糖尿病的疗效比较组别有效无效合计有效率(%)降糖号35(39.10)21(16.90)5662.50玉泉丸17(20.95)13(9.05)3056.67割裂
9、本脲29(20.95)1(9.05)3096.67合计813511669.822023/1/838【检验步骤】1.建立检验假设,确定检验水准H0:三种药物治疗糖尿病的疗效相同,即1=2=3 H1:1、2、3不同或不全相同=0.052023/1/8392.计算检验统计量2 值,2023/1/840 查2界值表,得2 0.05,2=5.99,2 2 0.05,2,P 0.05,按=0.05水准,拒绝H0,接受H1,差异有统计学意义,可认为3种药物治疗气阴两虚型老年型糖尿病的有效率不同或不全相同3.确定P值,作出统计推断 2023/1/841 表的 检验的两两比较常用的方法:将多个样本率(或构成比)
10、拆分为若干个22(或2C)表进行检验。为减小犯I类错误的概率,需要调整检验水准a。计算方法:式中,k为比较的样本组数。或2023/1/8423种中药治疗气阴两虚型老年型糖尿病有效率之间的两两比较结果见表10-7 2023/1/843【例10-5】某医师研究蒙族与汉族血型的分布情况,随机抽取蒙族150人,汉族200人,分别检测其血型,数据整理见表10-8,问两民族血型分布有无差异?2023/1/844表表10-8 蒙族与汉族的血型分布蒙族与汉族的血型分布血型ABOAB汉族63516422200蒙族58314813150合计1218211235350民族民族合计合计2023/1/845【检验步骤】
11、1.建立检验假设,确定检验水准H0:蒙族与汉族血型分布的构成相同 H1:蒙族与汉族血型分布的构成不同=0.052023/1/8462.计算检验统计量2 值,2023/1/847 查2界值表,得2 0.05,3=7.81,2 0.05,按=0.05水准,不拒绝H0,差异无统计学意义,尚不能认为蒙族与汉族血型分布的构成不同 3.确定P值,作出统计推断 2023/1/848RC表2 检验的注意事项1.计算时采用绝对数2.T不能太小,不能有1/5以上格子的T5,或有1格子的T1增加样本含量,使理论频数增大删去T太小格子所对应的行或列将T太小的行或列与性质的相近邻行或邻列合并2023/1/8493.关于
12、单向有序行列表,在比较各处理组的效应有无差别时,应该用秩和检验或Ridit检验4.多个样本率(或构成比)比较的2检验,若结论为拒绝H0,只能认为各总体率或总体构成比之间总的来说有差别,但不能说明各组之间都有差别,如需知道各组之间是否不同,还要进行进一步两两比两两比较 2023/1/850单向有序分类资料的比较对于单向有序的多分类资料,表的 检验仅比较各组的构成比构成比是否相同,没有利用等没有利用等级信息信息,因此,在对等级资料进行统计比较时,常用秩和秩和检验或Ridit分析分析。2023/1/851条件:理论依据:超几何分布 (非 检验 的范畴)第五节 Fisher确切概率法2023/1/85
13、2原理:原理:在四格表周边合计数不变的条件下,在四格表周边合计数不变的条件下,依次增减样本四格表中某一格的值可得各种组依次增减样本四格表中某一格的值可得各种组合的四格表,直接计算各种事件发生的概率。合的四格表,直接计算各种事件发生的概率。计算公式为:计算公式为:2023/1/853【例例10-9】某医某医师为观察中西察中西药结合治合治疗慢性慢性寻麻疹麻疹的的疗效,将效,将27例慢性例慢性寻麻疹患者随机分成两麻疹患者随机分成两组,分,分别给予中西予中西药结合治合治疗和西和西药治治疗,结果果见下表下表2023/1/8541.建立建立检验假假设,确定,确定检验水准水准H0:中西药结合和西药的有效率相
14、等,H1:中西药结合和西药的有效率不等,2023/1/8552.计算概率算概率 计算样本 ,本例样本 85.7%46.2%39.5%计算在四格表的周算在四格表的周边合合计不不变的条件下,的条件下,变动四个基本数据四个基本数据a、b、c、d,列出所有各种,列出所有各种组合的四格表合的四格表(所列出的四格表个数等于最小周边合计数加1个)的 及相应的概率P 2023/1/856选用行合计与列合计均为最小的那个格子,从从0开始,依次增加开始,依次增加1,直到,直到该格子的格子的观测频数等于数等于最小周最小周边合合计数。数。直接计算表内四个数据的各种组合之概率,再计算等于及大于等于及大于样本的 各四格表
15、的累计概率,双侧检验取两侧累计概率,单侧检验只取一侧累计概率。2023/1/8572023/1/8580.0462023/1/8590.0372023/1/8603.确定确定P值,作出,作出统计推断推断按 水准,拒绝H0,接受H1,差异有统计学意义,可认为中西药结合组与西药组的有效率不同,中西药结合组疗效较高。2023/1/861第四节第四节 线性趋势检验线性趋势检验【例例10-8】某医师在对某工厂职工冠心病调查中,欲研究冠心病与眼底动脉硬化之间的关系,共调查593人,资料整理为表10-11。2023/1/8622023/1/863【分析分析】若研究目的是分析不同眼底动脉硬化分级与冠心病诊断结
16、果有无差别时,可将它视为单向有序表,选用秩和检验;若研究目的是分析两个有序分类变量间是否存在相关关系,适合用等级相关分析或积差相关分析,详见第十二章;若研究目的是分析两个有序分若研究目的是分析两个有序分类变量量间是否存在是否存在线性性变化化趋势,就要用到下面所介,就要用到下面所介绍的有序分的有序分组资料的料的线性性趋势检验(test for linear trend)。2023/1/864 对双向有序属性不同的RC表资料,通过 分解推断其相关是否为线性相关。其基本思想基本思想是:首先计算RC表 的值,然后将总的 值分解成线性回性回归分量分量与偏离偏离线性回性回归分分量量。若两分量均有统计学意义
17、,表明两分类变量存在相关关系,但关系不是简单的直线关系;若线性回归分量有统计学意义,偏离线性回归分量无统计学意义时,表明两分类变量不仅存在相关关系,而且是线性关系。2023/1/8652023/1/8662023/1/8672023/1/868【检验步步骤】1.建立建立检验假假设,确定,确定检验水准水准H0:眼底动脉硬化分级与冠心病诊断结果之间无线性关系H1:眼底动脉硬化分级与冠心病诊断结果之间有线性关系2023/1/8692023/1/870lyy2023/1/8712023/1/8722023/1/8733.确定确定P值,作出,作出统计推断推断 由上表看出,线性回归分量与偏离线性回归分量均有统计学意义,说明眼底动脉硬化分级与冠心病诊断结果之间存在相关关系,但关系不是简单的线性关系。2023/1/874本节要求本节要求 (1)四格表资料的)四格表资料的 2 检验检验(2)配对四格表的)配对四格表的 2 检验检验(3)行)行列(列(RC)表资料的)表资料的 2 检验检验(4)四格表的确切概率法)四格表的确切概率法
限制150内