第八章--卡方检验ppt课件.ppt
《第八章--卡方检验ppt课件.ppt》由会员分享,可在线阅读,更多相关《第八章--卡方检验ppt课件.ppt(53页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、金英良金英良流行病学与卫生统计学教研室流行病学与卫生统计学教研室第八章 检验2Chi-square Test本章主要内容:本章主要内容:第一节第一节 四格表四格表 检验检验第二节第二节 配对四格表配对四格表 检验检验第三节第三节 行行列表列表 检验检验222分布分布2 是一种连续型分布,可用于检是一种连续型分布,可用于检验资料的实际频数和按检验假设计验资料的实际频数和按检验假设计算的理论频数是否相符等问题。早算的理论频数是否相符等问题。早在在1875年,年,F. Helmet即得出来自正即得出来自正态总体的样本方差的分布服从卡方态总体的样本方差的分布服从卡方分布。分布。1900年,年,K. P
2、earson也独立也独立地从检验分布的拟合优度发现这一地从检验分布的拟合优度发现这一相同的卡方分布。相同的卡方分布。Karl Pearson (1857-1936)个相互独立的标准正态变量个相互独立的标准正态变量ui(i=1,2, )的平方和的平方和称为称为 变量,即变量,即22222121.iuuuXu它的分布即为卡方分布,其自由度为它的分布即为卡方分布,其自由度为。卡方分布卡方分布 2检验读作卡方检验,是一种用途广泛的统计方检验读作卡方检验,是一种用途广泛的统计方法,主要用于:法,主要用于:检验检验两个(或多个)总体率两个(或多个)总体率或或构成比构成比之间是否有统计之间是否有统计学意义,
3、从而推断两个(或多个)总体率或构成比是学意义,从而推断两个(或多个)总体率或构成比是否相同。否相同。2检验的用途检验的用途 检验实际频数检验实际频数(A)和理论频数和理论频数(T)的差别是否由抽的差别是否由抽样误差所引起的,样误差所引起的, 也就是由样本率(或样本构成比)也就是由样本率(或样本构成比)来推断总体率(或总体构成比)。来推断总体率(或总体构成比)。2检验的基本思想检验的基本思想基本计算公式基本计算公式式中,式中,A为实际频数(为实际频数(actual frequency),T为理论频数为理论频数(theoretical frequency) R CRCn nTn22(),A TT自
4、由度行数-1 列数-1back例例8.1 为了解某中药治疗原发性高血压的疗效,为了解某中药治疗原发性高血压的疗效,将将70名高血压患者随机分为两组,试验组用该名高血压患者随机分为两组,试验组用该药加辅助治疗,对照组用安慰剂加辅助治疗,药加辅助治疗,对照组用安慰剂加辅助治疗,观察结果见表观察结果见表8-1。问:该药治疗原发性问:该药治疗原发性高血压是否有效?高血压是否有效?1、建立检验假设并确定检验水准、建立检验假设并确定检验水准H0:1=2 ,即试验组与对照组的总体有效率相等,即试验组与对照组的总体有效率相等H1 :12 ,即试验组与对照组的总体有效率不等,即试验组与对照组的总体有效率不等=0
5、.052、计算检验统计量计算检验统计量8 .2570414411T2 .1870294412T2 .1570412621T8 .1070292622T用基本公式计算卡方值:用基本公式计算卡方值:40. 88 .108 .1052 .152 .15212 .182 .18248 .258 .252022222)()()()(22()()()()()ad bc na b a c b d c d四格表卡方检验的专用公式:四格表卡方检验的专用公式:1113、查界值表,确定、查界值表,确定P值,做出推断结论值,做出推断结论自由度自由度=1,20.05(1)=3.84, 2 20.05(1), 所以所以
6、,P0.05,在在=0.05的检验水准下,拒绝的检验水准下,拒绝H0, 差异有统计差异有统计学意义,也就是学意义,也就是试验组与对照组的总体有效率不等试验组与对照组的总体有效率不等.40. 82941264470)2124520(22(四格表专用公式)基本公式:;1)()()()()()()()()()()(222222dbcadcbanbcaddcbadbdcdcbadbdcddcbadbbadcbadbbabdcbacabadcbacabaaTTA推倒过程推倒过程 卡方分布是连续型的分布,卡方界值是由其分布卡方分布是连续型的分布,卡方界值是由其分布计算而来的。而卡方检验用于分类资料比较时,
7、原始计算而来的。而卡方检验用于分类资料比较时,原始数据是不连续的,用卡方界值表确定数据是不连续的,用卡方界值表确定P值时可能存在误值时可能存在误差。四格表资料中,当差。四格表资料中,当n40,有理论频数有理论频数1T5时,时,因为理论值太小,会导致因为理论值太小,会导致2值变大,易出现假阳性结值变大,易出现假阳性结论。论。四格表四格表2值的连续性校正值的连续性校正22(0.5)cA TT222()()()()()nc|ad -bc|-n=a+b c+d a+c b+d连续性校正公式连续性校正公式111)当)当n40,所有所有T 5时,用专用公式或普通公式;时,用专用公式或普通公式;2)当)当n
8、40,但有理论频数但有理论频数1T5时,用校正公式;时,用校正公式;3) n40或有或有T1,或,或P时,用确切概率法。时,用确切概率法。 连续性校正仅用于连续性校正仅用于 的的四格表资料,当四格表资料,当 时,一般不时,一般不作校正。作校正。 212例例8.2 某医学院抽样调查大学四年级和五年级学生近视某医学院抽样调查大学四年级和五年级学生近视眼患病情况,四年级学生的近视率为眼患病情况,四年级学生的近视率为7.14%,五年级学,五年级学生的近视率为生的近视率为35.71%,调查结果见下表,试问该大学四,调查结果见下表,试问该大学四年级与五年级学生的近视眼患病率是否一样?年级与五年级学生的近视
9、眼患病率是否一样?年级年级近视近视非近视非近视合计合计近视率(近视率(%)四年级四年级2 26287.14五年级五年级5 91435.71合计合计7354216.67表表8-2 两个年级大学生的近视眼患病率比较两个年级大学生的近视眼患病率比较1、建立检验假设并确定检验水准、建立检验假设并确定检验水准H0: 1=2 ,即四年级与五年级学生的近视眼患病率相同,即四年级与五年级学生的近视眼患病率相同H1 :12 ,即四年级与五年级学生的近视眼患病率不同,即四年级与五年级学生的近视眼患病率不同=0.052、计算检验统计量计算检验统计量62. 3)95)(262)(926)(52(42)24252692
10、(223、查界值表,确定、查界值表,确定P值,做出推断结论值,做出推断结论自由度自由度=1, 20.05(1)=3.84, 20.05,在在=0.05的检验水准下,不拒绝的检验水准下,不拒绝H0,说明四年说明四年级与五年级学生近视眼患病率差别没有统计学意义,可级与五年级学生近视眼患病率差别没有统计学意义,可认为尚未发现四年级与五年级学生近视眼患病率有显著认为尚未发现四年级与五年级学生近视眼患病率有显著性差异。性差异。22(2 926 5)425.49(25)(269)(226)(59) 若不采用校正公式:若不采用校正公式:在在=0.05水准下,水准下,2 2 0.05(1),则则P0.05。b
11、ack甲种属性甲种属性乙种属性乙种属性+-合计合计+aba+c-cdc+d合计合计a+cb+dn=a+b+c+d注意:注意:a、b、c、d代表对子数!代表对子数!表表8-16 配对四格表基本结构的配对四格表基本结构的甲种属性甲种属性乙种属性乙种属性 + + a+-b-+c-d甲属性的阳性率:甲属性的阳性率:(a+b)/n乙属性的阳性率乙属性的阳性率:(a+c)/n若若H0成立,则有成立,则有(a+b)/n- (a+c)/n=0,即即(b-c)/n=0可见,两个变量阳性率的比较只和可见,两个变量阳性率的比较只和b、c有关,而与有关,而与a、d无关。无关。若若H0成立,两种属性不一致的两个格子理论
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 检验 ppt 课件
限制150内