第八章卡方检验PPT讲稿.ppt
《第八章卡方检验PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第八章卡方检验PPT讲稿.ppt(53页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八章卡方检验第1页,共53页,编辑于2022年,星期三本章主要内容:本章主要内容:第一节第一节 四格表四格表 检验检验第二节第二节 配对四格表配对四格表 检验检验第三节第三节 行行列表列表 检验检验第2页,共53页,编辑于2022年,星期三分布分布 是一种连续型分布,可用于检验是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的资料的实际频数和按检验假设计算的理论频数是否相符等问题。早在理论频数是否相符等问题。早在1875年,年,F.Helmet即得出来自正态总体即得出来自正态总体的样本方差的分布服从卡方分布。的样本方差的分布服从卡方分布。1900年,年,K.Pearson也独立地从
2、检验分也独立地从检验分布的拟合优度发现这一相同的卡方分布。布的拟合优度发现这一相同的卡方分布。Karl Pearson(1857-1936)第3页,共53页,编辑于2022年,星期三个相互独立的标准正态变量个相互独立的标准正态变量ui(i=1,2,)的平方和称的平方和称为为 变量,即变量,即它的分布即为卡方分布,其自由度为它的分布即为卡方分布,其自由度为。第4页,共53页,编辑于2022年,星期三卡方分布卡方分布第5页,共53页,编辑于2022年,星期三 2检验读作卡方检验,是一种用途广泛的统计方法,主要检验读作卡方检验,是一种用途广泛的统计方法,主要用于:用于:检验检验两个(或多个)总体率两
3、个(或多个)总体率或或构成比构成比之间是否有统计学意之间是否有统计学意义,从而推断两个(或多个)总体率或构成比是否相同。义,从而推断两个(或多个)总体率或构成比是否相同。2检验的用途检验的用途第6页,共53页,编辑于2022年,星期三 检验实际频数检验实际频数(A)和理论频数和理论频数(T)的差别是否由抽样的差别是否由抽样误差所引起的,误差所引起的,也就是由样本率(或样本构成比)来也就是由样本率(或样本构成比)来推断总体率(或总体构成比)。推断总体率(或总体构成比)。2检验的基本思想检验的基本思想第7页,共53页,编辑于2022年,星期三基本计算公式基本计算公式式式 中中,A为为 实实 际际
4、频频 数数(actual frequency),T为为 理理 论论 频频 数数(theoretical frequency)back第8页,共53页,编辑于2022年,星期三例例8.1 为了解某中药治疗原发性高血压的疗效,将为了解某中药治疗原发性高血压的疗效,将70名高血压患者随机分为两组,试验组用该药加辅助名高血压患者随机分为两组,试验组用该药加辅助治疗,对照组用安慰剂加辅助治疗,观察结果见表治疗,对照组用安慰剂加辅助治疗,观察结果见表8-1。问:该药治疗原发性问:该药治疗原发性高血压是否有效?高血压是否有效?第9页,共53页,编辑于2022年,星期三第10页,共53页,编辑于2022年,星
5、期三1、建立检验假设并确定检验水准、建立检验假设并确定检验水准H0:1=2,即试验组与对照组的总体有效率相等,即试验组与对照组的总体有效率相等H1:12,即试验组与对照组的总体有效率不等,即试验组与对照组的总体有效率不等=0.052、计算检验统计量计算检验统计量第11页,共53页,编辑于2022年,星期三用基本公式计算卡方值:用基本公式计算卡方值:第12页,共53页,编辑于2022年,星期三四格表卡方检验的专用公式:四格表卡方检验的专用公式:第13页,共53页,编辑于2022年,星期三3、查界值表,确定、查界值表,确定P值,做出推断结论值,做出推断结论自自由由度度=1,20.05(1)=3.8
6、4,2 20.05(1),所所以以 ,P0.05,在在=0.05的的检检验验水水准准下下,拒拒绝绝H0,差差异异有有统统计计学学意意义义,也也就是就是试验组与对照组的总体有效率不等试验组与对照组的总体有效率不等.第14页,共53页,编辑于2022年,星期三推倒过程推倒过程第15页,共53页,编辑于2022年,星期三 卡方分布是连续型的分布,卡方界值是由其分布计算而卡方分布是连续型的分布,卡方界值是由其分布计算而来的。而卡方检验用于分类资料比较时,原始数据是不连续来的。而卡方检验用于分类资料比较时,原始数据是不连续的,用卡方界值表确定的,用卡方界值表确定P值时可能存在误差。四格表资料中,值时可能
7、存在误差。四格表资料中,当当n40,有理论频数有理论频数1T5时,因为理论值太小,会导致时,因为理论值太小,会导致2值变大,易出现假阳性结论。值变大,易出现假阳性结论。四格表四格表2值的连续性校正值的连续性校正第16页,共53页,编辑于2022年,星期三连续性校正公式连续性校正公式第17页,共53页,编辑于2022年,星期三四格表资料四格表资料2 2公式的正确选择公式的正确选择 1)当)当n40,所有所有T 5时,用专用公式或普通公式;时,用专用公式或普通公式;2)当)当n40,但有理论频数但有理论频数1T5时,用校正公式;时,用校正公式;3)n40或有或有T1,或,或P时,用确切概率法。时,
8、用确切概率法。连续性校正仅用于连续性校正仅用于 的的四格表资料,当四格表资料,当 时,一般不时,一般不作校正。作校正。第18页,共53页,编辑于2022年,星期三例例8.2 某医学院抽样调查大学四年级和五年级学生近视眼患病某医学院抽样调查大学四年级和五年级学生近视眼患病情况,四年级学生的近视率为情况,四年级学生的近视率为7.14%,五年级学生的近视率为,五年级学生的近视率为35.71%,调查结果见下表,试问该大学四年级与五年级学生的,调查结果见下表,试问该大学四年级与五年级学生的近视眼患病率是否一样?近视眼患病率是否一样?年级年级近视近视非近视非近视合计合计近视率(近视率(%)四年级四年级2
9、26287.14五年级五年级5 91435.71合计合计7354216.67表表8-2 两个年级大学生的近视眼患病率比较两个年级大学生的近视眼患病率比较第19页,共53页,编辑于2022年,星期三1、建立检验假设并确定检验水准、建立检验假设并确定检验水准H0:1=2,即四年级与五年级学生的近视眼患病率相同,即四年级与五年级学生的近视眼患病率相同H1:12,即四年级与五年级学生的近视眼患病率不同,即四年级与五年级学生的近视眼患病率不同=0.052、计算检验统计量计算检验统计量第20页,共53页,编辑于2022年,星期三3、查界值表,确定、查界值表,确定P值,做出推断结论值,做出推断结论自自由由度
10、度=1,20.05(1)=3.84,20.05,在在=0.05的的检检验验水水准准下下,不不拒拒绝绝H0,说说明明四四年年级级与与五五年年级级学学生生近近视视眼眼患患病病率率差差别别没没有有统统计计学学意意义义,可可认认为为尚尚未未发发现现四四年年级级与五年级学生近视眼患病率有显著性差异。与五年级学生近视眼患病率有显著性差异。第21页,共53页,编辑于2022年,星期三若不采用校正公式:若不采用校正公式:在在=0.05水准下,水准下,2 2 0.05(1),则则P0.05。back第22页,共53页,编辑于2022年,星期三甲种属性甲种属性乙种属性乙种属性+-合计合计+aba+c-cdc+d合
11、计合计a+cb+dn=a+b+c+d注意:注意:a、b、c、d代表对子数!代表对子数!表表8-16 配对四格表基本结构的配对四格表基本结构的第23页,共53页,编辑于2022年,星期三甲种属性甲种属性乙种属性乙种属性+a+-b-+c-d甲属性的阳性率:甲属性的阳性率:(a+b)/n乙属性的阳性率乙属性的阳性率:(a+c)/n若若H0成立,则有成立,则有(a+b)/n-(a+c)/n=0,即即(b-c)/n=0可见,两个变量阳性率的比较只和可见,两个变量阳性率的比较只和b、c有关,而与有关,而与a、d无关。无关。若若H0成立,两种属性不一致的两个格子理论频数都应该是成立,两种属性不一致的两个格子
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 章卡方 检验 PPT 讲稿
限制150内