卫生统计学---卡方检验ppt课件.pptx
《卫生统计学---卡方检验ppt课件.pptx》由会员分享,可在线阅读,更多相关《卫生统计学---卡方检验ppt课件.pptx(94页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 检检 验验 卡方检验是英国统计学家卡方检验是英国统计学家K.Pearson于于1900年提出的,年提出的,以卡方分布和拟合优度为理论依据,一种用途较广的以卡方分布和拟合优度为理论依据,一种用途较广的假设检验方法。常用于检验假设检验方法。常用于检验完全随机设计完全随机设计下两个或多下两个或多个样本率个样本率(或构成比或构成比)之间有无差别,也可用于检验之间有无差别,也可用于检验配配对设计对设计下两组频数分布差异,或者下两组频数分布差异,或者线性趋势线性趋势卡方检验,卡方检验,推断两变量间有无相关关系推断两变量间有无相关关系等。等。第一节第一节 完全随机设计完全随机设计(独立样本独立样本)列联表
2、资列联表资 料的料的 检验检验 在抽样研究中,由于个体间存在变异,必然存在着抽在抽样研究中,由于个体间存在变异,必然存在着抽 样误差,率样误差,率(或构成比或构成比)的抽样误差与均数的抽样误差的抽样误差与均数的抽样误差 概念相同。概念相同。例1 将病情相似的将病情相似的169名消化道溃疡患者随机分成两组,名消化道溃疡患者随机分成两组,分别用奥美拉唑与雷尼替丁两种药物治疗,分别用奥美拉唑与雷尼替丁两种药物治疗,4周后评价周后评价其疗效,结果见表其疗效,结果见表1。问两药治疗消化道溃疡的愈合率。问两药治疗消化道溃疡的愈合率有无差别?有无差别?表表1 两药治疗消化道溃疡两药治疗消化道溃疡4周后疗效周
3、后疗效 两组的愈合率不同有两种可能:两组的愈合率不同有两种可能:1.两药的总体愈合率无差别,两样本率的差别仅由抽两药的总体愈合率无差别,两样本率的差别仅由抽 样误差所致。样误差所致。2.两种药物的总体愈合率确有不同。两种药物的总体愈合率确有不同。一、卡方检验的基本思想一、卡方检验的基本思想表表1中,中,64、21、51、33 是整个表的基本数据,其余是整个表的基本数据,其余数据都是从这四个基本数据相加而得的,这种资料是两数据都是从这四个基本数据相加而得的,这种资料是两组两分类资料,称为四格表组两分类资料,称为四格表(fourfold table),亦称,亦称22表表(22 table)。表表
4、两独立样本率比较的四格表两独立样本率比较的四格表无效假设无效假设H0为为 1=2,即两种药物治疗消化道溃疡的愈即两种药物治疗消化道溃疡的愈合率相同,两样本的愈合率的差别仅有抽样误差所致。合率相同,两样本的愈合率的差别仅有抽样误差所致。由于此时总体情况未知,故用样本合计愈合率对总体愈由于此时总体情况未知,故用样本合计愈合率对总体愈合率进行估计,即合率进行估计,即H0为为1=2=68.05,在此基础上,在此基础上,可以推算每个格子的期望频数,称为理论频数可以推算每个格子的期望频数,称为理论频数(actual frequency),用符号,用符号T表示;从样本观察到的频数称为表示;从样本观察到的频数
5、称为实际频数实际频数(theoretical frequency),用符号,用符号A表示。表示。若若H0成立,则理论上:成立,则理论上:奥美拉唑奥美拉唑组愈合人数:组愈合人数:奥美拉唑奥美拉唑组未愈合人数组未愈合人数:雷尼替丁雷尼替丁组愈合人数:组愈合人数:雷尼替丁雷尼替丁组未愈合人数:组未愈合人数:为相应行的合计为相应行的合计 为相应列的合计为相应列的合计 n 为总例数。为总例数。表表1 两药治疗消化道溃疡两药治疗消化道溃疡4周后疗效周后疗效 检验的基本公式检验的基本公式:从基本公式可以看出,从基本公式可以看出,统计量值反映了实际频数和理统计量值反映了实际频数和理论频数的吻合程度。如果假设检
6、验论频数的吻合程度。如果假设检验H0(1=2)成立,则成立,则实际频数和理论频数之差一实际频数和理论频数之差一 般不会相差太大,般不会相差太大,值相值相应也不会太大应也不会太大;反之反之,实际频数和理论频数之差相差,实际频数和理论频数之差相差很大,则很大,则 值相应也会很大,相应的值相应也会很大,相应的P值也就越小,当值也就越小,当P,则有理由认为无效假设不成立,继而拒绝,则有理由认为无效假设不成立,继而拒绝H H0,作出统计推断作出统计推断。由由 统计量的公式统计量的公式(11.2)可以看出,可以看出,格,格子数越多,非负数之和,则卡方值越大,即卡方值的子数越多,非负数之和,则卡方值越大,即
7、卡方值的大小除了与大小除了与A与与T的差别大小有关外,还与格子数量的差别大小有关外,还与格子数量有关。因而考虑卡方值大小的同时,应同时考虑格子有关。因而考虑卡方值大小的同时,应同时考虑格子数的多少。引入自由度数的多少。引入自由度v。式中,式中,k为格子数,为格子数,s为估计的参数个数,为估计的参数个数,R为行数,为行数,C为列数。为列数。如本例中,如本例中,4个格子,估计甲乙两药的有效率,则个格子,估计甲乙两药的有效率,则k=4,s=2,v=4-1-2=(2-1)(2-1)=1。分布是一种连续型随机变量的概率分布。分布是一种连续型随机变量的概率分布。如果如果Z服从标准正态分布,那么服从标准正态
8、分布,那么Z2服从自由度为服从自由度为1的的 分分布,其概率密度在布,其概率密度在(0,+)区间上表现为区间上表现为L型,取较小型,取较小值的可能性较大,取较大值的可能性较小。值的可能性较大,取较大值的可能性较小。设有设有v 个相互独立的标准正态分布随机变量个相互独立的标准正态分布随机变量Z1,Z2,Zv,则则 的分布称为自由度为的分布称为自由度为v的的 分布分布,记为记为 。分布的形状依赖于自由度分布的形状依赖于自由度v的大小,当自由度的大小,当自由度v1时,时,随着随着v的增加,曲线逐渐趋于对称,当自由度的增加,曲线逐渐趋于对称,当自由度v趋于趋于 时,时,分布逼近正态分布。各种自由度的分
9、布逼近正态分布。各种自由度的 分布右侧尾分布右侧尾部面积为部面积为 时的临界值记为时的临界值记为 ,列于,列于附表附表8。二、二、2222列联表资料的列联表资料的 检验。检验。(一一)22列联表资料列联表资料 检验的步骤检验的步骤 现以例现以例1说明说明22列联表资料列联表资料 检验的步骤检验的步骤 建立假设建立假设 H0:12 H1:12 确定检验水准确定检验水准 =0.05 计算统计量计算统计量 值值 确定确定P值值 自由度自由度(行数行数1)(列数列数1)(21)(21)1,查查 界值表得界值表得P0.05。下结论下结论 因为因为P0.05,按按=0.05的水准,拒绝的水准,拒绝H0,接
10、受接受H1,差异差异有统计学意义。即可有统计学意义。即可认为认为两药治疗消化两药治疗消化 道溃道溃 疡的愈合率疡的愈合率有有差别,差别,其中其中奥美拉唑奥美拉唑的的愈合率比雷愈合率比雷 尼替丁愈合率尼替丁愈合率高。高。(二二)四格表的专用公式四格表的专用公式 a、b、c、d 分别为四格表中的四个实际频数,分别为四格表中的四个实际频数,n为总为总 例数。例数。本例:本例:(三三)四格表四格表 统计量的连续性校正统计量的连续性校正1.当当n40,且,且T5时,不须校正,直接用基本公式时,不须校正,直接用基本公式 (8-2)或专用公式或专用公式(8-3)计算。计算。2.任一格子的任一格子的1T5,且
11、,且n40时,需计算校正时,需计算校正 值,值,或使用四格表的确切概率法。或使用四格表的确切概率法。3.任一格子的任一格子的T1或或n40,故应计算校正的卡方值。故应计算校正的卡方值。确定确定P值值 自由度自由度(行数行数1)(列数列数1)(21)(21)1,查查 界值表得界值表得P0.05。下结论下结论 因为因为P0.05,按,按=0.05的水准,还不拒绝的水准,还不拒绝H0,即,即 差异没有统计学意义。即还不能认为两药治疗下差异没有统计学意义。即还不能认为两药治疗下 呼吸道感染的有效率有差别。呼吸道感染的有效率有差别。注意:如果本例不校正,直接用公式注意:如果本例不校正,直接用公式(8-2
12、)计算计算 值,值,则,则P0.05。下结论下结论 因为因为P0.05,按,按=0.05的水准,不拒绝的水准,不拒绝H0,差,差 异无统计学意义。尚不能认为甲、乙两疗法对小异无统计学意义。尚不能认为甲、乙两疗法对小 儿单纯性消化不良的治愈率不等。儿单纯性消化不良的治愈率不等。三、三、RCRC列联表资料的列联表资料的 检验。检验。当基本数据的行数或列数大于当基本数据的行数或列数大于2时,统称为行时,统称为行 列表或列表或R C表。表。R C表的表的 检验主要用于多个样本率检验主要用于多个样本率(或构成比或构成比)的比的比较。较。行行 列资料列资料 检验的专用公式检验的专用公式n为总例数,为总例数
13、,A为每个格子的实际频数,为每个格子的实际频数,nR为与为与A同同 行的行合计,行的行合计,nC为与为与A同列的列合计。同列的列合计。(一一)多个样本率的比较多个样本率的比较例3 某研究者欲比较某研究者欲比较A、B、C 三种方案治疗轻、中度三种方案治疗轻、中度高血压的疗效,将年龄在高血压的疗效,将年龄在5070岁的岁的240例轻、中度高血例轻、中度高血压患者随机等分为压患者随机等分为3组,分别采用三种方案治疗。一个组,分别采用三种方案治疗。一个疗程后观察疗效,结果见表疗程后观察疗效,结果见表11.4。问三种方案治疗轻、。问三种方案治疗轻、中度高血压的有效率有无差别?中度高血压的有效率有无差别?
14、表表3 三种方案治疗轻、中度高血压的效果三种方案治疗轻、中度高血压的效果 建立假设建立假设 H0:123 H1:三种方案治疗轻、中度高血压的有效率不等或三种方案治疗轻、中度高血压的有效率不等或 不全等不全等 确定检验水准确定检验水准 =0.05 计算统计量计算统计量 值值 确定确定P值值 (31)(21)2,查,查 界界值表得值表得P0.01。下结论下结论 因为因为P0.01,按,按=0.05的水准,拒绝的水准,拒绝H0,接受,接受 H1,差异有统计学意义。即可认为三种方案治疗轻、,差异有统计学意义。即可认为三种方案治疗轻、中度高血压的有效率不等或不全等中度高血压的有效率不等或不全等例例 某市
15、重污染区、一般污染区和农村的出生婴儿的致某市重污染区、一般污染区和农村的出生婴儿的致畸情况如下表,问三个地区的出生婴儿的致畸率有无差畸情况如下表,问三个地区的出生婴儿的致畸率有无差别?别?表表 某市三个地区出生婴儿的致畸率比较某市三个地区出生婴儿的致畸率比较 建立假设建立假设 H0:123 H1:1,2,3之间不等或不全等。之间不等或不全等。确定检验水准确定检验水准 =0.05 计算统计量计算统计量 值值 确定确定P值值 (31)(21)2,查,查 界值表得界值表得P0.01。下结论下结论 因为因为P0.01,按,按=0.05的水准,拒绝的水准,拒绝H0,接受,接受 H1,差异有统计学意义。即
16、可认为三个地区的出,差异有统计学意义。即可认为三个地区的出 生婴儿的致畸率有差别。生婴儿的致畸率有差别。例例 为研究某镇痛药的不同剂量镇痛效果是否有差别,研为研究某镇痛药的不同剂量镇痛效果是否有差别,研 究人员在自愿的原则下,将条件相似的究人员在自愿的原则下,将条件相似的53名产妇随机分成名产妇随机分成 三组,分别按三种不同剂量服用该药,镇痛效果如下表。三组,分别按三种不同剂量服用该药,镇痛效果如下表。试分析该药不同剂量的镇痛效果有无差别?试分析该药不同剂量的镇痛效果有无差别?表表 某药不同剂量的镇痛效果某药不同剂量的镇痛效果 建立假设建立假设 H0:三种剂量的镇痛效果相同:三种剂量的镇痛效果
17、相同 H1:三种剂量的镇痛效果不同或不全相同:三种剂量的镇痛效果不同或不全相同 确定检验水准确定检验水准 =0.05 计算统计量计算统计量 值值 确定确定P值值 (31)(21)2,查,查 界值表得界值表得P0.05。下结论下结论 因为因为P0.05。下结论下结论 因为因为P0.05,按,按=0.05的水准,还不拒绝的水准,还不拒绝H0,差异没有统计学意义。即尚不能认为甲、乙两县差异没有统计学意义。即尚不能认为甲、乙两县 应住院者未住院原因总体构成比分布不同。应住院者未住院原因总体构成比分布不同。例5 1986年某地城市和农村年某地城市和农村20至至40岁已婚妇女避孕岁已婚妇女避孕 方法情况如
18、下方法情况如下表表5,试分析该地城市和农村避孕方法试分析该地城市和农村避孕方法 的的总体构成分布总体构成分布有无差别?有无差别?表表5 某地城市和农村已婚妇女避孕方法情况某地城市和农村已婚妇女避孕方法情况 建立假设建立假设 H0:城市和农村已婚妇女避孕方法的总体分布相同:城市和农村已婚妇女避孕方法的总体分布相同 H1:城市和农村已婚妇女避孕方法的总体分布不全同:城市和农村已婚妇女避孕方法的总体分布不全同 确定检验水准确定检验水准 =0.05 计算统计量计算统计量 值值 确定确定P值值 (21)(41)3,查,查 界值表得界值表得P0.01。下结论下结论 因为因为P0.05。下结论下结论 因为因
19、为P0.05,按,按=0.05的水准,不拒绝的水准,不拒绝H0,差,差 异无统计学意义。尚不能认为急性与慢性白血病异无统计学意义。尚不能认为急性与慢性白血病 患者的构成比不相同。患者的构成比不相同。行行列表检验时的注意事项列表检验时的注意事项 l计算计算 2 2值时,只能用绝对数,不能用相对数值时,只能用绝对数,不能用相对数l 2 2检检验验要要求求理理论论频频数数不不宜宜太太小小,一一般般认认为为行行列列表表中中不不宜宜有有1/51/5以以上上格格子子的的理理论论频频数数小小于于5,5,或或有有一一个个理理论论频数小于频数小于1 1。l关于单向有序行列表的统计处理。关于单向有序行列表的统计处
20、理。l当当多多个个样样本本率率(或或构构成成比比)比比较较的的检检验验,结结论论为为拒拒绝绝检检验验假假设设,只只能能认认为为各各总总体体率率(或或总总体体构构成成比比)之之间间总总的的说说来来有差别有差别,但不能说明它们某两者间有差别。但不能说明它们某两者间有差别。理论频数太小有三种处理办法理论频数太小有三种处理办法l增加样本例数以增大理论频数。增加样本例数以增大理论频数。l删去上述理论频数太小的行或列。删去上述理论频数太小的行或列。l将将太太小小理理论论频频数数所所在在行行或或列列与与性性质质相相近近的的邻邻行行邻邻列列中的实际频数合并中的实际频数合并,使重新计算的理论频数增大。使重新计算
21、的理论频数增大。单向有序行列表的统计处理单向有序行列表的统计处理l当当效效应应按按强强弱弱(或或优优劣劣)分分为为若若干干个个级级别别,比比如如分分为为-、+、+、+、+等等6个个等等级级,在在比比较较各各处处理理组的效应有无差别时组的效应有无差别时,宜用第宜用第12章的秩和检验法。章的秩和检验法。l如如作作 2 检检验验只只说说明明各各处处理理组组的的效效应应在在构构成成比比上上有有无无差异。差异。多个样本率的两两比较多个样本率的两两比较l当多个样本率当多个样本率(或构成比或构成比)比较的检验比较的检验,结论为拒绝检结论为拒绝检验假设验假设,只能认为各总体率只能认为各总体率(或总体构成比或总
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 卫生 统计学 检验 ppt 课件
限制150内