卫生统计学 卡方检验.ppt
《卫生统计学 卡方检验.ppt》由会员分享,可在线阅读,更多相关《卫生统计学 卡方检验.ppt(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、率或构成比的比较及率或构成比的比较及分类变量资料的关联性分析分类变量资料的关联性分析 第第 九九 章章Dec 1,2009第一节 样本率和总体率的比较一、直接计算概率法一、直接计算概率法例例91 根据以往经验,新生儿染色体异根据以往经验,新生儿染色体异常率一般为常率一般为1,某医院观察了当地,某医院观察了当地400名名新生儿,只有新生儿,只有l例染色体异常,问该地新例染色体异常,问该地新生儿染色体异常率是否低于一般生儿染色体异常率是否低于一般?Dec 1,2009H0:=0.01H1:0.05,按,按=0.05水准尚不水准尚不能拒绝能拒绝H0,尚不能认为该地新生儿染,尚不能认为该地新生儿染色体
2、异常率低于一般。色体异常率低于一般。Dec 1,2009二、正态近似法二、正态近似法 当当n较大,总体率较大,总体率 既不接近既不接近0也不也不接近接近1,n 和和n(1)均大于均大于5,二,二 项分布近似正态分布,利用正态分项分布近似正态分布,利用正态分布的原理,计算检验统计量布的原理,计算检验统计量u值作假值作假设检验。设检验。Dec 1,2009例例92 已知一般人群中慢性支气已知一般人群中慢性支气管炎患病率为管炎患病率为9.7%,现调查了,现调查了500名吸烟者,其中有名吸烟者,其中有95人患慢性支气人患慢性支气管炎,试推断吸烟人群中慢性支气管炎,试推断吸烟人群中慢性支气管炎患病率是否
3、比一般人群高?管炎患病率是否比一般人群高?Dec 1,2009H0:=0H1:0 单侧单侧=0.05本例本例n=500,X=95,p=0.19,0=0.097,得:得:因单因单u0.05=1.64,uu0.05,pu0.05/2,P0.05,所以拒绝所以拒绝H0。Dec 1,2009第三节第三节 完全随机设计两样本率完全随机设计两样本率 比较的比较的 2检验检验满足正态性满足正态性条件条件无正态无正态性要求性要求Dec 1,2009例例94 叙述见例叙述见例93,将上述资料整理,将上述资料整理成表格如下:成表格如下:表表91 某市某市2000年城乡居民的两周患病率年城乡居民的两周患病率Dec
4、1,2009 2检验的基本思想检验的基本思想 一、四格表资料的一、四格表资料的 2检验检验组别组别阳性数阳性数阴性数阴性数合计合计I组组aba+b=n1.II组组cdc+d=n2.合计合计a+c=n.1b+d=n.2a+b+c+d=nDec 1,2009 基本步骤基本步骤H0:城乡居民的两周总体患病率相同:城乡居民的两周总体患病率相同即即 1 1 2 2 H1:城乡居民的两周总体患病率不同城乡居民的两周总体患病率不同即即 1 1 2 2,0.050.051、建立假设、建立假设Dec 1,2009 2、实际频数与理论频数的差值服从、实际频数与理论频数的差值服从 2分布:分布:计算计算 2值的基本
5、公式:值的基本公式:(R1)()(C1)3、查表,判断结果,下结论。查表,判断结果,下结论。Dec 1,2009A:actual value 实际数实际数T:theoretical value 理论数理论数Dec 1,2009如何求各个格子的理论数T?H0:1 2 理论数理论数T为假设的总合计率已知的条件下,为假设的总合计率已知的条件下,所估计的理论频数,在目前的情况下,将所估计的理论频数,在目前的情况下,将样本现有的合计患病率作为总合计率样本现有的合计患病率作为总合计率 的最的最佳估计,即佳估计,即17.69%Dec 1,2009城区理论两周患病频数为 17.69%660=230 660/1
6、300=116.77城区理论两周非患病频数为82.31%660=1070 660/1300=543.33农村理论两周患病频数为 17.69%640=230 640/1300=113.23农村理论两周非患病频数为82.31%640=1070 640/1300=526.77理论频数理论频数TRC的计算公式为:的计算公式为:TRCnRnC/nDec 1,2009 H0:该市城乡居民的两周总体患病率相同,:该市城乡居民的两周总体患病率相同,1=2H1:该市城乡居民的两周总体患病率率不同,:该市城乡居民的两周总体患病率率不同,12 =0.05查附表查附表12可知,可知,=1时,时,本例,本例 ,按照,按
7、照=0.05的检验水准,拒绝的检验水准,拒绝H0假假设,接受设,接受H1假设。即该市城乡居民的总体两周患病假设。即该市城乡居民的总体两周患病率不同。根据现有资料看出,农村的患病率高于城率不同。根据现有资料看出,农村的患病率高于城区。区。Dec 1,2009基本思想当当H0为真时,一般情况下,两样本率不会为真时,一般情况下,两样本率不会相差太大,相应的理论频数相差太大,相应的理论频数(T)和实际频数和实际频数(A)相差也不会太大,当相差也不会太大,当T和和A相差较大时,相差较大时,超出了实际误差范围,就有理由怀疑超出了实际误差范围,就有理由怀疑H0的的成立。成立。Dec 1,2009Dec 1,
8、2009 2 2分布曲线图的特点分布曲线图的特点1 1 与与u u、t t、F F分布一样,分布一样,2 2 分布是一分布是一个连续型的分布,只有一个参数个连续型的分布,只有一个参数 决决定它的形状;定它的形状;2 2 越大,曲线趋于对称,越大,曲线趋于对称,2 2 分布趋向正态分布;分布趋向正态分布;3 3 卡方图形的面积分布有规律性,卡方图形的面积分布有规律性,记为自由度为记为自由度为 时,时,2 2 分布曲线分布曲线下右侧尾部面积为下右侧尾部面积为时时 2 2 的界值;的界值;4 4 2 值反映了理论频数和实际频数值反映了理论频数和实际频数的吻合程度;的吻合程度;Dec 1,2009二、
9、四格表的专用公式二、四格表的专用公式对于四格表资料,通过推导可将式对于四格表资料,通过推导可将式94转换转换成四格表的专用公式:成四格表的专用公式:组别组别阳性数阳性数阴性数阴性数合计合计I组组aba+b=n1.II组组cdc+d=n2.合计合计a+c=n.1b+d=n.2a+b+c+d=nDec 1,2009表表92 某市某市2000年城乡居民的两周患病率年城乡居民的两周患病率分组两周患病合计有无城区90(a)570(b)660(a+b)农村140(c)500(d)640(a+c)合并230(a+c)1070(b+d)1300(n)Dec 1,2009 分分类类资资料料为为间间断断的的,不不
10、连连续续分分布布。故故计计算算的的 2值值不不连连续续,对对于于四四格格表表资资料料来来说说,当当n40,且且有有1T5T5时,求求出出的的概概率率可可能能偏偏小小,因因此此需需进进行连续性校正:行连续性校正:三、三、四格表资料校正四格表资料校正 1.2值的校正值的校正x1、x2xkN(,2 2)Dec 1,2009 2、四格表、四格表 2检验的条件检验的条件(1)当)当n40,且每个格子的理论频且每个格子的理论频数数T5 时,可用基本公式:时,可用基本公式:Dec 1,2009注注:对对于于两两个个率率的的比比较较,2检检验验和和检检验验是是等价的,等价的,22。(3)T1或或n40时,需用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 卫生统计学 卡方检验 卫生 统计学 检验
限制150内