统计分类资料的假设检验-卡方检验新.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《统计分类资料的假设检验-卡方检验新.ppt》由会员分享,可在线阅读,更多相关《统计分类资料的假设检验-卡方检验新.ppt(85页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、11 服从二项分布资料的假设检验服从二项分布资料的假设检验2 服从服从Poisson分布资料的假设检验分布资料的假设检验3 检验检验2 第六章第六章 分类资料的假设检验分类资料的假设检验2x2 检验(chi-square test)是以 x2分布为理论依据,用途颇广的假设检验方法。可用于:两个或多个样本率的比较;两个或多个样本构成比的比较;两个分类变量间关联性的检验;有序分组资料的线性趋势检验;频数分布的拟合优度检验。3主要内容主要内容一、一、 检验的基本思想检验的基本思想二、四格表资料的二、四格表资料的 检验检验三、行三、行列表资料的列表资料的 检验检验四、配对四格表资料的四、配对四格表资料
2、的 检验检验五、多个样本率比较的五、多个样本率比较的 分割法分割法六、有序分组资料的线性趋势检验六、有序分组资料的线性趋势检验七、频数分布拟合优度的七、频数分布拟合优度的 检验检验八、四格表资料的八、四格表资料的Fisher确切概率法确切概率法2 2 2 2 2 2 4一、一、 检验的基本思想检验的基本思想 分布的概念 检验的基本思想 P 值的确定 检验的基本检验步骤2 2 2 2 5 1. 分布的概念分布的概念 分布是一种连续型分布(Continuous distribution),v 个相互独立的标准正态变量(standard normal variable) 的平方和称为 变量,其分布即
3、为 分布;自由度(degree of freedom)为v 。2 2 2 2 ),2, 1( iui222212 uuu iiXu卡方检验基本思想卡方检验基本思想6 分布的拓展与应用分布的拓展与应用 1875年,F. Helmet得出:来自正态总体的样本方差的分布服从 分布;1900年K. Pearson又从检验分布的拟合优度(goodness of fit)中也发现了这一相同的 分布,可用于检验资料的实际频数和理论频数是否相符等问题。卡方检验基本思想卡方检验基本思想分布的概念分布的概念2 2 2 2 7 分布的密度函数分布的密度函数2 ,.3 , 2 , 1,0)2()2(21)(22122
4、22ef8卡方检验基本思想卡方检验基本思想分布的概念分布的概念 分布曲线分布曲线2 2 92 卡方检验基本思想卡方检验基本思想分布的概念分布的概念 分布曲线分布曲线2 10 分布的形状依赖于自由度 的大小: 当自由度2时, 曲线呈“L”型; 随着 的增加, 曲线逐渐趋于对称; 当自由度 时, 曲线逼近于正态曲线。2 2 2 2 2 2 卡方检验基本思想卡方检验基本思想分布的概念分布的概念 分布特点分布特点11 分布的分位数分布的分位数 (Percentile)当 确定后, 分布曲线下右侧尾部的面积为 时,横轴上相应的 值,记为 ,如下图。实际应用时,可根据 由 界值表 (percentage
5、points of the distribution )查得。 卡方检验基本思想卡方检验基本思想分布的概念分布的概念2 2 2 2 2 22, 2分布的分位数分布的分位数 2 , PP2,22,2122. 检验的基本思想检验的基本思想(以两个样本率的比较为例以两个样本率的比较为例)例例14 某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将200例颅内压增高症患者随机分为两组,结果如下。问两组降低颅内压的总体有效率有无差别?2 表表 6-1 两组降低颅内压有效率的比较两组降低颅内压有效率的比较 组别组别 有效有效 无效无效 合计合计 有效率(有效率(%) 试验组
6、试验组 99(90.48)a 5(13.52)b 104)(ba 95.20 对照组对照组 75(83.52)c 21(12.48)d 96)(dc 78.13 合计合计 174)(ca 26)(db 200)(n 87.00 卡方检验基本思想卡方检验基本思想13 检验的检验统计量为 ,其基本公式为: 卡方检验基本思想卡方检验基本思想2 2 TTA22)( nnnTCRRC.) 1)(1(列数列数行数行数 应用应用:用于两个或多个样本率(或构成比)的 比较、关联性检验和频数分布拟合优度检验。 143. P 值的确定值的确定 检验时,要根据自由度 查附表9 界值表。 当 时, ,拒绝 H0,接受
7、 H1; 当 时, ,尚无理由拒绝H0 。2 2 卡方检验基本思想卡方检验基本思想2,2 P2,2 P15 检验的基本思想检验的基本思想按H0假设计算各格的理论频数T,用 反映A与T的吻合程度;如果n不太小,T比较大,当H0成立时, 近似服从 =(R-1)(C-1)的 分布。 若 ,则 ,拒绝H0,接受H1; 若 ,则 ,不拒绝H0。TTA2)(2 卡方检验基本思想卡方检验基本思想TTA2)(22,22,2PP164. 检验的检验步骤检验的检验步骤1建立假设,确定检验水准建立假设,确定检验水准 2计算统计量计算统计量 值值 按 检验基本公式计算TRC, 卡方检验基本思想卡方检验基本思想2 2
8、210 :H211 :H05. 0 2 48.90200/17410411T52.1348.9010412T52.8348.9017421T48.1252.132622T17 检验的检验步骤检验的检验步骤3确定确定 P 值,做出统计推断值,做出统计推断以 查 界值表得 。按 检验水准拒绝 H0,接受 H1 ,可以认为两组降低颅内压的总体有效率不等,即异梨醇口服液降低颅内压的总体有效率高于氢氯噻嗪+地塞米松的总体有效率。1) 12)(12 (0050.P050. 2 卡方检验基本思想卡方检验基本思想861248124812215283528375521352135489048909922222.
9、).(.).(.).(.).( 2 18当两样本率比较时,既可用 u 检验也可用 检验来推断两总体率是否有差别,且两种检验方法是等价的;对同一份资料, 。卡方检验基本思想卡方检验基本思想2 22 u19二、四格表资料的二、四格表资料的 检验检验22 应用:应用:四格表资料的 检验用于两个样本率的比较。当n不太小,T 较大时, 服从 =1的 分布。经验认为:n40且T5,可用 。TTA2)(TTA22)(2201. 四格表资料四格表资料 检验的专用公式检验的专用公式 应用:应用:用于两样本率的比较;适用条件适用条件:当总例数n40且所有格子的T5时。用四格表资料 专用公式计算例例14的 值:)(
10、)()()(22dbcadcbanbcad2286122617496104200755219922.)( 2 212. 四格表资料四格表资料 检验的校正公式检验的校正公式应用:应用:用于两样本率的比较。适用条件:适用条件:当n40,但有1T5时。最小理论频数最小理论频数TRC的判断的判断:R 行与C列中,行合计数中的最小值与列合计数中的最小值所对应格子的理论频数最小。TTAc22)5 . 0()()()()2/(22b+da+cc+da+bn|ad-bc|-n=c2 22例例15 某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为2组,结果见表6-2。问2种药
11、物治疗脑血管疾病的有效率是否相等?四格表资料的卡方检验四格表资料的卡方检验校正公式校正公式表表 6-2 两种药物治疗脑血管疾病有效率的比较两种药物治疗脑血管疾病有效率的比较 组组 别别 有效有效 无效无效 合计合计 有效率有效率(%) 胞磷胆碱组胞磷胆碱组 46 6 52 88.46 神经节苷酯组神经节苷酯组 18 8(4.67) 26 69.23 合合 计计 64 14 78 82.05 231建立假设,确定检验水准建立假设,确定检验水准 , ; 2计算统计量计算统计量 值值3确定确定P 值,做出统计推断值,做出统计推断 ,查附表9 界值表得 。按 检验水准不拒绝H0,尚不能认为2种药物治疗
12、脑血管疾病的有效率不等。u本资料若不校正时,本资料若不校正时, , ,结论与之,结论与之相反。相反。四格表资料的卡方检验四格表资料的卡方检验校正公式校正公式210 :H211 :H050. 143146426527827818684622.)/(c 2 1 2 100050.P050. 3542. 050.P24四格表资料的四格表资料的 检验公式的选用检验公式的选用 当n40且所有的T5时, 用 ,或 ; 当 时,改用四格表资料的Fisher确切概率法.四格表资料的卡方检验四格表资料的卡方检验2 PTTA22)( )()()()(dbcadcbanbcad22 25四格表资料的四格表资料的 检
13、验公式的选用检验公式的选用 当n40,但有1T5时, 用 ,或 或用四格表资料的Fisher确切概率法。当 n40,或 T1时,用四格表资料的Fisher确切概率法。四格表资料的卡方检验四格表资料的卡方检验2 TTAc2250 ).( )()()()/(b+da+cc+da+bn|ad-bc|-n=c222 26三、配对四格表资料的三、配对四格表资料的 检验检验应用:应用:计数资料的配对设计常用于2种检验方法、培养方法、诊断方法的比较。特点:特点:对样本中的各观察单位分别用2种方法处理,然后观察2种处理方法的计数结果。 ( test for the data of paired fourfol
14、d table) 2 2 27例例18 某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表6-7。问2种方法的检测结果有无差别?配对四格表卡方检验配对四格表卡方检验表表 6-7 2 种方法的检测结果种方法的检测结果 乳胶凝集法乳胶凝集法 免疫荧光法免疫荧光法 合计合计 11 (a) 12(b) 23 2(c) 33(d) 35 合合 计计 13 45 58 28McNemar test 的检验统计量为 : 当 (b+c)40时, 当 (b+c)40时,配对四格表卡方检验配对四格表卡方检验2 cbcb 22)( 1 cbcbc 22)1( 1 29检
15、验步骤检验步骤 1建立假设,确定检验水准建立假设,确定检验水准 2计算统计量计算统计量 值值 3确定确定P 值,做出统计推断值,做出统计推断 =1,查 界值表得 。按 检验水准拒绝H0,接受H1,可认为两种方法的检测结果不同,免疫荧光法的阳性检测率较高。配对四格表卡方检验配对四格表卡方检验CBH:0CBH:0050. 79521212121222.)(cbcbc 2 2 0250010. P050. 30四、行四、行列表资料的列表资料的 检验检验应用:应用:行列表资料的 检验用于多个样本率的比较、两个或多个构成比的比较、以及双向无序分类资料的关联性检验。其基本数据有以下其基本数据有以下3种情况
16、:种情况: 多个样本率比较时,有R行2列,称R2表; 两个样本的构成比比较时,有2行C列,称 2C表; 多个样本的构成比比较,以及双向无序分类资 料关联性检验时,有R行C列,称RC表。2 2 31行行列表卡方检验列表卡方检验32行行列表卡方检验列表卡方检验33行行列表卡方检验列表卡方检验34行行列表资料列表资料 检验的专用公式:检验的专用公式: 行行列表卡方检验列表卡方检验)1(22 CRnnAn 2 )(1) 1( CR 应用条件:应用条件:行列表中各格的理论频数不应小于1,并且1 T5的格子数不宜超过格子总数的1/5。351. 多个样本率的比较多个样本率的比较 (Comparison of
17、 several rates )例例19 某医师研究物理疗法、药物治疗和外用膏药3种疗法治疗周围性面神经麻痹的疗效,资料见下表。问3种疗法的有效率有无差别? 表表 6-8 3 种疗法治疗周围性面神经麻痹有种疗法治疗周围性面神经麻痹有效效率的比较率的比较 疗疗 法法 有效有效 无效无效 合计合计 有效率(有效率(%) 物理疗法组物理疗法组 199 7 206 96.60 药物治疗组药物治疗组 164 18 182 90.11 外用膏药组外用膏药组 118 26 144 81.94 合合 计计 481 51 532 90.41 行行列表卡方检验列表卡方检验361建立假设,确定检验水准建立假设,确定
18、检验水准 各 不等或不全相等2计算统计量计算统计量 值值3确定确定 P 值,做出统计推断值,做出统计推断以 ,查 界值表得 。按 检验水准拒绝H0,接受H1,可认为3210 :H:1Hi 2 0421151144265120674812061995322222.)( 21213)( 2 0050.P050. 行行列表卡方检验列表卡方检验050. 372. 样本构成比的比较样本构成比的比较(comparison of several proportions)例例20 某医师在研究血管紧张素I转化酶(ACE)基因I/D多态与2型糖尿病肾病(DN)的关系时,将249例2型糖尿病患者按有无糖尿病肾病分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 分类 资料 假设检验 检验
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内