《列联表的独立性检验.ppt》由会员分享,可在线阅读,更多相关《列联表的独立性检验.ppt(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2.5 列联表的独立性检验列联表的独立性检验一、二维 列联表列表如下:令:吸烟与肺癌列联表吸烟与肺癌列联表患肺癌患肺癌不患肺癌不患肺癌总计总计吸烟吸烟606032329292不吸烟不吸烟3 311111414总计总计63634343106106为了调查吸烟是否对肺癌有影响,对为了调查吸烟是否对肺癌有影响,对6363位位肺癌患者及肺癌患者及4343位非患者位非患者(对照组)调查了对照组)调查了其中的吸烟人数其中的吸烟人数.2 22 2列列联表联表二、二维 列联表的独立性检验列表如下:称为称为Pearson 统计量统计量检验统计量检验统计量例1 随机抽取某校男生35名,女生31,进行体育达标考核,
2、结果如下表 问体育达标水平是否与性别有关?体育达标考核情况表体育达标考核情况表达达 标标 未未 达达 标标 合合 计计 男男 1515 2020 3535 女女 1313 1818 3131合合 计计 2828 3838 6666体育达标水平与性别无关体育达标水平与性别有关(1 1)建立假设)建立假设其结论为:体育达标水平与性别无关.因此在0.05显著性水平下,接受原假设.R函数函数chisq.test()xchisq.test(x,correct=F)R R程序如下程序如下输出结果为输出结果为 Pearsons Chi-squared testdata:x X-squared=0.0057,
3、df=1,p-value=0.9397因此在0.05显著性水平下,接受原假设.92页例页例2.14自己看自己看2.5.2 Fisher精确检验不满足时,用Pearson近似效果很差,一般采用Fisher精确检验.在使用Pearson 独立性检验时,要注意格子的期望频数小于5的格子数不超过总格子数的20%,且没有一个格子的期望频数小于1Fisher精确检验对于单元频数小的表格特别适用四表格的Fisher精确检验频数四表格合计对应的概率四表格1合计假设边缘频数固定分别服从二项分布表示有属性A的个体中有属性B的条件概率表示没有属性A的个体中有属性B的条件概率则属性A和属性B相互独立即有属性A的个体中
4、有属性B的个体的频率与没有属性A的个体中有属性B的个体的频率应该没有显著的差异.即有表示有属性A的个体中有属性B的比例高表示有属性A的个体中有属性B的比例低即即四表格的检验问题,即属性A和B的独立性检验问题有FisherFisher精确检验的统计量精确检验的统计量假设边缘频数都固定事实上,确定了,其它三个值也就确定了则 有下面四种取值2 3 3 2 4 1 5 02 3 3 2 4 1 5 03 0 2 1 1 2 0 33 0 2 1 1 2 0 3利用公式可以计算出 取2,3,4,5的概率在独立的原假设下,取这些值的概率是不同的,但各种取值都不会是小概率事件,过大或过小都可能拒绝原假设拒绝
5、域形式为Fisher精确检验的计算比较复杂,所以一般用于n比较小的四表格.例:为了解某种新药的疗效是否提高,将42位病人随机分组注射两种药物,试验结果如下表所示药物 有效无效合计新8210旧141832合计 222042R R程序如下程序如下新药疗效没有提高新药疗效有提高 xfisher.test(x,alternative=greater)输出结果为输出结果为Fishers Exact Test for Count Data data:x p-value=0.04849p-value=0.04849 alternative hypothesis:true odds ratio is grea
6、ter than 1 95 percent confidence interval:1.010589 Inf sample estimates:odds ratioodds ratio 4.950963拒绝原假设,认为备则假设成立.优势比优势比优势比:优势比:属性A时,有属性B与没有属性B的优势.称条件概率与之比为当个体有为当个体没有属性A时,有属性B与没有属性B的优势,称这两个优势的比为优势比下列结论成立:如果在有属性A的个体中有B的比例高,则优比OR1;如果在有属性A的个体中有B的比例低,则优比OR1如果属性A和属性B相互独立,则优比OR=1.优势比大于1与新药较旧药疗效有提高等价.三、三
7、维 列联表关于某项政策调查所得结果关于某项政策调查所得结果观点:赞成观点:不赞成低收入中等收入高收入低收入中等收入高收入男201055810女25157279大致可以看出女性赞成的多,低收入赞成的多大致可以看出女性赞成的多,低收入赞成的多三维 列联表观点赞成低收入中等收入高收入男202015女25157观点不赞成低收入中等收入高收入男5810女279性别男低收入中等收入高收入赞成201015不赞成5810性别女低收入中等收入高收入赞成25157不赞成279低收入中等收入高收入男252825女272216 低收入中等收入高收入赞成201015不赞成5810是是否否收入的收入的“低低”、“中中”、
8、“高高”用代码用代码1 1、2 2、3 3代表;代表;性别的性别的“女女”、“男男”用代码用代码0 0、1 1代表;代表;观点观点“赞成赞成”和和“不赞成不赞成”用用1 1、0 0代表。代表。有些计算机数据对于这些代码的形式不限(可以有些计算机数据对于这些代码的形式不限(可以是数字,也可以是字符串)。是数字,也可以是字符串)。七七.在在SPSSSPSS数据表中的形式数据表中的形式表是二维的,用变量和样本值表示表是二维的,用变量和样本值表示先将定性变量数量化:先将定性变量数量化:小小 结结 1.1.非非参参数数检检验验在在假假设设检检验验中中不不对对参参数数作作明明确确的的推推断断,也也不不涉涉
9、及及样样本本取取自自何何种种分分布布的的总总体体。它它的的适适用用范范围围较较广广。常常用用的的非非参参方方法法较较为为简简便便。易易于于理理解解掌掌握握。当当资资料料适适用用参参数数检检验验方方法法时时,用非参常会损失部分信息,降低检验效能。用非参常会损失部分信息,降低检验效能。2.2.2.2.秩秩秩秩和和和和检检检检验验验验是是是是通通通通过过过过对对对对数数数数据据据据依依依依小小小小到到到到大大大大排排排排列列列列秩秩秩秩次次次次,求求求求秩秩秩秩和和和和来来来来进进进进行行行行假假假假设设设设检检检检验验验验的的的的方方方方法法法法,可可可可用用用用于于于于两两两两独独独独立立立立样样样样本本本本比比比比较较较较、配配配配对对对对资资资资料料料料比比比比较较较较、多多多多个个个个独独独独立立立立样样样样本本本本比较、分组设计的比较等。比较、分组设计的比较等。比较、分组设计的比较等。比较、分组设计的比较等。
限制150内