独立性检验.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《独立性检验.ppt》由会员分享,可在线阅读,更多相关《独立性检验.ppt(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1.2 1.2 独立性检验的基本思想及其初步应用独立性检验的基本思想及其初步应用 在统计学中,独立性检验就是检验两个分类变量是在统计学中,独立性检验就是检验两个分类变量是否有关系的一种统计方法。否有关系的一种统计方法。 所谓所谓“分类变量分类变量”,就是指个体所属的类别不同,也,就是指个体所属的类别不同,也称为称为属性变量属性变量或或定型变量定型变量。 在日常生活中,我们常常关心两个分类变量之间是在日常生活中,我们常常关心两个分类变量之间是否有关系,例如吸烟是否与患肺癌有关系?性别是否对否有关系,例如吸烟是否与患肺癌有关系?性别是否对于喜欢数学课程有影响等等。于喜欢数学课程有影响等等。 吸烟与
2、患肺癌列联表吸烟与患肺癌列联表患肺癌患肺癌不患肺癌不患肺癌总计总计吸烟吸烟49492099209921482148不吸烟不吸烟42427775777578177817总计总计91919874987499659965为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了地调查了99659965人,得到如下结果(单位:人)人,得到如下结果(单位:人)列联表列联表2 22 2在不吸烟者中患肺癌的比重是在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是在吸烟者中患肺癌的比重是 0.54%0.54%2.28%2.28%1)通过图形直观判断通过图形直观判断三
3、维柱三维柱状图状图2) 通过图形直观判断通过图形直观判断二维二维条形图条形图3)通过图形直观判断通过图形直观判断患肺癌患肺癌比例比例不患肺癌不患肺癌比例比例等高等高条形图条形图问题1:判断的标准是什么?吸烟与不吸烟,患病的可能性的大小是否有差异?说明:吸烟者和不吸烟者患肺癌的可能性存在差异,说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大吸烟者患肺癌的可能性大问题2:差异大到什么程度才能作出“吸烟与患病有关”的判断?问题3:能否用数量刻画出“有关”的程度? 独立性检验H H0 0: 吸烟吸烟和和患肺癌患肺癌之间之间 没有关系没有关系 通过数据和图表分析,得到通过数据和图表分
4、析,得到结论是:结论是:吸烟与患肺癌有关吸烟与患肺癌有关结论的可靠结论的可靠程度如何?程度如何? 吸烟与患肺癌列联表吸烟与患肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟a ab ba+ba+b吸烟吸烟c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+dacac,a+bc+da+bc+d a c+d c a+b , a c+d c a+b ,adbc吸烟的人中不患肺癌的比例:吸烟的人中不患肺癌的比例:baa不吸烟的人中不患肺癌的比例:不吸烟的人中不患肺癌的比例:dcc若若H H0 0成立成立0.adbcad-bc 越小,说明吸烟与患肺癌之间的关系越弱
5、,ad-bc 越小,说明吸烟与患肺癌之间的关系越弱,ad-bc 越大,说明吸烟与患肺癌之间的关系越强ad-bc 越大,说明吸烟与患肺癌之间的关系越强引入一个随机变量:引入一个随机变量:卡方统计量卡方统计量作为检验在多大程度上可以认为作为检验在多大程度上可以认为“两个变量两个变量有关系有关系”的标准的标准 。dcban其中dbcadcbabcadnK22通过公式计算通过公式计算 吸烟与患肺癌列联表吸烟与患肺癌列联表患肺癌患肺癌不患肺癌不患肺癌总计总计吸烟吸烟49492099209921482148不吸烟不吸烟42427775777578177817总计总计91919874987499659965
6、632.569198742148781720994249777599652k已知在已知在 成立的情况下,成立的情况下,0H故有故有99%99%的把握认为的把握认为H H0 0不成立,即有不成立,即有99%99%的把的把握认为握认为“患肺癌与吸烟有关系患肺癌与吸烟有关系”。即在即在 成立的情况下,成立的情况下, 大于大于6.6356.635概率非常小,概率非常小,近似为近似为0.0100.0100H2K现在的现在的 =56.632=56.632的观测值远大于的观测值远大于6.6356.635,出现这样的观测值的概率不超过出现这样的观测值的概率不超过0.0100.010。k010.0)635.6(
7、2KPa+b+c+da+b+c+db+db+da+ca+c总计总计c+dc+dd dc ca+ba+bb ba a总计总计一般地,对于两个分类变量一般地,对于两个分类变量X X和和Y Y。X X有两类取值:有两类取值:即类即类 和和 (如吸烟与不吸烟);(如吸烟与不吸烟);Y Y也有两类取值:也有两类取值:即类即类 和和 (如患病与不患病)。于是得到下列样(如患病与不患病)。于是得到下列样本频数的本频数的2 22 2列联表为:列联表为:x1x2y2y1y1y2x1x2 用卡方统计量来确定在多大程度上可以认为用卡方统计量来确定在多大程度上可以认为“两个分类变量有关系两个分类变量有关系”的方法称为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 独立性 检验
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内