2019年数学新同步湘教版必修2第8章 8.4 列联表独立性分析案例.doc
《2019年数学新同步湘教版必修2第8章 8.4 列联表独立性分析案例.doc》由会员分享,可在线阅读,更多相关《2019年数学新同步湘教版必修2第8章 8.4 列联表独立性分析案例.doc(13页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、84列联表独立性分析案例列联表独立性分析案例 读教材读教材 填要点填要点 1列联表列联表一般地,对于两个一般地,对于两个因素因素 X 和和 Y,X 的两个的两个水平水平取值:取值:A 和和 (如吸烟和不吸烟如吸烟和不吸烟),Y 也有也有A两个两个水平水平取值:取值:B 和和 (如患肺癌和不患肺癌如患肺癌和不患肺癌),我们得到下表中的抽样数据,这个表格称为,我们得到下表中的抽样数据,这个表格称为B22 列联表列联表.YXBB合计合计AababAcdcd合计合计acbdabcd22的求法的求法公式公式 2.n adbc 2 ab cd ac bd 3独立性检验的概念独立性检验的概念用用随机变量随机
2、变量 2研究两变量是否有关的方法称为独立性检验研究两变量是否有关的方法称为独立性检验4独立性检验的步骤独立性检验的步骤要判断要判断“X 与与 Y 有关系有关系” ,可按下面的步骤进行:,可按下面的步骤进行:(1)提出假设提出假设 H0:X 与与 Y 无关无关;(2)根据根据 22 列联表及列联表及 2公式,计算公式,计算 2的值;的值;(3)查对临界值,作出判断查对临界值,作出判断其中临界值如表所示:其中临界值如表所示:P(2x0)0.500.400.250.150.100.050.0250.0100.0050.001x00.4550.7081.3232.0722.7063.8415.0246
3、.6357.87910.828表示在表示在 H0成立的情况下,事件成立的情况下,事件“2x0”发生的概率发生的概率5变量独立性判断的依据变量独立性判断的依据(1)如果如果 210.828 时,就有时,就有 99.9%的把握认为的把握认为“X 与与 Y 有关系有关系” ;(2)如果如果 26.635 时,就有时,就有 99%的把握认为的把握认为“X 与与 Y 有关系有关系” ;(3)如果如果 22.706 时,就有时,就有 90%的把握认为的把握认为“X 与与 Y 有关系有关系” ;(4)如果如果 22.706 时,就认为没有充分的证据显示时,就认为没有充分的证据显示“X 与与 Y 有关系有关系
4、” ,但也不能作出结,但也不能作出结论论“H0成立成立” ,即,即 X 与与 Y 没有关系没有关系 小问题小问题 大思维大思维 1利用利用 2进行独立性分析,估计值的准确度与样本容量有关吗?进行独立性分析,估计值的准确度与样本容量有关吗?提示:提示:利用利用 2进行独立性分析,可以对推断的正确性的概率作出估计,样本容量进行独立性分析,可以对推断的正确性的概率作出估计,样本容量 n 越越大,这个估计值越准确如果抽取的样本容量很小,那么利用大,这个估计值越准确如果抽取的样本容量很小,那么利用 2进行独立性检验的结果就进行独立性检验的结果就不具有可靠性不具有可靠性2在在 2运算后,得到运算后,得到
5、2的值为的值为 29.78,在判断因素相关时,在判断因素相关时,P(26.64)0.01 和和P(27.88)0.005,哪种说法是正确的?,哪种说法是正确的?提示:提示:两种说法均正确两种说法均正确P(26.64)0.01 的含义是在犯错误的概率不超过的含义是在犯错误的概率不超过 0.01 的前的前提下认为两因素相关;而提下认为两因素相关;而 P(27.88)0.005 的含义是在犯错误的概率不超过的含义是在犯错误的概率不超过 0.005 的前提的前提下认为两因素相关下认为两因素相关独立性分析的原理独立性分析的原理 例例 1 1 打鼾不仅影响别人休息,而且可能与患某种疾病有关下表是一次调查所
6、得的打鼾不仅影响别人休息,而且可能与患某种疾病有关下表是一次调查所得的数据:数据:患心脏病患心脏病未患心脏病未患心脏病总计总计每一晚都打鼾每一晚都打鼾30224254不打鼾不打鼾241 3551 379总计总计541 5791 633根据列联表的独立性分析,是否有根据列联表的独立性分析,是否有 99%的把握认为每一晚都打鼾与患心脏病有关系?的把握认为每一晚都打鼾与患心脏病有关系? 解解 由列联表中的数据,得由列联表中的数据,得 2的值为的值为268.0336.635.1 633 30 1 355224 24 2254 1 379 54 1 579因此,有因此,有 99%的把握认为每一晚打鼾与患
7、心脏病有关系的把握认为每一晚打鼾与患心脏病有关系解决一般的独立性分析问题,首先由所给解决一般的独立性分析问题,首先由所给 22 列联表确定列联表确定 a,b,c,d,abcd的值,然后代入随机变量的计的值,然后代入随机变量的计算公式求出观测值算公式求出观测值 2,将,将 2与临界值与临界值 x0进行对比,确定有多大的把握认为两个分类变进行对比,确定有多大的把握认为两个分类变量有关系量有关系1某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,经过调查得到如下列联表:经过调查得到如下列联表:积极支持积极支
8、持企业改革企业改革不太支持不太支持企业改革企业改革总计总计工作积极工作积极544094工作一般工作一般326395总计总计86103189根据列联表的独立性分析,是否有根据列联表的独立性分析,是否有 99%的把握认为工作态度与支持企业改革之间有关的把握认为工作态度与支持企业改革之间有关系?系?解:解:由列联表中的数据,得由列联表中的数据,得210.7596.635,189 54 6340 32 294 95 86 103有有 99%的把握认为工作态度与支持企业改革之间有关系的把握认为工作态度与支持企业改革之间有关系独立性分析的应用独立性分析的应用 例例 2 2 下表是某地区的一种传染病与饮用水
9、的调查表:下表是某地区的一种传染病与饮用水的调查表:得病得病不得病不得病合计合计干净水干净水52466518不干净水不干净水94218312合计合计146684830(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病若饮用干净水得病 5 人,不得病人,不得病 50 人,饮用不干净水得病人,饮用不干净水得病 9 人,不得病人,不得病 22 人按人按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异 解解 (1)假设假设 H0:
10、传染病与饮用水无关把表中数据代入公式,得:传染病与饮用水无关把表中数据代入公式,得 254.21,830 52 218466 94 2146 684 518 312因为当因为当 H0成立时,成立时,210.828 的概率约为的概率约为 0.001,所以我们有所以我们有 99.9%的把握认为该地区这种传染病与饮用不干净水有关的把握认为该地区这种传染病与饮用不干净水有关(2)依题意得依题意得 22 列联表:列联表:得病得病不得病不得病合计合计干净水干净水55055不干净水不干净水92231合计合计147286此时,此时,25.785.86 5 2250 9 214 72 55 31由于由于 5.7
11、852.706,所以我们有,所以我们有 90%的把握认为该种疾病与饮用不干净水有关的把握认为该种疾病与饮用不干净水有关两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有中我们有 99.9%的的把握肯定结论的正确性,把握肯定结论的正确性,(2)中我们只有中我们只有 90%的把握肯定的把握肯定独立性分析的步骤:独立性分析的步骤:要推断要推断“X 与与 Y 是否有关是否有关”可按下面的步骤进行:可按下面的步骤进行:提出统计假设提出统计假设 H0:X 与与 Y 无关;无关;根据根据 22 列联表与列联表与 2计算公式计
12、算出计算公式计算出 2的值;的值;根据两个临界值,作出判断根据两个临界值,作出判断2为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了 361 名高二在名高二在校学生,调查结果如下:理科对外语有兴趣的有校学生,调查结果如下:理科对外语有兴趣的有 138 人,无兴趣的有人,无兴趣的有 98 人,文科对外语有人,文科对外语有兴趣的有兴趣的有 73 人,无兴趣的有人,无兴趣的有 52 人是否有人是否有 90%的把握认为的把握认为“学生选报文、理科与对外语学生选报文、理科与对外语的兴趣有关的兴趣有关”?解:解:根据题目所给的数据得到
13、如下列联表:根据题目所给的数据得到如下列联表:理科理科文科文科总计总计有兴趣有兴趣13873211无兴趣无兴趣9852150总计总计236125361根据列联表中数据由公式计算得随机变量根据列联表中数据由公式计算得随机变量21.871104.361 138 5273 98 2211 150 236 125因为因为 1.8711046.635.200 70 6535 30 2100 100 105 95因此,有因此,有 99%的把握认为的把握认为“注射药物注射药物 A 后的疱疹面积与注射药物后的疱疹面积与注射药物 B 后的疱疹面积有后的疱疹面积有差异差异” 在绘制列联表时,应对问题中的不同数据分
14、成不同的类别,然后列表要注意列联表在绘制列联表时,应对问题中的不同数据分成不同的类别,然后列表要注意列联表中各行、各列中数据的意义及书写格式中各行、各列中数据的意义及书写格式3已知某班已知某班 n 名同学的数学测试成绩名同学的数学测试成绩(单位:分,满分单位:分,满分 100 分分)的频率分布直方图如图的频率分布直方图如图所示,其中所示,其中 a,b,c 成等差数列,且成绩在成等差数列,且成绩在90,10090,100内的有内的有 6 人人(1)求求 n 的值;的值;(2)规定规定 60 分以下为不及格,若不及格的人中女生有分以下为不及格,若不及格的人中女生有 4 人,而及格的人中,男生比女人
15、,而及格的人中,男生比女生少生少 4 人,借助独立性检验分析是否有人,借助独立性检验分析是否有 90%的把握认为的把握认为“本次测试的及格情况与性别有关本次测试的及格情况与性别有关”?附:附:P(2k0)0.100.050.0100.005k02.7063.8416.6357.8792n adbc 2 ab cd ac bd 解:解:(1)依题意得依题意得Error!Error!解得解得 b0.01.因为成绩在因为成绩在90,10090,100内的有内的有 6 人,人,所以所以 n60.60.01 10(2)由于由于 2bac,而,而 b0.01,可得,可得 ac0.02,则不及格的人数为,则
16、不及格的人数为0.02106012,及格的人数为,及格的人数为 601248,设及格的人中,女生有设及格的人中,女生有 x 人,则男生有人,则男生有 x4 人,人,于是于是 xx448,解得,解得 x26,故及格的人中,女生有故及格的人中,女生有 26 人,男生有人,男生有 22 人人于是本次测试的及格情况与性别的于是本次测试的及格情况与性别的 22 列联表如下:列联表如下:及格及格不及格不及格总计总计男男22830女女26430总计总计481260结合列联表计算可得结合列联表计算可得 21.6676.635,所以我们有所以我们有 99%的把握即在犯错误不超过的把握即在犯错误不超过 0.01
17、的前提下认为性别与患色盲有关系的前提下认为性别与患色盲有关系这个结论只对所调查的这个结论只对所调查的 480 名男人和名男人和 520 名女人有效名女人有效1下面是下面是 22 列联表:列联表:y1y2总计总计x1a2173x222527总计总计b46则表中则表中 a,b 的值分别为的值分别为( )A94,96 B52,50C52,54 D54,52解析:解析:选选 C a2173,a52.又又a2b,b54.2下列关于下列关于 2的说法中正确的是的说法中正确的是( )A2在任何相互独立问题中都可以用于检验是否相关在任何相互独立问题中都可以用于检验是否相关B2的值越大,两个事件的相关性越大的值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2019 数学 同步 湘教版 必修 8.4 列联表 独立性 分析 案例
限制150内