2022年高中数学第一章统计案例1.2独立性检验的基本思想及其初步应用学案新人教A版选修1-2 .pdf
-
资源ID:25456111
资源大小:428.92KB
全文页数:15页
- 资源格式: PDF
下载积分:4.3金币
快捷下载
![游客一键下载](/images/hot.gif)
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
2022年高中数学第一章统计案例1.2独立性检验的基本思想及其初步应用学案新人教A版选修1-2 .pdf
1 12 独立性检验的基本思想及其初步应用独立性检验的有关概念 提出问题 问题 1:观察教材第10 页的探究,其中的频数表叫什么?提示:列联表问题 2:由表中数据,你能说吸烟对患肺癌有影响吗?提示:能问题 3:如何用数字分析此类问题?提示:利用随机变量K2进行分析 导入新知 1分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量222 列联表假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表( 也称 22 列联表 )为:y1y2总计x1a b abx2c d cd总计ac bd abcd3等高条形图将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高条形图4K2统计量为 了 使 不 同 样 本 容 量 的 数 据 有 统 一 的 评 判 标 准 , 我 们 构 造 一 个 随 机 变 量K2nadbc2abcdacbd,其中nabcd为样本容量5独立性检验利用随机变量K2来确定是否能以给定把握认为“两个分类变量有关系”的方法,称为两个分类变量独立性检验 化解疑难 反证法原理与独立性检验原理的比较精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共 15 页2 反证法原理在假设H0下,如果推出一个矛盾,就证明了H0不成立独立性检验原理在假设H0下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错误的概率不超过小概率. 独立性检验的步骤 提出问题 问题:利用随机变量K2进行独立性检验需要几步?提示:三步 导入新知 独立性检验的具体做法(1) 根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查右表确定临界值k0. P(K2k0)0.500.400.250.150.10 k00.4550.7081.3232.0722.706 P(K2k0)0.050.0250.0100.0050.001 k03.8415.0246.6357.87910.828 (2) 利用公式K2nadbc2abcdacbd,计算随机变量K2的观测值k. (3) 如果kk0,就推断“X与Y有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过 的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系” 化解疑难 详析独立性检验(1) 通过列联表或观察等高条形图判断两个分类变量之间有关系,属于直观判断,不足之处是不能给出推断“两个分类变量有关系”犯错误的概率,而独立性检验可以弥补这个不足(2) 列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的方法确认所得结论在多大程度上适用于总体精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 2 页,共 15 页3 列联表和等高条形图的应用 例 1 某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内向的学生 426 人中有 332 人在考前心情紧张, 性格外向的学生594 人中有 213 人在考前心情紧张 作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系 解 作列联表如下:性格内向性格外向总计考前心情紧张332213545 考前心情不紧张94381475 总计4265941 020 相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关 类题通法 细解等高条形图(1) 绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等,但对应的条形图的高度是相同的;两列的数据对应不同的颜色(2) 等高条形图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色区域的高度, 如果两个高度相差比较明显即aab和ccd相差很大, 就判断两个分类变量之间有关系 活学活用 为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:父母吸烟父母不吸烟总计子女吸烟23783320 子女不吸烟6785221 200 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 15 页4 总计9156051 520 利用等高条形图判断父母吸烟对子女吸烟是否有影响解:等高条形图如下:由图形观察可以看出子女吸烟者中父母吸烟的比例要比子女不吸烟者中父母吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.独立性检验的原理 例 2 ( 辽宁高考节选) 某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生602080 北方学生101020 合计7030100 根据表中数据,问:是否有95% 的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”? 解 将 22 列联表中的数据代入公式计算,得k270308020100214.762.由于 4.7623.841 ,所以有 95% 的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异” 类题通法 解决独立性检验问题的思路解决一般的独立性检验问题,首先由题目所给的22列联表确定a,b,c,d,n的值,然后代入随机变量K2的计算公式求出观测值k,将k与临界值k0进行对比, 确定有多大的把握认为“两个分类变量有关系” 活学活用 某医院对治疗支气管肺炎的两种方案A,B进行比较研究,将志愿者分为两组,分别采用方案A和方案B进行治疗,统计结果如下:精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页,共 15 页5 有效无效总计使用方案A组96120 使用方案B组72总计32(1) 完成上述列联表;(2) 能否在犯错误的概率不超过0.05 的前提下认为治疗是否有效与方案选择有关?解: (1) 列联表如下:有效无效总计使用方案A组9624120 使用方案B组72880 总计16832200 (2)K2212080168323.571 3.841 ,所以不能在犯错误的概率不超过0.05 的前提下认为治疗是否有效与方案选择有关1. 独立性检验与统计的综合应用 典例 (12 分) 某工厂有工人1 000 名,其中250 名工人参加过短期培训( 称为 A类工人) ,另外 750 名工人参加过长期培训( 称为 B类工人 ) 现用分层抽样的方法( 按 A类、 B类分两层 ) 从该工厂的工人中抽取100 名工人,调查他们的生产能力(此处生产能力指一天加工的零件数 ),结果如下表表 1:A类工人生产能力的频数分布表生产能力分组110,120)120,130)130,140)140,150) 人数8x 32 表 2:B类工人生产能力的频数分布表生产能力分组110,120)120,130)130,140)140,150) 人数6y 2718 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 5 页,共 15 页6 (1) 确定x,y的值;(2) 完成下面22 列联表,并回答能否在犯错误的概率不超过0.001 的前提下认为工人的生产能力与工人的类别有关系. 生产能力分组工人类别110,130)130,150)总计A类工人B类工人总计附:K2nadbc2abcdacbd,P(K2k0)0.0500.0100.001 k03.8416.63510.828 解题流程 规范解答 (1) 从该工厂的工人中抽取100 名工人,且该工厂中有250 名 A类工人, 750 名 B 类工人,要从 A类工人中抽取25 名,从 B类工人中抽取75 名, (2 分) x258 3212,y7562718 24.(4 分) (2) 根据所给的数据可以完成列联表,如下表所示:生产能力分组工人类别110,130)130,150)总计A类工人20525 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 6 页,共 15 页7 B类工人304575 总计5050100 由列联表中的数据,得K2的观测值为k2257550501210.828.(10分) 因此,在犯错误的概率不超过0.001 的前提下, 认为工人的生产能力与工人的类别有关系 (12 分) 名师批注 要确定x,y的值,应先确定A 类工人及B 类工人中应各抽取多少人,此处易误认为x25,y75,从而导致解题错误分此处易犯错误有两点:计算失误;将公式中的数据搞错 活学活用 电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100 名观众进行调查,其中女性有55 名下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40 分的观众称为“体育迷”,已知“体育迷”中有10 名女性根据已知条件完成下面的22 列联表,据此资料,你是否认为“体育迷”与性别有关?非体育迷体育迷总计男女总计精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 7 页,共 15 页8 附:P(K2k0)0.050.01 k03.8416.635 解:由频率分布直方图可知,在抽取的100 名观众中,“体育迷”有25 名,“非体育迷”有 75 名,又已知100 名观众中女性有55 名,女“体育迷”有10 名,所以男性有45名,男“体育迷”有15 名,从而可完成22 列联表,如下表:非体育迷体育迷总计男301545 女451055 总计7525100 由 22 列联表中的数据,得K2的观测值为k2455575253.030.因为 3.030 3.841 ,所以没有充分的证据表明“体育迷”与性别有关 随堂即时演练 1下面是一个22 列联表:y1y2总计x1a 2173 x222527 总计b 46 则表中a,b处的值分别为 ( ) A94,96 B52,50 C52,54 D54,52 解析:选 C 由a 2173,a 2b,得a52,b54.2博士生和硕士生毕业情况的一个随机样本给出了关于所获取的学位类别与学生性别的分类数据如下表由表中的数据,可得( ) 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 8 页,共 15 页9 硕士博士总计男16227189 女1438151 总计30535340 A性别与获取学位类别有关B性别与获取学位类别无关C性别决定获取学位的类别D以上说法都不正确解析:选A 由列联表中的数据,得K2的观测值为k234030535189 1517.346.635 ,所以在犯错误的概率不超过0.01 的前提下,认为性别与获取学位类别有关而选项C中的表述不恰当, 因为性别与获取学位类别不是因果关系,只是统计学上的一种非确定性关系,故不能用“决定”二字描述3独立性检验所采用的思路是:要研究A,B两类变量彼此相关,首先假设这两类变量彼此 _在此假设下构造随机变量K2,如果K2的观测值较大,那么在一定程度上说明假设 _答案:无关不成立4在吸烟与患肺病是否相关的判断中,有下面的说法:若K2的观测值k6.635 ,则在犯错误的概率不超过0.01 的前提下,认为吸烟与患肺病有关系,那么在100 个吸烟的人中必有99 人患有肺病;从独立性检验可知,在犯错误的概率不超过0.01 的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99% 的可能患有肺病;从独立性检验可知,在犯错误的概率不超过0.05 的前提下,认为吸烟与患肺病有关系时,是指有5% 的可能性使得推断错误其中说法正确的是_( 填序号 ) 解析:K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率, 故说法不正确;说法中对“确定容许推断犯错误概率的上界”理解错误;说法正确答案:5在一次天气恶劣的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有 24 人,不晕机的有31 人;女乘客晕机的有8 人,不晕机的有26 人能否在犯错误的概率不超过0.10 的前提下推断在天气恶劣的飞机航程中男乘客比女乘客更容易晕机?精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 9 页,共 15 页10 解:由已知条件得出下面的22 列联表:晕机不晕机总计男乘客243155 女乘客82634 总计325789 由公式可得K2的观测值knadbc2abcdacbd2553432573.6892.706.故在犯错误的概率不超过0.10 的前提下,认为“在天气恶劣的飞机航程中男乘客比女乘客更容易晕机” 课时达标检测 一、选择题1判断两个分类变量是彼此相关还是相互独立的常用的方法中,最为精确的是( ) A22 列联表 B独立性检验C等高条形图 D其他解析: 选 B A 、 C只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度 独立性检验通过计算得出相关的可能性,较为准确2对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是( ) Ak越大,“X与Y有关系”的可信程度越小Bk越小,“X与Y有关系”的可信程度越小Ck越接近于0,“X与Y没有关系”的可信程度越小Dk越大,“X与Y没有关系”的可信程度越大解析: 选 B k越大, “X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大即k越小,“X与Y有关系”的可信程度越小故选B. 3利用独立性检验对两个分类变量是否有关系进行研究时,若在犯错误的概率不超过0.005 的前提下认为事件A和B有关系,则具体计算出的数据应该是( ) Ak6.635 Bk6.635 Ck7.879 Dk7.879 解析: 选 C 犯错误的概率为0.5%,对应的k0的值为 7.879 ,由独立性检验的思想可知应为k7.879.精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 10 页,共 15 页11 4( 江西高考 ) 某人研究中学生的性别与成绩、视力、智商、阅读量这4 个变量的关系,随机抽查了52 名中学生,得到统计数据如表1 至表 4,则与性别有关联的可能性最大的变量是 ( ) 表 1 成绩性别不及格及格总计男61420 女102232 总计163652 表 2 视力性别好差总计男41620 女122032 总计163652 表 3 智商性别偏高正常总计男81220 女82432 总计163652 表 4 阅读量性别丰富不丰富总计男14620 女23032 总计163652 A成绩 B视力C智商 D阅读量精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 11 页,共 15 页12 解析:选 D 因为k122216363220528216363220,k221636322052112216363220,k32163632205296216363220,k421636322052408216363220,则有k4k2k3k1,所以阅读量与性别关联的可能性最大. 5通过随机询问110 名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060 不爱好203050 总计6050110 由K2nadbc2abcdacbd算得,观测值k2605060507.8.附表:P(K2k0)0.0500.0100.001 k03.8416.63510.828 参照附表,得到的正确结论是( ) A有 99% 以上的把握认为“爱好该项运动与性别有关”B有 99% 以上的把握认为“爱好该项运动与性别无关”C在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”解析:选A 由k7.8 及P(K26.635) 0.010 可知,在犯错误的概率不超过1% 的前提下认为“爱好该项运动与性别有关”,也就是有 99% 以上的把握认为“爱好该项运动与性精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 12 页,共 15 页13 别有关”二、填空题6下列关于K2的说法中,正确的有_( 填序号 ) K2的值越大,两个分类变量的相关性越大;K2的计算公式是K2nadbcabcdacbd;若求出K2 43.841 ,则有 95% 的把握认为两个分类变量有关系,即有 5% 的可能性使得“两个分类变量有关系”的推断出现错误;独立性检验就是选取一个假设H0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H0的推断解析:对于,K2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故错;对于,(adbc) 应为 (adbc)2,故错;对答案:7某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100 名电视观众,相关的数据如下表所示:文艺节目新闻节目总计20 至 40 岁401858 大于 40 岁152742 总计5545100 由表中数据直观分析,收看新闻节目的观众是否与年龄有关:_( 填“是”或“否” ) 解析:因为在20 至 40 岁的 58 名观众中有18 名观众收看新闻节目,而大于40 岁的 42名观众中有27 名观众收看新闻节目,即bab1858,dcd2742,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的答案:是8对 196 个接受心脏搭桥手术的病人和196 个接受血管清障手术的病人进行了3 年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作过心脏病合计心脏搭桥手术39157196 血管清障手术29167196 合计68324392 试根据上述数据计算K2_,能否作出这两种手术对病人又发作心脏病的影响有精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 13 页,共 15 页14 差别的结论 _( 填“能”或“不能” ) 解析:根据列联表中的数据,可以求得K2的观测值k2683241961961.779.K2 2.072 的概率为0.85. 不能作出这两种手术对病人又发作心脏病的影响有差别的结论答案: 1.779 不能三、解答题9巴西医生马廷恩收集犯有各种贪污、受贿罪的官员与廉洁官员寿命的调查资料:500名贪官中有348 人的寿命小于平均寿命,152 人的寿命大于或等于平均寿命;590 名廉洁官员中有 93 人的寿命小于平均寿命,497 人的寿命大于或等于平均寿命这里,平均寿命是指“当地人均寿命”能否在犯错误的概率不超过0.01 的前提下认为官员在经济上是否清廉与他们寿命的长短之间有关系?解:据题意列22列联表如下:短寿 (B)长寿 (B)总计贪官 (A)348152500 廉洁官 (A)93497590 总计4416491 090 假设官员是否清廉与他们寿命的长短无关由公式得K2的观测值k2500590441649325.635.因为 325.635 6.635 ,因此,在犯错误的概率不超过0.01 的前提下认为官员在经济上是否清廉与他们寿命的长短之间是有关系的10某地震观测站对地下水位的变化和发生地震的情况共进行1 700 次观测,列联表如下:有震无震总计水位有变化989021 000 水位无变化82618700 总计1801 5201 700 利用图形判断地下水位的变化与地震的发生是否有关系,并用独立性检验分析是否有充精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 14 页,共 15 页15 分的证据显示二者有关系解:相应的等高条形图如图所示图中两个阴影条的高分别表示水位有变化和水位无变化的样本中有震的频率由图可看出,水位有变化样本中有震的频率与水位无变化样本中有震的频率相差不大,因此不能判断地震与水位变化有关系根据列联表中的数据,得K2的观测值为k21 0007001801 5201.5942.072 ,所以题中数据没有充分的证据显示地下水位的变化与地震的发生有关系,但也不能认为二者无关系精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 15 页,共 15 页