8.3分类变量与列联表 课时分层练习题人教A版选择性必修第三册.docx
8.3分类变量与列联表A基础练一、选择题【答案】c【详解】0=73-21=52,8=。+22=52+22=74.应选:C.2. (2021江苏高二)为了调杳中学生近视情况,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时,用什么方法最有说服力()A.平均数B.方差C.回归分析D.独立性检验【答案】D【详解】分析条件,得如下表格.男生女生合计近视8070150不近视7070140合计150140290根据列联表利用公式“I得/的值,再与临界值比拟,检验这些中学生眼睛近视是否与性别有关, 故利用独立性检验的方法最有说服力.应选:D.3. (2021全国高二课时练)对于分类变量X与丫的随机变量炉的值,以下说法正确的选项是()a.片越大,“x与丫有关系”的可信程度越小B. f越小,”X与y有关系”的可信程度越小c. f越接近于0, “X与丫没有关系”的可信程度越小d. .F越大,“x与y没有关系”的可信程度越大总计160402(X)参考公式:独立性检验统计量X?其中 = a+c+d.n(acl-bc)2(。+ b)(c + d)(a + c)(b + d)户(f NX。)0.150.100.050.0250.0100.0050.0012.0722.7063.8415.0246.6357.87910.828下面的临界值表供参考:A.有95%的把握认为“经常用流行用语”与“年轻人”有关系B.没有95%的把握认为“经常用流行用语”与“年轻人”有关系C.有97.5%的把握认为“经常用流行用语”与“年轻人”有关系D.有97.5%的把握认为“经常用流行川语”与“年轻人”没有关系【答案】A【详解】v2 200x(25x15-25x35)2Zk -160x40x50x150= 4.167 > 3.84b根据临界值知有95%的把握认为经常用流行语与年轻人有关系,应选:A4. (2021河南信阳市高二月考)某医疗研窕所为了检验新开发的流感疫苗对流感的预防作用,根据1000名注射了疫苗的人与另外1000名未注射疫苗的人半年的感冒记录作出如下的2x2的列联表,患流感未患流感合计注射疫苗2008001000未注射疫苗2607401000合计46015402000并提出假设“:”这种疫苗不能起到预防流感的作用那么以下说法正确是()附:X、(ad-bcT(a + b)(c + d)(a + c)(b + d)Pl"。)0.150.100.050.0250.0100.0050.0012.0722.7063.8415.0246.6357.87910.828A.这种疫苗能起到预防流感的有效率为99%;B.假设某人未使用该疫苗,那么他在半年中有超过99%的可能性得流感;C.有1%的把握认为“这种疫苗能起到预防流感的作用”;D.有99%的把握认为“这种疫苗能起到预防流感的作用”.【答案】D【详解】一幽3一,2。(2。吆4。二69"。匚0.64>6.635, (a + b)(c + da + c)(b + d)1000x1000x460x1540由临界值表可知,有99%的把握认为“这种疫苗能起到预防流感的作用”,应选:D5.(多项选择题)(2021山东泰安一中高二月考)为了增强学生的身体素质,提高适应自然环境、克服 困难的能力,某校在课外活动中新增了一项登山活动,并对“学生喜欢登山和性别是否有关“做了一 次调查,其中被调查的男女生人数相同,得到如下图的等高条形统计图,那么以下说法中正确的有( )供0%0%伙伙伙o%0%(n(n 0987654321供0%0%伙伙伙o%0%(n(n 0987654321男女口不喜欢喜欢附:n(ad -bcj(a + )(c + d)(a + c)(/? + d)k3.8416.635P(/训0.0500.010其中 = a + /? + c+d.A.被调查的学生中喜欢登山的男生人数比喜欢登山的女生人数多B.被调杳的女生中喜欢登山的人数比不喜欢登山的人数多C.假设被调查的男女生均为100人,那么有99%的把握认为喜欢登山和性别有关D.无论被调查的男女生人数为多少,都有99%的把握认为喜欢登山和性别有关【答案】AC【详解】因为被调查的男女生人数相同,由等高条形统计图可知,喜欢登山的男生占80%,喜欢登山的女生占30%,所以A正确,B错误;设被调查的男女生人数均为,那么由等高条形统计图可得2x2列联表如下:男女合计喜欢0.80.31.1不喜欢0.20.70.9合计nn22 x(0.8 x ().7 - ().3 x 0.2/?)LlxO.9xx50/7=99当 二 100时,Z2 =>6.635 ,所以有99%的把握认为喜欢登山和性别有关;50()当 =10时,Z2 = <6.635 ,所以没有99%的把握认为喜欢登山和性别有关,显然/的值与的取值有关,所以C正确,D错误.应选:AC.6.(多项选择题)(2021全国高二专题练)在一次恶劣气候的飞行航程中,调查男女乘客在机上晕机的晕机不晕机合计男«n154+女6n222+合计2846情况,如下表所示:那么以下说法正确的选项是()附:参考公式:/2 =n(ad-bc)2(a + c)(6 + d)(a+b)(c+d)其中 n = a + b+c+d.P(K?之 k°)0.100.050.0250.010k。2.7063.8415.0246.635独立性检验临界值表B. / <2.706C.有90%的把握认为,在恶劣气候飞行中,晕机与否跟男女性别有关D.没有理由认为,在恶劣气候飞行中,晕机与否跟男女性别有关【答案】ABD6+15 =许【详解】由列联表数据,知6 + %2=2+28 = 46如二12n22 = 13,得m=18/+ = 27=1912 466官二万丁二评即从正确晕机不晕机合计男121527女61319合计182846%+2+ =46爷瑞等即正确且没有理由认为,在恶劣气候飞行中,星机与否跟男女性别有关;即。正确,应选:ABD二、填空题7. (2021河南濮阳市高二期末)下表是不完整的2x2列联表,其中3 = c, b = 2d ,那么。二)?1力总计*ab55工2Cd总计120【答案】15a + b = 55【详解】由题意得”,又3a = c,c + t/ = 120-55a + b = 55【详解】由题意得”,又3a = c,c + t/ = 120-55b = 2d,所以va +2d = 553a + d = 65,解得 = 15.8. (2021山东高二专题练习)为了判断某高中学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2x2列联表:理科文科H二EP(是3.841户0.05,0(企6.635户0.01.根据表中数据,得到四=50x(13x20_10x7)- 9例% 23x27x20x30那么认为选修文科与性别有关系出错的概率约为.【答案】0.05【详解】因为44.844>3.841,而P(企3.841户0.05,故认为选修文科与性别有关系出错的概率约为 0.05.9. (2021江苏高二专题练习)某卫生机构对366人进行健康体检,有阳性家族史者糖尿病发病的有 16例,不发病的有93例,有阴性家族史者糖尿病发病的有17例,不发病的有240例,认为糖尿病 患者与遗传有关系的概率约为.参考数据:P(走3.841户0.05, P(.F*.635户0.01.【答案】95%【详解】列出2x2列联表:发病不发病合计阳性家庭史1693109阴性家庭史17240257合计33333366所以随机变量下的值为 *= 366 * 0 6 * 24° 17 X 93)“ *。67>3.841,而 PC03.841 户0.05, 109x257x33x333所以在犯错误的概率不超过0.05的前提下,即有95%的把握认为糖尿病患者与遗传有关.10. (2021河南郑州市高二)假设有两个分类变量X和V,它们的可能取值分别为&,&和x,)”,其2x2列联表如表,对于以下数据,对同一样本能说明X和V有关系的可能性最大的一组为. a =9,b = 8,c = 7、d = 6 a = 9,力=7, c = 6, d = 8 a = 8、b = 6、c = 9,d = 7 a = 6,b = 7,c = 8,d = 9,%总计*aba + bCdc+d总计a-cb + da+b+c+d【答案】【详解】对于选项A,依/一用=|6x98x7| = 2;对于选项b,依M=|8x96x7| = 30;对于选项C, |d/?d=|8x76x9| = 2;对于选项 D, |血Z?d=|6x98x7| = 2;由|一/7d越大,说明X和V有关系的可能性越大.三、解答题11. (2020江苏南京市高三期中)在20人身上试验某种血清对预防感冒的作用,把他们一年中是否 患感冒的人数与另外20名未用血清的人是否患感冒的人数作比拟,结果如下表所示.未感冒感冒使用血清173未使用血清146(1)从上述患过感冒的人中随机选择4人,以进一步研究他们患感冒的原因.记这4人中使用血清 的人数为X,试写出X的分布列;(2)有多大的把握得出“使用该种血清能预防感冒”的结论?你的结论是什么?请说明理由.附:对于两个研究对象I (有两类取值:类A,类4)和H (有两类取值:类1,类2)统计数据的 一个2x2列联表:II类1类2I类Aab类Bcd2n(ad-bc)2有力 =,其中一a + Z? + c+d.m+)(c+d)m+c)s+d)临界值表(局部)为0.500.400.250.150.100.050.0250.0100.0050.001k0.4450.7081.3232.0722.7063.8415.0246.6357.87910.828【详解】(1)因为使用血清的人中感冒的人数为3,未使用血清的人中感冒的人数为6, 一共9人,从这9 人中选4人,其中使用血清的人数为X,那么随机变量X的可能值为0, 1,2, 3.因为P(X=O)=等= D =置4P(X=2) =等磊 p(x=3) =萼ng所以随机变量X的分布列为(2)将题中所给的2x2列联表进行整理,得X0123P542102151412提出假设“o:是否使用该种血清与感冒没有关系.未感冒感冒总数使用血清17320未使用血清14620总数31940根据/公式求得上吗等""2903.因为当"o成立时,”戈20.708”的概率约为0.40,2 1.323”的概率约为0.25,所以有60%的 把握认为:是否使用该种血清与感冒有关系,即“使用该种血清能预防感冒”,得到这个结论的把握 不到75%.由于得到这个结论的把握低于90%,因此,我的结论是:没有充分的证据显示使用该种血清能预防 感冒,也不能说使用该种血清不能预防感冒.12. (2021江苏南通高二月考)学生视力不良问题突出,是教育部发布的我国首份中国义务教育 质量监测报告中指出的众多现状之.习近平总书记作出重要指示,要求全社会都要行动起来,共 同呵护好孩子的眼睛,让他们拥有一个光明的未来.为了落实总书记指示,掌握基层情况,某单位调 查了某校学生的视力情况,随机抽取了该校100名学生(男生50人,女生50人),统计了他们的视力 情况,结果如下:不近视近视男生2525女生2030(1)是否有90%的把握认为近视与性别有关?附:犷=(° +4;,)岛其中" = " +k2.0722.7063.8415.0246.6357.87910.828P(/叫0.150.100.050.0250.0100.0050.001(2)如果用这100名学生中男生和女生近视的频率分别代替该校男生和女生近视的概率,且每名学 生是否近视相互独立.现从该校学生中随机抽取4人(2男2女),设随机变量X表示4人中近视的人 数,试求X的分布列及数学期望E(X).【详解】(1)根据2x2列联表中的数据可得/2 = IWxQSQO。®- = W2 = 1.01 < 2.706 , 50x50x45x5599根据临界值表可知,没有90%的把握认为近视与性别有关;(2)由题意可知男生近视的概率为女生近视的概率为|, X的可能取值为0,1, 2, 3, 4,册二外界4。总P(X=2) = C;匕P(X=3) = C;伯尸(X=4) = C;D .仁)9100所以X的分布列如下:X01234P125_53710031()9100于是X的数学期望为£(x)= o安一,1 n 371-4-2 510043,931-4=1010035【答案】B【详解】根据独立性检验的基本思想可知,分类变量x与y的随机变量炉的观测值越大,“x与y 没有关系''的可信程度越小,那么“x与y有关系”的可信程度越大;/越小,"X与y有关系”的可信程 度越小,“x与y没有关系”的可信程度越大,故ACD错误,B正确.应选:B.4. (2021.江苏星海实验中学高二)某班班主任对全班50名学生学习积极性和对待班级工作的态度进 行了调查,统计数据如表所示:积极参加班级工作不太主动参加班级工作合计学习积极性高18725学习积极性一般61925合计242650临界值表:P(fN与)0.150.100.050.0250.0100.0050.001%2.0722.7063.8415.0246.6357.87910.828根据表中数据分析,以下说法正确的选项是()A.有99.9%的把握认为学生的学习积极性与对待班级工作的态度有关系B.有99.5%的把握认为学生的学习积极性与对待班级工作的态度有关系C.有99%的把握认为学生的学习积极性与对待班级工作的态度有关系D.没有充分的证据显示学生的学习积极性对待班级工作的态度有关系【答案】A【详解】z2 = 5()X(ISxl9-7x6) «11.54> 10.828 ,所以有99.9%的把握认为学生的学习积极 25x25x24x26性与对待班级工作的态度有关系.应选:A.5.(多项选择题)(2021全国高二课时练习)因防疫的需要,多数大学开学后启用封闭式管理.某大学 开学后也启用封闭式管理,该校有在校学生9000人,其中男生4000人,女生5000人,为了解学生 在封闭式管理期间对学校的管理和服务的满意度,随机调查了 40名男生和50名女生,每位被调杳 的学生都对学校的管理和服务给出了满意或不满意的评价,经统计得到如以下联表:*44-俩尽不满意附表:男2020女4010P(f NXo)0.150.100.050.0250.0100.0050.001%2.0722.7063.8415.0246.6357.87910.828附:八 Md-bcY(a + b)(c + d)( + c)(b + d)以下说法正确的有()A.满意度的调查过程采用了分层抽样的抽样方法B.该学校学生对学校的管理和服务满意的概率的估计值为0.6C.有99%的把握认为学生对学校的管理和服务满意与否与性别有关系D.没有99%的把握认为学生对学校的管理和服务满意与否与性别有关系【答案】AC【详解】因为男女比例为4000: 5000,故A正确.满意的频率为"胆之0.667,所以该学校 9()3学生对学校的管理和服务满意的概率的估计值约为0.667,所以B错误.由列联表72 = 90x(20x10-20x40)- =9>6.635,故有99%的把握认为学生对学校的管理和服务满意与否与 40 x 50 x 60 x 30性别有关系,所以C正确,D错误.应选:AC.6.(多项选择题)(2021全国高二课时练)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否4有关“作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的不,女生喜3欢抖音的人数占女生人数不,假设有95%的把握认为是否喜欢抖音和性别有关,那么调杳人数中男生可能有()人附表:Pl0。)0.150.100.050.0250.0100.0050.001小2.0722.7063.8415.0246.6357.87910.828_ n(ad -be)2(a + b)(c + d)(a + c)(b + d)A. 25A. 25B. 35C. 45D. 60【答案】CD21.巴421.巴45 55 5 ;73-X-XXX5 5= x>3.84121解得 40.335,【详解】设男生可能有x人,依题意得女生有x人,可得2x2列联表如下:喜欢抖音不喜欢抖音总计男生4 X51-X5X女生3 -X52X5X合计7一 X53X 5lx假设有95%的把握认为是否喜欢抖音和性别有关,那么犬>3.841,由题意知x>0.且工是5的整数倍,所以45和60都满足题意.应选:CD.二、填空题7.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清 的人的一年中的感冒记录作比拟,提出假设Ho:”这种血清不能起到预防感冒的作用”。对此利用2x2 列联表计算得炉。3.9电经查对临界值表知P(£n3.841户0.05。对此四名同学做出了如下的判断: 有95%的把握认为“这种血清能起到预防感冒的作用”;如果某人未使用该血清,那么他在一年 中有95%的可能性得感冒;这种血清预防感冒的有效率为95%;这种血清预防感冒的有效率为 5%; 其中判断正确的序号是【答案】【解5略(2021全国高二课时练习)某次国际会议为了搞好对外宣传工作,会务组选聘了 50名记者担任 对外翻译工作,在如表“性别与会外语”的2x2列联表中,a + b + d=.会外语不会外语总计男ab20【答案】44女6d总计1850。+ 6 = 18【详解】解:由题意有:a + b = 20o + /? + d + 6 = 5()所以a = 12, Z? = 8, d = 24, a+d = 12+8+24 = 44.8. (2021南昌市第一中学高二)某学校为了制订治理学校门口,上学、放学期间家长接送孩子乱停 车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的50份调查问卷,得到了如下 的列联表:同意限定区域停车不同意限定区域停车合计男20525女101525合计302050那么认为“是否同意限定区域停车与家长的性别有关”的把握约为【答案】99.5%【详解】因为X?=【详解】因为X?=出 8.333,50x(20xl5-5xlQ)225x25x30x20又Pg.7.879)= 0.005 = 0.5% ,所以我们有99.5%的把握认为“是否同意限定区域停车与家长的性别有关”.9. (2021河南高二月考)有两个分类变量工和其中一组观测值为如下的2x2列联表:为总计为a5-a15x220-a30+a50总计204565其中。,15-。均为大于5的整数,那么 时,在犯错误的概率不超过0.01的前提下为“x和),之间有关系"附 近一勿黑;幻)产(4为)0.150.100.050.0250.0100.0050.001X。2.0722.7063.8415.0246.6357.87910.828【答案】9【详解】解:由题意知:z2 > 6.635 ,那么 65(30 + )一(20-初15-疔=13(13。-6() 20x45x15x505400 一 ,解得:。之8.65或40.58,因为:。>5且 15 。>5, «eZ,综上得:8.65<67<10 , 4cZ,所以:a=9.三、解答题H.(2021黑龙江哈尔滨市哈九中高二月考(文)第24届冬奥会将于2022年在北京市和张家口市 联合举行,冬奥会志愿者的服务工作是成功举办的重要保障.在冬奥会的志愿者选拔工作中,某高校 承办了冬奥会志愿者选拔的面试工作,面试成绩总分值100分,现随机抽取了 80名候选者的面试成绩 分五组,第一组45,55),第二组55,65),第三组65,75),第四组75,85),第五组85,95), 绘制成如下图的频率分布直方图.图中从左到右前三个组的频率成等差数列,第一组和第五组 的频率相同.(1)求。,方的值,并估计这80名候选者面试成绩的中位数(中位数精确到0.1);(2)己知抽取的80名候选人中,男生和女生各40人,男生希望参加张家U赛区志愿服务的人数有 10人,女生希望参加张家口赛区志愿服务的人数有20人,补全下面2x2列联表,问是否有95%的 把握认为希望参加张家口赛区志愿者服务的候选人与性别有关?男生女生总计希望去张家口赛区1020不希望去张家口赛区总计4040参考数据即公式:x2=-(丝产) ,i = a+b+c+d ( + )(c+d)( + c)S + d)尸(4之为)0.150.100.050.0250.0100.0050.001%2.0722.7063.8415.0246.6357.87910.828【详解】 解:(1)由题意可知:20/? =10。+ 0.45,(2/+Z? + 0.065)xl0 = l,解得。= 0.005, 8 = 0.025,所以中位数等于65 + »2xl0 = 经b69.4 0.459(2)补全2x2列联表:男生女生总计希望去张家口赛区102030不希望去张家口赛区302050总计404080上端粽答号5.所以有95%的把握认为希望参加张家口赛区志愿者服务的候选人与性别有关.12. (2021江苏南通市高二月考)某体育彩票站点为了预估2020年彩民购买彩票的情况,对2019年的购买情况进行随机调查并统计,得到如下数据:购买金额/千元0,1.5)1.5,3)3,4.5)4.5,6)6,7.5)7.5,9人数1()1520252010(1)估计彩民平均购买金额(每组数据取区间的中点值):(2)根据以上数据完成下面的2x2列联表;不少于6千元少于6千元合计男30女12合计(3)根据(2)中的2x2列联表,判断是否有90%的把握认为彩民的购买金额是否少于6千元与彩民的性别有关?产(.“)0.150.100.050.0250.0100.0050.001%2.0722.7063.8415.0246.6357.87910.828,其中 = a+c+d.(4 + b)(c + d)( + c)(b + d)【详解】附:Z2史=465(千元).' 一 : 10 4(1)彩民平均购买金额为上厂, ,厂10 4 20 45444 54答:彩民平均购买金额约为4.65千元.(2)由所给数据可得2x2列联表如下:不少于6千元少于6千元合计男183048女124052合计3070100根据2x2列联表中的数据可得八吗设盛("鬻 373<2,706.因此根据临界值表可知,没有90%的把握认为彩民的购买金额是否少I- 6千元与彩民的性别有关.B提高练一、选择题1. (2021全国高二课时练)在一次独立性检验中,得出列联表如下:AA合计B2008001 000B180a180+d合计3808004-«1 180+a且最后发现,两个分类变量4和8没有任何关系,那么的可能值是()A. 200【答案】BA. 200【答案】BB. 720C. 100D. 180【详解】由题意知一一与三基本相等,由列联表知某与翟一基本相等, a + b c + d1000 180 + a2001801o66-18O + 2001801o66-18O + ,解得 = 720.应选:B2. (2021江苏高二专题练习)为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2x2列联表进行独立性检验,经计算得f=7.01,那么认为“喜欢乡村音乐与性别有关系”【详解】易知/=7.01 >6.635,对照临界值表知,有99%的把握认为喜欢乡村音乐与性别有关系.应选:C3. (2021江苏盐城市高二月考)某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了 200人进行调查统计得下方的2x2列联表.那么根据列联表可知()年轻人非年轻人总计经常用流行用12525150不常用流行用语351550