《2022届新高考二轮复习第24讲统计与统计案例学案.docx》由会员分享,可在线阅读,更多相关《2022届新高考二轮复习第24讲统计与统计案例学案.docx(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第24讲统计与统计案例真题回放感悟真题体验高考(授课提示:见学生用书P57)1.(多选)(2021新高考卷I)有一组样本数据XI,X2,,x,由这组数据得到新样本 数据 yi,y2,yn,其中 yi=Xi+c(i=l, 2, , n), c 为非零常数,贝ij()A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样数据的样本极差相同解析:CD E(y)=E(x+c)=E(x)+c且cWO,故平均数不相同,A错误;若第一组中位数为则第二组的中位数为yi=Xi+c,显然不相同,B错误:D(y)=D(x)+D(c)=D(x),故方差相同,C 正确
2、;由极差的定义知:若第一组的极差为Xmax Xmin,则第二组的极差为Ynm-ymin = (xnm + C) 一 (Xmin + C) = Xmax Xmin,故极差相同,D 正确.故选CD.2.(多选)(2021 新高考卷H)下列统计量中,能度量样本XI,X2,,Xn的离散程度的 是()A.样本XI,X2,Xn的标准差B.样本Xl,X2,,Xn的中位数C.样本X|, X2,Xn的极差D.样本X X2,,心的平均数解析:AC由标准差的定义可知,标准差考查的是数据的离散程度:由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均
3、数考查的是数据的集中趋势.故选AC.3.(2021全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查, 将农户家庭年收入的调杳数据整理得到如下频率分布直方图:频率组距0.04 .0.02 -I收人万元根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间=102 n m.=102 n m.96+97+99+99+102+ 102+ 103+104+ 1
4、05+11310、62+52+32+32+02+024-12+22+32+ ll2 Hi=214由参考数据可得O=V2L44.63.安装的该生产线需要进一步调试,理由如下:由可知,若生产线正常工作,则X服从正态分布N(102 , 4.632),则 P(P-3oXh4-3o)=P(88,11X50%,故 D 正确.综上所述,选C.4.(2020全国卷I)某校一个课外学习小组为研究某作物种子的发芽率y和温度H单 位:。C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据,yD(i=l,2,, 20)得到下面的散点图:由此散点图,在10 C至40 之间,下面四个回归方程类型中最适宜作为发
5、芽率y和 温度x的回归方程类型的是()A. y=a+bx B. y=a+bx2C. y=a+bex D. y=a+blnx解析:D 由散点图分布可知,散点图分布在一个对数函数的图象附近,因此,最适合 作为发芽率y和温度x的回归方程类型的是y=a+bln x.故选D.0一考情提示1 .该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验 等;有时也会在知识点交汇处命题,如概率与统计交汇等.2 .从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时 在知识点交汇处命题,也会出现解答题._蠹 考点诠释 A_发散思维突破难点(授课提示:见学生用书r7)“抽样
6、方法1 .系统抽样系统抽样是指当总体中个数较多时,将总体分成均衡的凡部分,然后按照预先定出的规 则,从每一部分抽取1个个体,得到所需要的样本的抽样方法.系统抽样:将总体编号按间 隔k分段,若在第一段中用简单随机抽样确定起始的个体编号1,那么抽取样本的编号为I, 1+匕 1+2匕,l+(n-l)k.2 .分层抽样在抽样时,当总体由有明显差别的几部分组成时,将总体分成互不交叉的层,然后按照定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在起作为样本,这 种抽样方法是分层抽样.1)(2021安徽宿州市高三三模)教育部办公厅于2021年1月18日发布了关于加强中小学生手机管理工作的通知,通
7、知要求中小学生原则上不得将个人手机带入校园.某学 校为了解2000名学生的手机使用情况,将这些学生编号为1, 2,,2000,从这些学生中 用系统抽样方法抽取200名学生进行调查.若58号学生被抽到,则卜面4名学生中被抽到的 是()A.9号学生B.300号学生C.6I8号学生D.8I6号学生解析:C 记被抽取到的学生的编号为an,则an为等差数列,则d=M=10, 4U可得 an=ai+ 10(n 1),由题意知*=58,即ai+10X5=58,解得a1 = 8,所以an=10n2,当 n=62 时,可得物=10乂622=618,所以编号为618的学生可以被抽取到.故选C.(2)(2021四川
8、省资阳中学高三月考)某校高一甲、乙两个班分别有男生24名、15名,现 用分层随机抽样方法从两班男生中抽取样本量为13的样本,对两个班男生的平均身高进行 评估.已知甲班、乙班男生身高的样本平均数分别为175 cm、177.6 cm,以所抽取样本的平 均身高作为两个班男生的平均身高,则两个班男生的平均身高为()A.176 cm B. 176.3 cmC. 176.6 cm D. 176.9 cm24解析:A 根据题意,抽出来的13个的样本中,甲班男生有13X=8人,乙班 I 1 J男生有,3X24+T5=5 A,所以根据题意得两个班男生的平均身高为专(175X8+177.6X5)= 176.故选A
9、.思维启迪1 .在分层抽样中,各层都要按相同的比例抽取样本,这一比例即为抽样比=样本容量各层样本容量 个体总量各层个体数量.2 .在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分成几个组,N则分段间隔即为:(N为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的 每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范 围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容 量的比值.用样本估计总体1 .频率分布直方图中横坐标表示组距,纵坐标表示舞,频率=组距X察.2 .频率分布直方图中各小长方形的面积之和为1.3.
10、利用频率分布直方图求众数、中位数与平均数,在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数:(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积 乘以小长方形底边中点的横坐标之和.(2021河南高三模拟)某生物研究小组准备探究某种靖蜒的翼氏分布规律,随机捕捉20只该种蜻蜓,测量它们的翼长(翼长为整数,单位:mm)并绘制成如下的茎叶图和一 部分频率分布直方图,其中茎叶图中有一处数字看不清(用a表示),但已知茎叶图中每一行 的数据都按照从小到大的顺序排列且无相同数据,频率分布直力图每个分组含左端点不含右 端
11、点.22560 I求a的值;(2)根据茎叶图将频率分布直方图补充完整;(3)分别根据茎叶图和频率分布直方图计算蜻蜓翼长的中位数,并分析哪个中位数可以 更准确地反映蜻蜓翼长的总体情况.解析:(1)40, 45)区间对应的个体个数为0.03X5X20=3,对应的三个数据分别为41,42, 43,因此a必须要大于等于5且小于6,从而a=5.(2)区间35, 40), 45, 50), 50, 55), 55, 60), 60, 65对应的纵坐标分别为:3453220X5=0,3, 20X5=0,4, 20X5=0,5, 20X5=,3, 20X5=0,2,所以频率分布直方图如下:49+50(3)根据
12、茎叶图,中位数为一尸=49.5.频率分布直方图中,区间35, 50)的频率为(0.03+0.03+0.04)X5=0.5,因此中位数为 50.利用茎叶图计算的中位数更加准确,因为频率分布直方图损失了样本的部分信息,数据 的分组对数字特征的估计结果也有影响;茎叶图是原始数据,记录了样本的全部信息,所以 能更准确地反映蜻蜓翼长的总体情况.思维启迪(1)反映样本数据分布的主要方式有:频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小, 高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率 分布和总体的特征数
13、,具体问题中要能够根据公式求解数据的均值、众数和中位数、方差等.(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.回归分析1 .变量的相关性(1)正相关:在散点图中,点散布在从左下角到右上角的区域.(2)负相关:在散点图中,点散布在从左上角到右下角的区域.(3)相关系数r:当r0时,两变量正相关;当r若QiQz5x2因此由定义得选用函数yn2更适合作为点Pi(Xi,yi)(i=L 2,,6)中的y与x之X间的拟合函数.(2)在y = c+&中,令3=,,所以有y = c+d0, XX于是可建立y关于。的线性回归方程为y = C + dco,X(X-)(例一-4 24 所以g J=
14、 - = -10.6,r=lc = y d(o= 16.82 + 10.6x0.3 = 20,所以y关于的线性I可归方程为y = 20-l0.6。,因此)关于x的回归方程为y = 20 -” x当x = 10时,y = 20-10.610=18.94,即可预测当x=10时,的值为18.94.思维启迪求线性回归直线方程的步骤(1)用散点图或进行相关性检脸判断两个变量是否具有线性相关关系:Z(玉一 x)( M - y) Zxj - nxy(2)求系数A:公式有两种形式,即B =口= =-4二.当数据较t(Xj-X)20;_心2r-1M复杂时,题目一般会给出部分中间结果,观察这些中间结果来确定选用公
15、式的哪种形式求分;(3)求4 : ci = y-bxi(4)写出回归直线方程$ =的+优4 独立性检验i.列联表列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的取值分 别为,x2yi,y2,其样本频数列联表(称为2X2列联表)为y1Y2总计X1aba+bX2cdc+d总计a+cb+da+b+c+d2 .构造一个随机变量K=二力:二(b+d),其中-a+b+c+d为样本容量.3 .独立性检验利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2021辽宁高三模拟)中国制造2025提出,坚持“创新驱动、质量为先、绿色发展、结构优化、人才为本”的基本方针,通过“
16、三步走”实现制造强国的战略目标:第一 步,到2025年迈入制造强国行列;第二步,到2035年中国制造业整体达到世界制造强国阵 营中等水平;第三步,到新中国成立一百年时,综合实力进入世界制造强国前列.质检部门 对设计出口的甲、乙两种“无人机”分别随机抽取100架检测某项质量指标,由检测结果得 到如下的频率分布直方图:甲乙(1)写出频率分布直方图(甲)中a的值;记甲、乙两种“无人机” :00架样本的质量指标的方差分别为8 s%试比较宿s3的大小(只需给出答案);若质检部门规定质量指标高于20的无人机为优质产品,根据上面抽取的200架无人P(K22ko)0.050.0100.0050.001ko3.
17、8416.6357.87910.828(3)由频率分布直方图可以认为,乙种“无人机”的质量指标值Z服从正态分布N(“。2).其中卜近似为样本平均数7,。2近似为样本方差就 设X表示从乙种无人机中随机抽 取10架,其质量指标值位于(11.6, 354)的架数,求X的数学期望.注:同一组数据用该 区间的中点值作代表,计算得S2=4位为比11.9;若ZN(p,。2),则p(p。7中+。 =0.6826, P(n-2oZg+2o)=0.9544.解析:(1)由图可得,a=0.010,且sbs?.(2)甲种无人机中优质率为0.25+0.1+0.35=0.7,所以甲种无人机中优质产品有70架, 不是优质产
18、品的有30架;乙种无人机中优质率为0.3+0.2+0.1=0.6,所以乙种无人机中优 质产品有60架,不是优质产品的有40架.列联表如下:甲乙合计优质产品7060130不是优质产品304070合计100100200,200X (70X40-60X30) 2K2=2 2 203 841,130X70X100X100故没有95%的把握认为甲、乙两种“无人机”的优质率有差异.(3)计算得 3=5X0.15+15X0.25+25X0.3+35X0.2+45X0.1=23.5,由条件 ZN(23.5, 142.75),从而 P(U.6vZv35.4)=0.6826,故从乙种“无人机”中随机抽取1架,其质
19、量指标值位于(11.6, 35.4)的概率是0.6826, 根据题意得XB(10, 0.6826),所以 EX= 10X0.6826=6.826.思维启迪I1.独立性校验的步骤(1)根据样本数据制成2X2列联表;根据公式K?=根据公式K?=n (adbe)(a+b) (c+d) (a+c) (b+d)计算K2的观测值;(3)比较K2与临界值的大小关系做统计推断.2.独立性检验得出的结论带有概率性质,只能说结论成立的概率有多大,而不能完全肯 定一个结论,因此才出现了临界值,3.841和6.635就是两个常用的临界值,一般认为当K? 23.841时,则有95%的把握说事件A与B有关;当K26.63
20、5时,则有99%的把握说事件 A与B有关.若XN(r。,则正态总体在三个特殊区间内取值的概率为 P(g-oXi+o)=0.6826;P(厂 2oX$+2o)=0.9544;P(g-3oXn+3a)=0.9974.(2021湖南衡阳市高三二模)2021年4月11 口,10名“湖湘工匠年度人物”完成公示,准备接受湖南省政府表彰.衡阳市某变电器材有限公司为监控某种零件的一条生产线的 生产过程,检验员每天从该生产线上随机抽取10个零件,测量其内径尺寸(单位:um).根 据长期生产经验,可以认为这条生产线正常状态下生产的零件的内径尺寸服从正态分布N(p, 。2).(1)假设生产状态正常,记X表示某一天内
21、抽取的10个零件中其内径尺寸在伽一3。,U + 3。)之外的零件数,求P(X22)及X的数学期望;(2)该公司某天正常工作的一条生产线数据记录的茎叶图如图所示:910II计算这一天生产线上生产的零件内径尺寸的平均值M与标准差。;为了带动相关产业发展,该公司帮扶衡阳市内另一家企业安装这条生产线并试生产J 5个零件,测量其内径分别为(单位:um): 96, 102, 108, 53, 117,试问此条生产线是 否需要进一步调试,请说明理由.参考数据:P(|,i-2oXg+2o)=0.9544, P(p-3gX|.i+3g)=90.00254, 2144.63.解析:(1)由题意 P(g-3oXp4-3o)=0.9974,P(X=O)=C?o(I-0.9974)0 0.9974i=0.9743,P(X=l)=Clo(l-0.9974), 0.9974y=0.0254,所以 P(X=0 或 X= 1)=0.9743+0.0254=0.9997,所以 P(X22)= 1 -P(X=0 或 X= 1)= 1 -0.9997=0.0003,由题意可知 XB(10, 0.0026), E(X)= 10 X 0.0026 =0.0260.(2)由茎叶图可得 10 个数据为 96, 97, 99, 99, 102, 102, 103, 104, 105, 113, 则平均值
限制150内