教辅:高考数学二轮复习考点-统计与统计案例.doc
考点二十统计与统计案例一、选择题1对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()Ar2<r4<0<r3<r1 Br4<r2<0<r1<r3Cr4<r2<0<r3<r1 Dr2<r4<0<r1<r3答案A解析易知题中图(1)和图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,则r2<r4<0<r3<r1.2(2020山东胶州期中)某大型超市销售的乳类商品有四种:纯奶、酸奶、婴幼儿奶粉、成人奶粉,且纯奶、酸奶、婴幼儿奶粉、成人奶粉分别有30种、10种、35种、25种不同的品牌现采用分层抽样的方法从中抽取一个容量为n的样本进行质量检测,若抽取的婴幼儿奶粉的品牌数是7种,则n()A100 B50 C20 D10答案C解析由题得,从而n20,故选C.3(2020天津高考)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:5.31,5.33),5.33,5.35),5.45,5.47),5.47,5.49,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间5.43,5.47)内的个数为()A10 B18 C20 D36答案B解析根据频率分布直方图可知,直径落在区间5.43,5.47)内的频率为(6.255.00)0.020.225,则直径落在区间5.43,5.47)内的零件的个数为800.22518.故选B.4(2020天津部分区期末)四名同学各掷一枚骰子5次,分别记录每次骰子出现的点数根据下面四名同学的统计结果,可以判断出一定没有出现点数6的是()(注:一组数据x1,x2,xn的平均数为,它的方差为s2(x1)2(x2)2(xn)2)A平均数为2,方差为2.4B中位数为3,众数为2C平均数为3,中位数为2D中位数为3,方差为2.8答案A解析若平均数为2,则所掷5次点数之和为10,若出现点数6,则其余4次均出现点数1,则此时方差为(111116)4,故A中条件可判断出一定没有出现点数6,经验证,根据B,C,D中统计结果,可能出现点数6,故选A.5(2020云南昆明三模)已知一家便利店从1月份至5月份的营业收入与成本支出的折线图如图,关于该便利店1月份至5月份的下列描述中,正确的是()A各月的利润保持不变B各月的利润随营业收入的增加而增加C各月的利润随成本支出的增加而增加D各月的营业收入与成本支出呈正相关关系答案D解析对于A,通过计算可得1至5月的利润分别为0.5,0.8,0.7,0.5,0.9,故错误;对于B,由A所得利润,可知利润并不随营业收入的增加而增加,故错误;对于C,同理可得错误;对于D,由折线图可得成本支出越多,营业收入也越多,故营业收入与成本支出呈正相关,故正确故选D.6通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由K2算得,K27.8.附表:P(K2k0)0.0500.0100.001k03.8416.63510.828参照附表,得到的正确结论是()A有99%以上的把握认为“爱好该项运动与性别有关”B有99%以上的把握认为“爱好该项运动与性别无关”C在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”答案A解析由K27.8>6.635可知,我们有99%以上的把握认为“爱好该项运动与性别有关”7(多选)(2020山东泰安五模)在疫情防控阻击战之外,另一条战线也日渐清晰恢复经济正常运行国人万众一心,众志成城,防控疫情、复工复产,某企业对本企业1644名职工关于复工的态度进行调查,调查结果如图所示,则下列说法正确的是()Ax0.384B从该企业中任取一名职工,该职工是倾向于在家办公的概率为0.178C不到80名职工倾向于继续申请休假D倾向于复工后在家办公或在公司办公的职工超过986名答案BD解析对于A,x1005.117.842.334.8,A错误;对于B,倾向于在家办公的人员占比为17.8%,故对应概率为0.178,B正确;对于C,倾向于继续申请休假人数为16445.1%84,C错误;对于D,倾向于在家办公或在公司办公的职工人数为1644(17.8%42.3%)988,D正确故选BD.8(多选)(2020山东滨州三模)2020年3月12日,国务院新闻办公室发布会重点介绍了改革开放40年,特别是党的十八大以来我国脱贫攻坚、精准扶贫取得的显著成绩,这些成绩为全面脱贫初步建成小康社会奠定了坚实的基础下图是统计局公布的20102019年年底的贫困人口和贫困发生率统计图则下面结论正确的是()年底贫困人口的线性回归方程为1609.9x15768(其中x年份2009),贫困发生率的线性回归方程为1.6729x16.348(其中x年份2009)A20102019年十年间脱贫人口逐年减少,贫困发生率逐年下降B20122019年连续八年每年减贫超过1000万,且2019年贫困发生率最低C20102019年十年间超过1.65亿人脱贫,其中2015年贫困发生率低于6%D根据图中趋势线可以预测,到2020年底我国将实现全面脱贫答案BD解析每年脱贫的人口如下表所示:期初期末脱贫人口2009年年底至2010年年底165662010年年底至2011年年底165661223843282011年年底至2012年年底12238989923392012年年底至2013年年底9899824916502013年年底至2014年年底8249701712322014年年底至2015年年底7017557514422015年年底至2016年年底5575433512402016年年底至2017年年底4335304612892017年年底至2018年年底3046166013862018年年底至2019年年底16605511109由于缺少2009年年底数据,故无法统计十年间脱贫人口的数据,故A,C错误;根据上表可知,20122019年连续八年每年减贫超过1000万,且2019年贫困发生率最低,故B正确;根据上表可知,20122019年连续八年每年减贫超过1000万,2019年年底,贫困人口551万,故预计到2020年年底我国将实现全面脱贫,故D正确综上所述,正确的为BD.二、填空题9(2020江苏高考)已知一组数据4,2a,3a,5,6的平均数为4,则a的值是_答案2解析数据4,2a,3a,5,6的平均数为4,42a3a5620,解得a2.10总体由编号为01,02,19,20的个体组成,利用下面的随机数表选取7个个体,选取方法是从随机数表第1行的第3列和第4列数字开始由左到右依次选取两个数,则选出的第7个个体的编号为_答案04解析由随机数表可看出所选的数字依次为16,08,02,14,07,02,01,04,去掉重复数字02,则第7个个体的编号为04.11(2020宁夏吴忠模拟)随着养生观念的深入,国民对餐饮卫生条件和健康营养要求提高,吃烧烤的人数日益减少,烧烤店也日益减少某市对2015年到2019年五年间全市烧烤店盈利店铺的个数进行了统计,具体统计数据如表:年份20152016201720182019年份代号(t)12345盈利店铺的个数(y)260240215200180根据所给数据,得出y关于t的回归方程 t273,估计该市2020年盈利烧烤店铺的个数为_答案165解析3,219,样本点的中心坐标为(3,219),代入t273,得2193273,得18.线性回归方程为18t273,取t6,得186273165.估计该市2020年盈利烧烤店铺的个数为165.12(2020安徽蚌埠三模)某企业为了调查其产品在国内和国际市场的发展情况,随机抽取国内、国外各100名客户代表,了解他们对该企业产品的发展前景所持的态度,得到如图所示的等高条形图,则_(填“能”或“不能”)有99%以上的把握认为是否持乐观态度与国内外差异有关P(K2k0)0.0500.0100.0050.001k03.8416.6357.87910.828附:K2.答案能解析根据题目所给数据得到如下22的列联表:乐观不乐观总计国内代表6040100国外代表4060100总计100100200则K28>6.635,所以有99%的把握认为是否持乐观态度与国内外差异有关三、解答题13(2020全国卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i1,2,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得xi60,yi1200, (xi)280, (yi)29000, (xi)(yi)800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i1,2,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由附:相关系数,1.414.解(1)每个样区野生动物平均数为yi120060,地块数为200,所以该地区这种野生动物数量的估计值为2006012000.(2)样本(xi,yi)的相关系数为r0.94.(3)由于各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样,先将植物覆盖面积按优、中、差分成三层,在各层内按比例抽取样本,在每层内用简单随机抽样法抽取样本即可14(2020山东泰安四模)某工厂为了提高生产效率,对生产设备进行了技术改造,为了对比技术改造后的效果,采集了技术改造前后各20次连续正常运行的时间长度(单位:天)数据,整理如下:改造前:19,31,22,26,34,15,22,25,40,35,18,16,28,23,34,15,26,20,24,21改造后:32,29,41,18,26,33,42,34,37,39,33,22,42,35,43,27,41,37,38,36(1)完成下面的列联表,并判断能否有99%的把握认为技术改造前后的连续正常运行时间有差异?超过30不超过30改造前改造后(2)工厂的生产设备的运行需要进行维护,工厂对生产设备的生产维护费用包括正常维护费、保障维护费两种对生产设备设定维护周期为T天(即从开工运行到第kT天,kN*)进行维护生产设备在一个生产周期内设置几个维护周期,每个维护周期相互独立在一个维护周期内,若生产设备能连续运行,则只产生一次正常维护费,而不会产生保障维护费;若生产设备不能连续运行,则除产生一次正常维护费外,还产生保障维护费经测算,正常维护费为0.5万元/次;保障维护费第一次为0.2万元/周期,此后每增加一次则保障维护费增加0.2万元现制定生产设备一个生产周期(以120天计)内的维护方案:T30,k1,2,3,4.以生产设备在技术改造后一个维护周期内能连续正常运行的频率作为概率,求一个生产周期内生产维护费的分布列及均值附:K2P(K2k0)0.0500.0100.001k03.8416.63510.828解(1)列联表为:超过30不超过30改造前515改造后155K210>6.635,有99%的把握认为技术改造前后的连续正常运行时间有差异(2)由题知,生产周期内有4个维护周期,一个维护周期为30天,一个维护周期内,生产线需保障维护的概率为P.设一个生产周期内需保障维护的次数为,则B;一个生产周期内的正常维护费为0.542万元,保障维护费为(0.120.1)万元一个生产周期内需保障维护次时的生产维护费为(0.120.12)万元设一个生产周期内的生产维护费为X,则X的所有可能取值为2,2.2,2.6,3.2,4.P(X2)4,P(X2.2)C3,P(X2.6)C22,P(X3.2)C3,P(X4)4.一个生产周期内生产维护费的分布列为X22.22.63.24PE(X)22.22.63.242.275.一个生产周期内生产维护费的均值为2.275万元一、选择题1某公司有员工15名,其中包含经理一名,保洁一名为了调查该公司员工的工资情况,有两种方案,方案一:调查全部15名员工的工资情况;方案二:收入最高的经理和收入最低的保洁工资不纳入调查范围,只调查其他13名员工的工资这两种调查方案得到的数据,一定相同的是()A中位数 B平均数 C方差 D极差答案A解析将15名员工的工资从低到高排列时,处在中间位置的数据与去掉一个最高和一个最低数后中间位置的数据一定是同一个,故一定相同的是中位数,而平均数,方差和极差均可能不相同,故选A.2为比较甲、乙两名学生的数学素养,对课程标准中规定的数学六大素养进行指标测验(指标值满分为5分,分值高者为优),根据测验情况绘制了如图所示的六大素养指标雷达图,则下面叙述正确的是()A乙的数据分析素养优于甲B乙的数学建模素养优于数学抽象素养C甲的六大素养整体水平优于乙D甲的六大素养中数据分析最差答案C解析根据雷达图得到如下数据:数学抽象逻辑推理数学建模直观想象数学运算数据分析甲454545乙343354由数据可知选C.3(2020山东省第一次仿真联考)空气质量指数,简称AQI,是定量描述空气质量的指数,空气质量指数小于50表示空气质量为优如图是某市一周的空气质量指数趋势图,则下列说法错误的是()A该市这周有4天的空气质量指数为优B该市这周空气质量指数的中位数是31C该市这周空气质量指数的极差是65D该市这周空气质量指数的平均数是53答案B解析由图可知该市这周空气质量指数的中位数、极差、平均数分别是43,65,53,有4天的空气质量指数小于50,故选B.4(2020全国卷)在一组样本数据中,1,2,3,4出现的频率分别为p1,p2,p3,p4,且pi1,则下面四种情形中,对应样本的标准差最大的一组是()Ap1p40.1,p2p30.4Bp1p40.4,p2p30.1Cp1p40.2,p2p30.3Dp1p40.3,p2p30.2答案B解析对于A,该组数据的平均数为A(14)0.1(23)0.42.5,方差为s(12.5)20.1(22.5)20.4(32.5)20.4(42.5)20.10.65;对于B,该组数据的平均数为B(14)0.4(23)0.12.5,方差为s(12.5)20.4(22.5)20.1(32.5)20.1(42.5)20.41.85;对于C,该组数据的平均数为C(14)0.2(23)0.32.5,方差为s(12.5)20.2(22.5)20.3(32.5)20.3(42.5)20.21.05;对于D,该组数据的平均数为D(14)0.3(23)0.22.5,方差为s(12.5)20.3(22.5)20.2(32.5)20.2(42.5)20.31.45.因此,B这一组的标准差最大故选B.5(2020福建高三毕业班质量检查测试)小王于2015年底贷款购置了一套房子,根据家庭收入情况,小王选择了10年期每月还款数额相同的还贷方式,且截止2019年底,他没有再购买第二套房子下图是2016年和2019年小王的家庭收入用于各项支出的比例分配图,根据以上信息,判断下列结论中正确的是()A小王一家2019年用于饮食的支出费用跟2016年相同B小王一家2019年用于其他方面的支出费用是2016年的3倍C小王一家2019年的家庭收入比2016年增加了1倍D小王一家2019年用于房贷的支出费用比2016年减少了答案B解析因为小王每月还款数额相同,2016年占比60%,2019年占比40%,说明2019年收入大于2016年收入,设2016年收入为x,2019年收入为y,0.6x0.4y,即.对于A,2016年和2019年,虽然饮食占比都是25%,但收入不同,所以支出费用不同,所以A不正确;对于B,2016年的其他方面的支出费用是0.06x,2019年其他方面的支出费用是0.12y,3,所以B正确;对于C,因为1.5,所以小王一家2019年的家庭收入比2016年增加了0.5倍,所以C不正确;对于D,房贷占收入的比例减少了,但支出费用是不变的,所以D不正确故选B.6(2020海南三模)2020年初,新型冠状病毒(COVID19)引起的肺炎疫情爆发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如下表所示:周数(x)12345治愈人数(y)2173693142由表格可得y关于x的二次回归方程为6x2a,则此回归模型第4周的残差(实际值与预报值之差)为()A5 B4 C1 D0答案A解析设tx2,即(1491625)11,(2173693142)58,a586118.所以6x28,令x4,得e4y449364285.7(多选)(2020山东新高考质量测评联盟5月联考)2019年以来,世界经济和贸易增长放缓,中美经贸摩擦影响持续显现,我国对外贸易仍然表现出很强的韧性今年以来,商务部会同各省市全面贯彻落实稳外贸决策部署,出台了一系列政策举措,全力营造法治化、国际化、便利化的营商环境,不断提高贸易便利化水平,外贸稳规模、提质量、转动力取得阶段性成效,进出口保持稳中提质的发展势头,右图是某省近五年进出口情况统计图,下列描述正确的是()A这五年,2015年出口额最少B这五年,出口总额比进口总额多C这五年,出口增速前四年逐年下降D这五年,2019年进口增速最快答案ABD解析对于A,观察5个白色条形图可知,这五年中2015年出口额最少,故A正确;对于B,观察五组条形图可得,2015年出口额比进口额稍低,但2016年至2019年出口额都高于进口额,并且2017年和2018年出口额都明显高于进口额,故这五年,出口总额比进口总额多,故B正确;对于C,观察虚线折线图可知,2015年到2016年出口增速是上升的,故C错误;对于D,从图中可知,2019年进口增速最快,故D正确故选ABD.8(多选)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下所示的列联表经计算K2的观测值k4.762,则可以推断出()满意不满意男3020女4010P(K2k0)0.1000.0500.010k02.7063.8416.635A该学校男生对食堂服务满意的概率的估计值为B调研结果显示,该学校男生比女生对食堂服务更满意C有95%的把握认为男、女生对该食堂服务的评价有差异D有99%的把握认为男、女生对该食堂服务的评价有差异答案AC解析该学校男生对食堂服务满意的概率的估计值为,故A正确;该学校女生对食堂服务满意的概率的估计值为>,故B错误;因为k4.762>3.841,所以有95%的把握认为男、女生对该食堂服务的评价有差异,故C正确,D错误故选AC.二、填空题9(2020海南三模)某地A,B,C三所学校分别有教师72,144,216人,当地教育部门组织教研活动,计划用分层抽样的方法从这三所学校的教师中抽取若干人组成领导小组,若从学校B抽取8名教师,则从学校A和C共抽取的教师人数为_答案16解析设从学校A和C分别抽取的教师人数为x和y,由题意可知,所以x4,y12,xy16.10新冠病毒蔓延全球,形势严峻,中国抗疫取得阶段性成效各国医务人员急需新冠肺炎COVID19诊治的科学方案和有效经验复旦大学附属中山医院的呼吸科主任宋元林教授团队通过研究,于4月1日首次揭示COVID19患者发生急性呼吸窘迫综合征(ARDS)和从ARDS进展至死亡的危险因素,并首次提出已发生ARDS的COVID19患者使用甲强龙可能获益的观点为了了解甲强龙的指标数据y与百分比浓度p之间的关系,随机统计了某5次实验的相关数据,并制作了对照表如表:百分比浓度p610141822指标数据y62m442814由表中数据求得回归直线方程为3p82.2,则m_.答案53解析由题意可得, 14,因为回归直线经过样本中心,所以31482.2,解得m53.11(2020北京海淀区期末)某工厂抽检了10个零件的尺寸(单位:m),质检员没有记录9号零件与10号零件的尺寸a,b,但记得ab1.编号12345678910尺寸0.470.520.510.480.520.490.500.51ab这10个零件尺寸的平均数为_ m,中位数x(单位:m)的取值范围为_答案0.50.5,0.505解析由ab1,可知这10个零件尺寸的平均数为(0.470.520.510.480.520.490.500.511)0.5 m.将前8个零件的尺寸从小到大排列为0.47,0.48,0.49,0.50,0.51,0.51,0.52,0.52.若ab0.5,则中位数x0.5;若a,b不相等,不妨设a<0.5,b>0.5,若0.5<b<0.51,则中位数x,即0.5<x<0.505,若b0.51,则中位数x0.505.综上可知,中位数x(单位:m)的取值范围为0.5,0.50512某企业从生产的某种产品中抽取5000件,测量这些产品的某项指标,测量结果得到如图的频率分布直方图由频率分布直方图可以认为,这种产品的指标X服从正态分布N(,2),其中可以看作是样本的平均数,2近似是样本方差,则P(127.8<X<152.2)_.(同一组中的数据用该组区间的中点值代表,且P(<X<)0.6826,P(2<X<2)0.9544,12.2)答案0.6826解析由频率分布直方图可知,1100.021200.091300.221400.331500.241600.081700.02140,s2(30)20.02(20)20.09(10)20.2200.331020.242020.083020.02150.根据正态分布可知,140,则P(127.8<X<152.2)P(<X<)0.6826.三、解答题13(2020山东滨州三模)近年来,我国大力发展新能源汽车工业,新能源汽车(含电动汽车)销量已跃居全球首位某电动汽车厂新开发了一款电动汽车并对该电动汽车的电池使用情况进行了测试,其中剩余电量y与行驶时间x(单位:小时)的测试数据如下表:x12345678910y2.7721.921.361.121.090.740.680.530.45(1)根据电池放电的特点,剩余电量y与行驶时间x之间满足经验关系式yaebx,通过散点图可以发现y与x之间具有相关性设ln y,利用表格中的前8组数据求相关系数r,并判断是否有99%的把握认为x与之间具有线性相关关系;(当相关系数r满足|r|>0.789时,则有99%的把握认为两个变量具有线性相关关系)(2)利用x与的相关性及表格中前8组数据求出y与x之间的回归方程;(结果保留两位小数)(3)如果剩余电量不足0.8,电池就需要充电从表格中的10组数据中随机选出8组,设X表示需要充电的数据组数,求X的分布列及数学期望附:相关数据:6.48,2.45,1.30,e1.173.22.表格中前8组数据的一些相关量:i36,i11.68,i2.18,(xi)242,(yi)23.61,(i)21.70,(xi)(yi)11.83,(xi)(i)8.35,相关公式:对于样本(vi,ui)(i1,2,3,n),其回归直线 v的斜率和截距的最小二乘估计公式分别为 , ,相关系数r.解(1)由题意知,r0.99.因为|r|0.99>0.789,所以有99%的把握认为x与之间具有线性相关关系(2)对yaebx两边取对数得ln yln abx,设ln a,又ln y,则 x, 0.20,易知4.5,0.27. 0.27(0.20)4.51.17,所以0.20x1.17.所以所求的回归方程为e0.20x1.17,即3.22e0.20x.(3)10组数据中需要充电的数据组数为4组,X的所有可能取值为2,3,4.P(X2),P(X3),P(X4).所以X的分布列如下:X234P所以X的数学期望为E(X)2343.2.14(2020全国卷)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):0,200(200,400(400,6001(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”根据所给数据,完成下面的22列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次400人次>400空气质量好空气质量不好附:K2,P(K2k)0.050 0.010 0.001k3.8416.63510.828解(1)由频数分布表可知,该市一天的空气质量等级为1的概率为0.43,等级为2的概率为0.27,等级为3的概率为0.21,等级为4的概率为0.09.(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为350.(3)22列联表如下:人次400人次400空气质量好3337空气质量不好228K25.8203.841,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关