五年(2018-2022)全国高考数学真题分类汇编(全国卷新高考卷北京天津卷等)专题14统计(解析版).pdf
2018-2022五年全国各省份高考数学真题分类汇编专题1 4 统计一、选择题1.(2022年全国高考甲卷数学(文)第2题)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:1 0 0%9 5%9 0%树 8 5%每 8 0%由7 5%7 0%6 5%6 0%0;*-.-*.-*.123456789 1 0居民编号*讲座前 讲座后则(.*A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差【答案】B【解析】讲座前中位数为7 0%;7 5%70%,所以人错;讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B对;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错;讲座后问卷答题的正确率的极差为100%-80%=20%,讲座前问卷答题 正确率的极差为95%-60%=35%20%,所以D错.故选:B【题目栏目】【题目来源】2022年全国高考甲卷数学(文)第2题2.(20 22年高考全国乙卷数学(文)第4题)分别统计了甲、乙两位同学1 6周的各周课外体育运动时长(单位:h),得如下茎叶图:甲6 15.8 5 3 06.37 5 3 27.4 66 4 2 18.1 24 29.0 21 0.13 82 5 6 6 6 6则下列结论中错误的是()乙A.甲同学周课外体育运动时长的样本中位数为7.4B,乙同学周课外体育运动时长的样本平均数大于8C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6【答案】C7 3 +7 5解析:对于A选项,甲同学周课外体育运动时长的样本中位数为-=7.4,A选项结论正确.2对 于B选项,乙同学课外体育运动时长的样本平均数为:6.3 +7.4 +7.6 +8.1 +8.2+8.2+8.5 +8.6 +8.6 +8.6 +8.6 +9.0 +9.2+9.3+9.8 +1 0.1 。-=8.5 0 6 25 81 6B选项结论正确.对于C选项,甲同学周课外体育运动时长大于8的概率的估计值9=0.3 7 5 0.6 ,1 6D选项结论正确.故选:C【题目栏目】统计 用样本估计总体 用样本的数字特征估计总体的数字特征【题目来源】20 22年高考全国乙卷数学(文)第4题3.(20 21年高考全国甲卷文科第2题)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:腹率组距根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5 万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5 万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5 万元D.估计该地有一半以上的农户,其家庭年收入介于4.5 万元至8.5 万元之间【答案】C解析:因为频率直方图中的组距为L所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5 万元的农户的比率估计值为0.02+0.04=0.06=6%,故 A 正确;该地农户家庭年收入不低于10.5 万元的农户比率估计值为0.04+0.02 x 3=0.10=10%,故 B正确;该地农户家庭年收入介于4.5 万元至8.5 万元之间的比例估计值为0.10+0.14+0.20 x2=0.64=64%50%,故 D 正确;该地农户家庭年收入的平均值的估计值为3x0.02+4x0.04+5x0.10+6x0.14+7 x0.20+8x0.20+9x0.10+10 x0.10+11x0.04+12x0.02+13x0.02+14x0.02=7.68(万元),超过6.5 万元,故 C错误.综上,给出结论中不正确的是C.故选:C.【点睛】本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的估计值.注意各组的频率等于组距.【题 目栏目】统计,用样本估计总体 用样本的数字特征估计总体的数字特征【题目来源】20 21 年高考全国甲卷文科第 2 题4 .(20 21 高考天津第4题)从某网络平台推荐的影视作品中抽取4 0 0 部,统计其评分数据,将所得40 0个评分数据分为8 组:6 6,7 0)、7 0,7 4)、L、9 4,9 8 ,并整理得到如下的频率分布直方图,【答案】D解析:由频率分布直方图可知,评分在区间 8 2,8 6)内的影视作品数量为40 0 x 0.0 5 x 4=8 0.故选:D.【题目栏目】统计,用样本估计总体 频率分布直方图【题目来源】2 0 2 1 高考天津第4 题5 .(2 0 2 0 天津高考第4 题)从一批零件中抽取8 0 个,测量其直径(单位:mm),将所得数据分为9组:5.3 1,5.3 3),5.3 3,5.3 5),.,5.45,5.47 ,5.47,5.49 ,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间 5.43,5.47)内的个数为()A.1 0 B.1 8 C.2 0 D.3 6【答案】【答案】B【解析】根据直方图,直径落在区间 5.43,5.47)之间的零件频率为:(6.2 5 +5.0 0)x 0.0 2 =0.2 2 5,则区间 5.43,5.47)内零件的个数为:8 0 x 0.2 2 5 =1 8.故选:B.【题目栏目】统计、用样本估计总体 频率分布直方图【题目来源】2 0 2 0 天津高考第4 题6 .(2 0 1 9 年高考全国H I 文 第 4 题)西游记 三国演义 水浒传和 红楼梦是中国古代文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了 1 0 0 位学生,其中阅读过 西游记和 红楼梦的学生共有9 0 位,阅读过 红楼梦的学生有8 0 位,阅读过 西游记且阅读过 红楼梦的学生共有6 0 位,则该校阅读过 西游记的学生人数与该校学生总数比值的估计值为()A .0.5 B.0.6 C.0.7 D.0.8【答案】【答案】C【解析】某中学为了了解本校学生阅读四大名著的情况,随机调查了 1 0 0 位学生,其中阅读过 西游记或 红楼梦的学生共有9 0 位,阅 读 过 红楼梦的学生共有8 0 位,阅 读 过 西游记且阅读过 红楼梦的学生共有6 0 位,作出维恩图,得:红楼梦20,该学校阅读过 西游记 的学生人数为7 0 人,则该学校阅读过 西游记的学生人数与该学校学生总数比值的估计值为:=0.7 .故 选:C.1 0 0【题目栏目】统计,用样本估计总体 用样本的数字特征估计总体的数字特征【题目来源】2 0 1 9 年高考全国H I 文 第 4 题7 .(2 0 1 9 年高考全国I 文第6题)某学校为了解1 0 0 0 名新生的身体素质,将这些学生编号1,2,,1 0 0 0,从这些新生中用系统抽样方法等距抽取1 0 0 名学生进行体质测验.若4 6 号学生被抽到,则下面4 名学生中被抽到的是()()A.8号 学 生 B.2 0 0 号学生 C.6 1 6 号学生 D.8 1 5 号学生【答案】【答案】C【解析】从 1 0 名学生中抽取1(X)名,每 1 人抽一个,4 6 号学生被抽到,则抽取的号数就为1 0 +6(0 W 9 9,eN),可得出6 1 6 号学生被抽到.【题目栏目】统计、随机抽样、系统抽样【题目来源】2 0 1 9 年高考全国I 文 第 6 题8.(2 0 1 8 年高考数学课标卷1 (文)第 3题)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:建设前经济收入构成比例 建设后经济收入构成比例 则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【答案】A解 法 1:由题干可知,农村的经济收入增加了一倍,实现翻番.为方便可设建设前后收入分别为1 0 0,2 0 0(单位省去).A中,种植收入前后分别为60,7 4,收入增加了,因此A选项不正确.B中,其他收入前后分别为4,1 0.增加了一倍以上,B正确.C中,养殖收入前后分别为3 0,60.收入增加了一倍,C正确.D中,建设后,养殖收入与第三产业收入的和为(3 0 +2 8)x 2 =1 1 6 1 0 0,D正 确.故 选 A【题目栏目】统计、用样本估计总体用样本的数字特征估计总体的数字特征【题目来源】2 0 1 8年高考数学课标卷I (文)第 3 题二、多选题9.(2 0 2 1 年新高考I 卷 第 9 题)有一组样本数据斗,,由这组数据得到新样本数据%,%,其中y =%+c(i =L 2,),c 为非零常数,则()A.两组样本数据的样本平均数相同B.两组样本数据样本中位数相同C.两组样本数据的样本标准差相同D.两组样数据的样本极差相同【答案】C D解析:A:E(y)=E(x +c)=E(x)+c 且cwO,故平均数不相同,错误;B:若第一组中位数为w,则第二组的中位数为%=X:+C,显然不相同,错误;C:D(y)=D(x)+D(c)=D(x),故方差相同,正确;D:由极差的定义知:若第一组的极差为n而-占“,则第二组的极差为Jmax-+C)-(/i n +=”,故极差相同,正确;故选C D.【题目栏目】统计,用样本估计总体用样本的数字特征估计总体的数字特征【题目来源】2 0 2 1 年新高考I 卷 第 9 题1 0.(2 0 2 0 年新高考全国卷H数学(海南)第9 题)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续1 1 天复工复产指数折线图,下列说法正确的是1 ZVA.这 1 1 天复工指数和复产指数均逐日增加;B.这 1 1 天期间,复产指数增量大于复工指数的增量;C.第 3天至第1 1 天复工复产指数均超过80%;D.第 9 天至第1 1 天复产指数增量大于复工指数的增量;【答案】C D解析:由图可知,第 1天到第2天复工指数减少,第 7 天到第8 天复工指数减少,第 1 0 天到第口复工指数减少,第 8 天到第9 天复产指数减少,故 A错误;由图可知,第一天的复产指标与复工指标的差大于第1 1 天的复产指标与复工指标的差,所以这1 1 天期间,复产指数增量小于复工指数的增量,故 B错误;由图可知,第 3天至第1 1 天复工复产指数均超过8 0%,故 C正确;由图可知,第 9 天至第1 1 天复产指数增量大于复工指数的增量,故 D正确;【题目栏目】统计,用样本估计总体、频率分布折线图【题目来源】2 0 2 0 年新高考全国卷I I 数学(海南)第9 题三、填空题1 1.(2 0 2 0 江苏高考第3题)已知一组数据4,2 a,3-。,5,6的平均数为4,则。的值是.【答案】【答案】2【解析】数据4,2 ,3 0,5,6的平均数为4,.4+2 +3-。+5+6=2 0,即a =2.故答案为:2.【题目栏目】统计用样本估计总体用样本的数字特征估计总体的数字特征【题目来源】2 0 2 0 江苏高考第3题1 2 .(2 0 1 9年高考全国I 文 第 1 4 题)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有 1 0 个车次的正点率为0.97,有 2 0 个车次的正点率为0.98,有 1 0 个车次的正点率为0.99,则经停该站 高 铁 列 车 所 有 车 次 的 平 均 正 点 率 的 估 计 值 为.【答案】【答案】0.98【解析】由题意得,经停该高铁站的列车正点数约为1 0 x 0.97+2 0 x().98+1 0 x 0.99=3 9.2,其中高3 9 2铁个数为1 0+2 0+1 0=4 0,所以该站所有高铁平均正点率约为王一 =0.98.4 0【点评】本题考点为概率统计,渗透了数据处理和数学运算素养.侧重统计数据的概率估算,难度不大.易忽视概率的估算值不是精确值而失误,根据分类抽样的统计数据,估算出正点列车数量与列车总数的比值.【题目栏目】统计 用样本估计总体 用样本的数字特征估计总体的数字特征【题目来源】20 19 年高考全国H文 第 14题13.(20 19 年高考江苏第 5 题)己知一组数据6,7,8,8,9,1 0,则 该 组 数 据 的 方 差 是.【答案】【答案】-3 解析由 x=-(6+7+8+8+9+l 0)=86所以 S 2=4(6 8)2+(7 8)2+(8-8)2+(8-8)2+(9 8 尸 +(10-8)2 =-.6 3【题目栏目】统计 用样本估计总体,用样本的数字特征估计总体的数字特征【题目来源】20 19 年高考江苏第5题14.(20 18 年高考数学江苏卷第3 题)已知5 位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位 裁 判 打 出 的 分 数 的 平 均 数 为.8 999 011(第 3 题)答案9 0解析:由茎叶图可知,5位裁判打出的分数分别为8 9,8 9,9 0,9 1,9 1,故平均数为所求人数为8 9 +8 9 +9 0 +9 1+9 1-=9 0.5【题目栏目】统计,用样本估计总体茎叶图的应用【题目来源】20 18 年高考数学江苏卷第3 题1 5.(20 18 年高考数学课标川卷(文)第14题)某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是.【答案】分层抽样解析:由题意,不同龄段客户对其服务的评价有较大差异,故采取分层抽样法.【题目栏目】统计 随机抽样 分层抽样【题目来源】20 18年高考数学课标H I卷(文)第14题四、解答题16.(20 22新高考全国I I卷第19题)在某地区进行流行病学调查,随机调查了 10 0位某种疾病患者的年龄,(1)估计该地区这种疾病患者的平均年龄(同一组中(2)估计该地区一位这种疾病患者的年龄位于区间 20,7 0)的概率;(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间 40,5 0)的人口占该地区总人口的1 6%.从该地区中任选一人,若此人的年龄位于区间 40,5 0),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0 0 0 1).【答案】(1)47.9岁;(2)0.8 9 ;0.0 0 14.解析:(1)平均年龄元=(5 x 0.0 0 1+15 x 0.0 0 2+25 x 0.0 12+35 x 0.0 17 +45 x 0.0 23+5 5 x 0.0 20 +6 5 x 0.0 17 +7 5 x 0.0 0 6 +8 5 x 0.0 0 2)x 10 =47.9 (岁).(2)设A =一人患这种疾病的年龄在区间 20,7 0),所以P(A)=1-尸(X)=1 -(0.0 0 1 +0.0 0 2+0.0 0 6 +0.0 0 2)x 10 =1-0.11=0.8 9.(3)设8 =任选一人年龄位于区间 40,5 0),C =任选一人患这种疾病,则由条件概率公式可得P(C =但=1 x 3。=0-0 0 1X 0.23=0 0 0 M37 5,0.0 0 14P的 1 6%01 6.【题 目栏目】统计 用样本估计总体 频率分布直方图【题目来源】2022新高考全国II卷 第19题17.(2022新高考全国I卷 第20题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了 100例(称为病例组),同时在未患该疾病的人群中随机调查了 100人(称为对照组),得到如下数据:不够良好女病例4060组对照1090组(D能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”焉P(BE|A)与磊P(律B 的|X比)值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记P(B|A)P(B|A)该指标为R.(i)证明:P(A|B)P(A 辰)P(AB)P(AB)(ii)利用该调查数据,给出0 4|6),(如豆)的估计值,并利用(i)的结果给出R的估计值.n(ad-bc)2(a+b)(c+d)(a+c)(b+d)附 之Q.00.0P(K2 510.001003.86.610.8k432158【答案】(1)答案见解析(2)(i)证明见解析;(i i)R =6;解析:(1)由已知K?n(ad-bc)2 _ 2 0 0(4 0 9 0 6 0 1 0)2(a+b)(c+d)(a+c)(b+d)5 0 x 1 5 0 x 1 0 0 x 1 0 0又 P(K2 6.6 3 5)=0.0 1,2 4 6.6 3 5,所以有9 9%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.(2)。)因为/?=P(B|A)尸 A)P(月|给 尸(A B)P(A)P(而)P(A)P(BA)一 P(A)P(A 8)-P(A)P(AB)所以R =P(A B)P(B)P(函 P 田)P(B)P(AB)P(B)P(AB)所以R =P(A|B)P(AB)P(AB)P(AB)4 0 -(i i)由己知尸(A|B)=商,P(AB)=1 0 l o o-6 0 9 0又 P(A|B)=,P(AB)=,1 0 0 1 0 0所以hP(A|B)P(A|B)【题目栏目】统计,相关关系、回归分析与独立性检验 线性回归分析【题目来源】2 0 2 2 新高考全国I 卷 第 2 0 题1 8.(2 0 2 2 年高考全国乙卷数学(文)第 1 9 题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了 1 0 棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:n?),得到如下数据:样本号i1234567891 0总和000.0 4 0.0 6 0.0 4 0.0 8 0.0 80.0 7 0.0 7 0.0 6 0.6根部横截面枳不材积量0.250.400.220.540.510.340.360.460.420.403.9y:10 10 10并计算得 Zk =O.O 3 8,Z :=L 6 1 5 8,Zx*=0 2 4 7 4.i=l i=l i=l(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.0 1);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为1 8 6 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.(七-君(凹一歹)附:相关系数=“,丽-1.3 7 7.-利 力(乂 -刃2V i=l i=l【答案】0.0 6 m2;0.3 9 m3 0.9 7(3)1 2 0 9 m3解析:【小问1详解】样本中1 0棵这种树木的根部横截面积的平均值元=0.0 6样本中1 0棵这种树木的材积量的平均值1 07 =0.3 91 0据此可估计该林区这种树木平均一棵的根部横截面积为0.0 6 m?,平均一棵的材积量为0.3 9 n?10 10(玉-可反)1 0 取【小问2详解】二八。.|。、曲王-可鲁(苗-刃J停邑2 Toy 20.2 47 4-1 0 x 0.0 6 x 0.3 90.0 1 3 4 0.0 1 3 47(0.0 3 8 -1 0 x 0.0 62)(1.6 1 58 -1 0 x 0.3 92)7 0.0 0 0 1 8 9 6 0.0 1 3 7 7*0.9 7 则”0.9 7【小问3详解】设该林区这种树木的总材积量的估计值为h n3,又已知树木的材积量与其根部横截面积近似成正比,可得6而=歹,解之得卜=1 2 0 9 m 3.则该林区这种树木总材积量估计为1 2 0 9 m3【题目栏目】统计相关关系、回归分析与独立性检验两个变量间的相关关系【题目来源】2 0 2 2 年高考全国乙卷数学(文)第 1 9 题1 9.(2 0 2 1 年高考全国甲卷文科第1 7 题)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了 2 0 0 件产品,产品的质量情况统计如下表:(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?一级品二级品合计甲机床1 50502 0 0乙机床1 2 08 02 0 0合计2 7 01 3 040 0(2)能否有99%把握认为甲机床的产品质量与乙机床的产品质量有差异?附:K-n(ad-bc)2(+/?)(c +d)(a 4-c)(Z 7 +d)P(K2k)0.0 50 0.0 1 00.0 0 1k3.8 416.6 3 51 0.8 2 8【答案】(1)7 5%;6 0%;(2)能.解析:(1)甲机床生产的产品中的一级品的频率 为 当=7 5%,2 0 0乙机床生产的产品中的一级品的频率1为2 0,=6 0%.2 0 0心40 0(1 50 x 8。-1 2 0 x 5。);幽 9 6 6 3 5,2 7 0 x 1 3 0 x 2 0 0 x 2 0 0 3 9故能有9 9%的把握认为甲机床的产品与乙机床的产品质量有差异.【题目栏目】统计相关关系、回归分析与独立性检验,独立性检验【题目来源】2 0 2 1 年高考全国甲卷文科第1 7 题2 0.(2 0 2 1 年全国高考乙卷文科第1 7 题)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了 1 0 件产品,得到各件产品该项指标数据如下:旧设备和新设备生产产品该项指标的样本平均数分别记为戛和亍,样本方差分别记为S;和旧设备9.81 0 31 0.01 0 29.99.81 0.0 1 0.1 1 0.29.7新设备1 0.1 1 0.41 0.1 1 0.0 1 0.1 1 0.3 1 0.6 1 0.51 0 41 0.5求7,S;,S;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果元2 2,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).【答案】(1)1 =1 0,7 =1 0.3,5;=0.0 3 6,S:=0.0 4;(2)新设备生产产品的该项指标的均值较旧设备有显著提高.9.8 +1 0.3 +1 0 +1 0.2 +9.9 +9.8 +1 0 +1 0.1 +1 0.2 +9.7,八解析:(1)x =-=1 0,1 01 0.1+1 0.4+1 0.1 +1 0+1 0.1 +1 0.3 +1 0.6 +1 0.5+1 0.4+1 0.51 0=1 0.3,S;=S;。灸+0.3 2+。+。.2 2+。.1 2+。.2 2+。+。./+。.2 2+0.3,=0 3 6,1 00.22+0.12+0.22+0.32+0.22+0 +0.32+0.22+0.12+0.221 0=0.0 4(2)依题意,-x=0.3 =2 x 0.1 5=2do.15?=2 1 0.0 2 5,=2 J 0.0 0 7 6,亍_ 1 2 2,t萨,所以新设备生产产品的该项指标的均值较旧设备有显著提高.【题目栏目】统计用样本估计总体,用样本的数字特征估计总体的数字特征【题目来源】2 0 2 1 年全国高考乙卷文科第1 7 题2 L (2 0 2 0 年高考课标H 卷 文 科 第 1 8 题)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的2 0 0 个地块,从这些地块中用简单随机抽样的方法抽取2 0 个作为样区,调查得到样本数据(X,必)(,=1,2,2 0),其中H和必分别表2 0 2 0示第1 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得2 七=60,=12 0 0 ,/=1 z=l2 0 2 0 2 0Z(x,君 2=8 0,2(%一9)2=9 0 0 0,Z(七一君(K 一刃=8 0 0./=1 ;=1 /=1(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);求样本(x“必)(/=1,2,2 0)的相关系数(精确到0.0 1);(3)根据现有统计资料.,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.(%-亍)(y -力附:相关系数4“,近.414.制2(丫 _ y)2V i=l /=!【答案】(1)12 0 0 0;0.9 4;详 见解析1 2 0 【解析】(1)样区野生动物平均数 为 右 Zx=右*12 0 0 =60,2 0 ,=i 2 0地块数为2 0 0,该地区这种野生动物的估计值为2 0 0 x 60 =12 0 0 0 样 本(玉,%)(,=1,2.20)的相关系数为20(X,-X)(X-7)800 2夜r=干 区-=180 x9000=亍0 94(力由(2)知各样区的这种野生动物的数量V i=l/=1与植物覆盖面积有很强的正相关性,由于各地块间植物覆盖面积差异很大,从俄各地块间这种野生动物的数量差异很大,采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.【点晴】本题主要考查平均数的估计值、相关系数的计算以及抽样方法的选取,考查学生数学运算能力,是一道容易题.【题目栏目】统计 相关关系、回归分析与独立性检验 两个变量间的相关关系【题目来源】2020年高考课标II卷 文 科 第 18题2 2.(2020年高考课标HI卷文科第18题)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级0,200(200,400(400,6001(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4 的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1 或 2,则称这天“空气质量好;若某天的空气质量等级为3 或 4,则称这天“空气质量不好”.根据所给数据,完成下面的2x2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次“00人次 400空气质量好空气质量不好附:心幽,(a+b)(c+d)(4-c)(b +d)P(K2k)0.0 5 00.0 1 00.0 0 1k3.84 16.6351 0.82 8【答案】该市一天的空气质量等级分别为1、2、3、4的概率分别为0.4 3、0.2 7、0.2 1、0.0 9;35 0;(3)有,理由见解析.【解析】(1)由频数分布表可知,该市一天的空气质量等级为1 的概率为 一总 一=0.4 3,等级为2的概率为 L2=0 2 7,等级为3 的概率为 7 +8=0 2 1,等级为4的概率为7 +2 +0=0.0 9;1 0 0 1 0 0 1 0 0(2)由频数分布表可知,一天中至U该公园锻炼的人次的平均数为IOOXIO+IOOXS+SOOX,SMBSO1 0 0(3)2 x 2 列联表如下:人次W 4 0 0人次4 0 0空气质量不好3337空气质量好2 28K?=1 0 0 x(33x 8-37x 2 2)25 5 x 4 5 x 70 x 30 5.82 0 3.84 1,因此,有9 5%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.【点睛】本题考查利用频数分布表计算频率和平均数,同时也考查了独立性检验的应用,考查数据处理能力,属于基础题.【题目栏目】统计,相关关系、回归分析与独立性检验,独立性检验【题目来源】2 0 2 0 年高考课标H I 卷 文 科 第 1 8题2 3.(2 0 2 0 年新高考全国I 卷(山东)第1 9题)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了 1 0 0 天空气中的P M 2.5 和S O 2 浓度(单位:g g/m3),得下表:SO2 PM2.50,50(50,150(150,4750,3532184(35,756812(75,1153710(1)估计事件 该市一天空气中P M 2.5 浓度不超过75,且S 02浓度不超过1 5 0 的概率;(2)根据所给数据,完成下面的2 x 2 列联表:SO2 PM2.50,150(150,4750,75(75,115 根 据 中 列 联 表,判断是否有9 9%的把握认为该市一天空气中P M 2.5 浓度与S O?浓度有关?附:心吼出,(a+b)(c+d)(a+c)(b+d)P(K2 k)0.050 0.010 0.001k3.841 6.63510.828【答案】(1)0.64;(2)答案见解析;(3)有.解析:(D 由表格可知,该市1 0 0 天中,空气中的P M 2.5 浓度不超过75,且S。?浓度不超过1 5 0 的天数有 32 +6+1 8+8=64 天,所以该市一天中,空气中的尸M 2.5 浓度不超过7 5,且S。?浓度不超过1 5 0 的 概 率 为=0.64;(2)由所给数据,可得2 x 2 列联表为:so2 0,1 5 0(1 5 0,4 75 合计PM2.5 0,75 641680(75,1 1 5 101020合计7426100(3)根据2 x 2 列联表中的数据可得n(ad-bc)2 1 0 0 x(64 x l 0-1 6x l 0)2 360 0-=-=-7.4 84 4 6.635 ,(a+0)(c+d)(a+c)S +。)80 x 2 0 x 74 x 2 6 4 81因为根据临界值表可知,有 9 9%的把握认为该市一天空气中P M 2.5 浓度与S O 2 浓度有关.【题目栏目】统计 相关关系、回归分析与独立性检验 线性回归分析【题目来源】2 0 2 0 年新高考全国I 卷(山东)第 1 9题2 4.(2 0 2 0 年新高考全国卷n 数学(海南)第 1 9题)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了 1 0 0 天空气中的P M 2.5 和S O?浓度(单位:g g/m3),得下表:(1)估计事孤 1 2 50.50(5 0,1 5 0(1 5 0,4 75 0,35 321 84(35,75681 2(75,115371 0件 该市一天空气中P M 2.5 浓度不超过75 ,且S 0 2 浓度不超过1 5 0”的概率;(2)根据所给数据,完成下面的2*2 列联表:0,150(150,4757习(75,115(3)根据(2)中的列联表,判断是否有9 9%的把握认为该市一天空气中P M 2.5 浓度与S 0?浓度有关?附:心幽出,(a+b)(c+d)(a+c)S +d)P(K2 k)0.050 0.010 0.001_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 答案(1)0.64;(2)答案见解析;(3)有.k 3.841 6.635 10.828解析:(1)由表格可知,该市1 0 0 天中,空气中的P M 2.5 浓度不超过75,且S。?浓度不超过1 5 0 的天数有 32 +6+1 8+8=64 天,64所以该市一天中,空气中的P M 2.5 浓度不超过7 5,且S。,浓度不超过1 5 0 的概率为=0.64 ;1 0 0(2)由所给数据,可得2 x 2 列联表为:S O2 P M 2.5 0,1 5 0(1 5 0,4 75 合计 0,75 641680(75,1 1 5 101020合计7426100(3)根据2 x 2 列联表中的数据可得K2n(ad-be)2 _ 1 0 0 x(64 x 1 0-1 6x l O)2(a+b)(c+d)(+c)(b +d)80 x 2 0 x 74 x 2 6 2 2 a 7.4844 6.635,481因为根据临界值表可知,有 9 9%的把握认为该市一天空气中P M 2.5 浓度与S。?浓度有关.【题目栏目】统计、相关关系、回归分析与独立性检验、线性回归分析【题目来源】2 0 2 0 年新高考全国卷H数学(海南)第 1 9题2 5.(2 0 1 9年高考天津文第1 5 题)2 0 1 9年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有7 2,1 08,1 2 0人,现采用分层抽样的方法,从该单位上述员工中抽取2 5 人调查专项附加扣除的享受情况.(1)应从老、中、青员工中分别抽取多少人?(2)抽取的2 5 人中,享受至少两项专项附加扣除的员工有6人,分别记为A,B,C,D,E,F.享受情况如表,其 中“O”表示享受,“x”表示不享受.现从这6人中随机抽取2人接受采访.员工ABCDEF子女教育OOXOXO继续教育XXOXOO大病医疗XXXOXX住房贷款利息OOXXOO住房租金XXOXXX赡养老人OOXXXO试用所给字母列举出所有可能的抽取结果;(i i)设 M 为事件“抽取的2 人享受的专项附加扣除至少有一项相同”,求事件M 发生的概率.【答案】【思路分析】(D根据分层抽样各层所抽比例相等可得结果;(2)用列举法求出基本事件数;(i i)用列举法求出事件M所含基本事件数以及对应的概率;【解析】(1)由已知,老、中、青员工人数之比为6:9:1 0,由于采用分层抽样从中抽取2 5 位员工,因此应从老、中、青员工中分别抽取6人,9人,1 0人;(2)从已知的6人中随机抽取2人的所有可能结果为A,B,A,C,A,D,A,E,A,F,B,C,B,D,B,E,B,F,C,D,C,E,C,F,C,E ,2 F ,E,F ,共 1 5 种;(i i)由表格知,符合题意的所有可能结果为 A B ,A,。,喋为,A,尸 ,B,D,B,E,B,F,C,E,C,F,D,F,E,F 一 共 1 1 种,所以,时间M发生的概率尸(M)=/.【归纳与总结】本题考查了用列举法求古典概型的概率问题以及根据数据分析统计结论的问题,是基础题目【题目栏目】统计 随机抽样 随机抽样的综合问题【题目来源】2 01 9年高考天津文第1 5题2 6.(2 01 9年高考全国I I 文第1 6题)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下实验:将2 00只小鼠随机分成A ,B两 组,每 组1 00只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据实验数据分别得到如下直方图:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.7 0.(1)求乙离子残留百分比直方图中