第十一章 统计与成对数据的分析-备战2024年高考数学专题测试模拟卷(新高考专用)含答案.pdf
备战 2024 年高考阶段性检测名校重组卷(新高考)统计与成对数据的分析统计与成对数据的分析本试卷 22 小题,满分 150 分。考试用时 120 分钟一、单项选择题:本题共 8 小题,每小题 5 分,共 40 分。在每小题给出的四个选项中,只有一项是符合题目要求的。1.(2023 四川成都七中二诊)一个果园培养了一种少籽苹果,现随机抽样一些苹果调查苹果的平均果籽数量,得到下列频率分布表:则根据表格,这批样本的平均果籽数量为()A.B.C.D.2(2023浙江一模)已知一组样本数据1x,2x,10 x的平均数为a,由这组数据得到另一组新的样本数据1y,2y,10y,其中2(1iiyxi,2,10),则()A两组样本数据的平均数相同B两组样本数据的方差不相同C两组样本数据的极差相同D将两组数据合成一个样本容量为 20 的新的样本数据,该样本数据的平均数为2a 3(2023四川一模)某部门调查了 200 名学生每周的课外活动时间(单位:)h,制成了如图所示的频率分布直方图,其中课外活动时间的范围是10,20,并分成10,12),12,14),14,16),16,18),18,20五组根据直方图,判断这 200 名学生中每周的课外活动时间不少于14h的人数是()A56B80C144D1844(2023山东统考二模)某射击运动员连续射击 5 次,命中的环数(环数为整数)形成的一组数据中,中位数为 8,唯一的众数为 9,极差为 3,则该组数据的平均数为()A7.6B7.8C8D8.25(2023 河北唐山二模)某校高三年级一共有名同学参加数学测验,已知所有学生成绩的第百分位数是分,则数学成绩不小于分的人数至少为()A.B.C.D.6(2023河南一模)为迎接北京 2022 年冬奥会,小王选择以跑步的方式响应社区开展的“喜迎冬奥爱上运动”(如图)健身活动 依据小王 2021 年 1 月至 2021 年 11 月期间每月跑步的里程(单位:十公里)数据,整理并绘制的折线图,根据该折线图,下列结论正确的是()A月跑步里程逐月增加B月跑步里程的极差小于 15C月跑步里程的中位数为 5 月份对应的里程数D1 月至 5 月的月跑步里程的方差相对于 6 月至 11 月的月跑步里程的方差更大7(2023安徽马鞍山统考三模)某校高三(1)班(45 人)和高三(2)班(30 人)进行比赛,按照分层抽样的方法从两个班共抽取 10 名同学,相关统计情况如下:高三(1)班答对题目的平均数为1,方差为1;高三(2)班答对题目的平均数为1.5,方差为0.35,则这 10人答对题目的方差为()A0.61B0.675C0.74D0.88.(2023山东菏泽统考二模)足球是一项大众喜爱的运动,为了解喜爱足球是否与性别有关,随机抽取了若干人进行调查,抽取女性人数是男性的 2 倍,男性喜爱足球的人数占男性人数的56,女性喜爱足球的人数占女性人数的13,若本次调查得出“在犯错误的概率不超过 0.005 的前提下认为喜爱足球与性别有关”的结论,则被调查的男性至少有()人 22n adbcabcdacbda0.100.050.010.0050.001ax2.7063.8415.6357.87910.828A10B11C12D13二、多项选择题:本题共 4 小题,每小题 5 分,共 20 分。在每小题给出的选项中,有多项符合题目要求。全部选对的得 5 分,部分选对的得 2 分,有选错的得 0 分。9(2023广东惠州统考模拟预测)在某市高二举行的一次期中考试中,某学科共有 2000人参加考试.为了了解本次考试学生成绩情况,从中抽取了部分学生的成绩(成绩均为正整数,满分为 100 分)作为样本进行统计,样本容量为n.按照50,60,60,70,70,80 80,90,90,100的分组作出频率分布直方图,如图所示.其中,成绩落在区间50,60内的人数为 16.则下列结论正确的有()A样本容量1000n B图中0.030 x C估计该市全体学生成绩的平均分为70.6分D该市要对成绩由高到低前20%的学生授予“优秀学生”称号,则成绩为 78 分的学生肯定能得到此称号10(2023广东佛山模拟)为考查某种营养品对儿童身高增长的影响,选取部分儿童进行试验,根据 100 个有放回简单随机样本的数据,得到如下列联表,由表可知下列说法正确的是()身高营养品有明显增长无明显增长合计食用a1050未食用b3050合计6040100参考公式:2nadbc2abcdacbd,其中 nabcd.参考数据:0.10.050.010.0050.001x2.7063.8416.6357.87910.828A.ab30B212.667C从样本中随机抽取 1 名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是35D根据小概率值 0.001 的独立性检验,可以认为该营养品对儿童身高增长有影响11(2023湖南长沙模拟)自然环境中,大气压受到各种因素的影响,如温度、湿度、风速和海拔等方面的改变,都将导致大气压发生相应的变化,其中以海拔的影响最为显著下图是根据一组观测数据得到海拔 6 千米15 千米的大气压强散点图,根据一元线性回归模型得到经验回归方程为1=4.0+68.5,决定系数为21=0.99;根据非线性回归模型得到经验回归方程为2=132.9e0.163,决定系数为 22=0.99,则下列说法正确的是()A由散点图可知,大气压强与海拔高度负相关B由方程1=4.0+68.5可知,海拔每升高 1 千米,大气压强必定降低 4.0kPaC由方程1=4.0+68.5可知,样本点(11,22.6)的残差为1.9D对比两个回归模型,结合实际情况,方程2=132.9e0.163的预报效果更好12(2023云南师大附中模拟)根据气象学上的标准,连续 5 天的日平均气温低于 10 即为入冬,将连续 5 天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有 4 组样本,依次计算得到结果如下:平均数x4;平均数x4 且极差小于或等于 3;平均数x10.828x0.001,所以根据小概率值 0.001 的独立性检验,可以认为该营养品对儿童身高增长有影响,所以 B 错误,D 正确;从样本中随机抽取 1 名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是4010025,所以 C 错误11(2023湖南长沙模拟)自然环境中,大气压受到各种因素的影响,如温度、湿度、风速和海拔等方面的改变,都将导致大气压发生相应的变化,其中以海拔的影响最为显著下图是根据一组观测数据得到海拔 6 千米15 千米的大气压强散点图,根据一元线性回归模型得到经验回归方程为1=4.0+68.5,决定系数为21=0.99;根据非线性回归模型得到经验回归方程为2=132.9e0.163,决定系数为 22=0.99,则下列说法正确的是()A由散点图可知,大气压强与海拔高度负相关B由方程1=4.0+68.5可知,海拔每升高 1 千米,大气压强必定降低 4.0kPaC由方程1=4.0+68.5可知,样本点(11,22.6)的残差为1.9D对比两个回归模型,结合实际情况,方程2=132.9e0.163的预报效果更好【答案】ACD【分析】根据散点图即可得出 A 项;根据回归方程的含义可判断 B 项;根据残差计算公式求出残差,可判断 C 项;根据实际大气压强不能为负,可判断 D 项.【详解】对于 A 项,由图象知,海拔高度越高,大气压强越低,所以大气压强与海拔高度负相关,故 A 项正确;对于 B 项,回归直线得到的数据为估计值,而非精确值,故 B 项错误;对于 C 项,当=11时,1=4.0 11+68.5=24.5,又由散点图知观测值为22.6,所以样本点(11,22.6)的残差为22.624.5=1.9,故 C 项正确;对于 D 项,随着海拔高度的增加,大气压强越来越小,但不可能为负数,因此方程2=132.9e0.163的预报效果更好,故 D 项正确.故选:ACD.12(2023云南师大附中模拟)根据气象学上的标准,连续 5 天的日平均气温低于 10 即为入冬,将连续 5 天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有 4 组样本,依次计算得到结果如下:平均数x4;平均数x4 且极差小于或等于 3;平均数x4 且标准差 s4;众数等于 5 且极差小于或等于 4.则 4 组样本中一定符合入冬指标的共有()A1 组 B2 组 C3 组 D4 组【答案】B【解析】举反例:0,0,0,4,11,其平均数x34.但不符合入冬指标;假设有数据大于或等于 10,由极差小于或等于 3 可知,则此组数据中的最小值为 1037,此时数据的平均数必然大于 7,与x4 矛盾,故假设错误则此组数据全部小于 10.符合入冬指标;举反例:1,1,1,1,11,平均数x34,且标准差 s4.但不符合入冬指标;在众数等于 5 且极差小于等于 4 时,最大数不超过 9.符合入冬指标 三、填空题:本大题共 4 小题,每小题 5 分,共 20 分。13(2023 山东滨州模拟)已知某中学老年教师的“亚健康”率为,中年教师的“亚健康”率为,青年教师的“亚健康”率为.若该中学共有名老年教师,名中年教师,名青年教师,则该校教师的“亚健康率为_.【答案】【解析】根据题意,该校教师的“亚健康”率为:.14.(2023福建一模)以下为甲、乙两组按从小到大顺序排列的数据:甲组:14,30,37,a,41,52,53,55,58,80;乙组:17,22,32,43,45,49,b,56若甲组数据的第 40 百分位数和乙组数据的平均数相等,则4ab【答案】100【分析】根据百分位数和平均数的定义即可列出式子计算求解【详解】解:因为1040%4,甲组数据的第 40 百分位数为第四个数和第五个数的平均数,乙组数据的平均数为172232434549568b,根据题意得411722324345495628ab,解得:4164264ab,所以4100ab故答案为:10015.(2023沧州模拟)已知某样本数据分别为 1,2,3,a,6,若样本平均数x3,则样本方差 s2_.【答案】145【解析】由题设,得x123a653,可得 a3,所以 s21551i(xix)2145.16.(2023 河北石家庄部分学校开学考)湖北省中药材研发中心整合省农业科技创新中心、省创新联盟相关资源和力量,为全省中药材产业链延链、补链、强链提供科技支撑,某科研机构研究发现,某品种中医药的药物成分甲的含量(单位:)与药物功效(单位:药物单位)之间满足,检测这种药品一个批次的 个样本,得到成分甲的含量 的平均值为,标准差为,则估计这批中医药的药物功效的平均值为_药物单位.【答案】【解析】设 个样本中药物成分甲的含量分别为,因为成分甲的含量的平均值为,所以,标准差为,所以,可得 又由,所以,所以这批中医药的药物功效的平均值为 故答案为:.四、解答题:本大题共 6 小题,共 70 分,请在答题卡指定区域内作答,解答时应写出文字说明、证明过程或演算步骤。17(2023广东惠州统考模拟预测)某地经过多年的环境治理,已将荒山改造成了绿水青山为估计一林区某种树木的总材积量,随机选取了 10 棵这种树木,测量每棵树的根部横截面积(单位:2m)和材积量(单位:3m),得到如下数据:样本号12345678910总和根部横截面积ix0.040.060.040.080.080.050.050.070.070.060.6材积量iy0.250.400.220.540.510.340.360.460.420.403.9并计算得10101022iiiii=1i=1i=10.038,1.6158,0.2474xyx y(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到 0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为2186m已知树木的材积量与其根部横截面积近似成正比利用以上数据给出该林区这种树木的总材积量的估计值附:相关系数iii=122iii=1i=1(,1.8961.377)()()()nnnxxyyrxxyy【解析】(1)样本中 10 棵这种树木的根部横截面积的平均值0.60.0610 x 样本中 10 棵这种树木的材积量的平均值3.90.3910y 据此可估计该林区这种树木平均一棵的根部横截面积为20.06m,平均一棵的材积量为30.39m(2)1010iiiii=1i=110101010222222iiiii=1i=1i=1i=1101010 xxyyx yxyrxxyyxxyy22(0.038 10 0.06)(1.6158 10.2474 10 0.06 0.390.01340.01340.970.013770.0000 018996.3)则0.97r(3)设该林区这种树木的总材积量的估计值为3mY,又已知树木的材积量与其根部横截面积近似成正比,可得0.06186=0.39Y,解之得3=1209mY则该林区这种树木的总材积量估计为31209m18(2023山东临沂二模)某农科所统计了单位面积某种化肥实施量 x(kg)和玉米相应产量 Y(kg)的相关数据,制作了数据对照表:x(kg)1620242936Y(kg)340350362404454若在合理施肥范围内 x 与 Y 具有线性相关关系,(1)求 Y 关于 x 的线性回归方程 ybxa;(2)请利用线性回归方程预测40kgx 时的玉米产量.附:回归直线的斜率和截距的最小二乘法估计公式分别为:121niiiniixxyybxx,aybx.【解析】(1)解:由表中数据计算得,25x.382y,511438iiixxyy,521244iixx,515215.893iiiiixxyybxx,3825.893 25234.675aybx.所以回归方程为5.893234.675yx.(2)将40kgx 代入回归方程得5.893234.675yx.故预测40kgx 时,玉米产量约为5.893 40234.675470.395kg.19(2023广东汕头统考一模)2023 年 1 月 14 日,翘首以盼的汕头镇邦美食街开街啦!近年来,汕头多措并举,提升汕头美食品牌,推动潮汕菜产业做大做强,镇邦美食街的建成开街,是汕头美食产业的又一里程碑,同时“舌尖汕头”汕头美食地图同步上线,以微信小程序的形式面向游客,并通过意见反馈功能收集游客满意度调查问卷(1)现将游客按年龄段分为老中青三个群体,通过问卷数据分析显示,老年群体中有56%的游客给予好评,中年群体有65%的游客给予好评,青年群体中有70%的游客给予好评,且老中青三个群体游客人数之比为5:6:9,从这三个群体中随机抽取 1 名游客,求该游客给予好评的概率(2)镇邦美食街共有20多家餐饮单位进驻,为维护市场价格秩序,营造公平竞争良好环境,汕头市监管部门到镇邦美食街举办餐饮明码标价现场指导会,现针对明码标价指导会前、会后游客满意度进行问卷回访调查,统计了100名游客的数据,列出如下22列联表:对镇邦美食街餐饮价格是否满意明码标价指导会前明码标价指导会后合计满意285785不满意12315合计4060100请根据小概率值0.001的独立性检验判断游客对汕头镇邦美食街餐饮价格满意度与监管部门举办明码标价现场指导会是否有关联参考公式:22n adbcabcdacbd,nabcd 2P xx0.10.050.010.0050.001x2.7063.8416.6357.87910.828【解析】(1)设游客总人数为m,则老年人有515694mm(人),中年人有6356910mm(人),青年人有9956920mm(人),所以给予好评的人数为13965%70%0.65410256%0mmmm,所以从这三个群体中随机抽取 1 名游客,该游客给予好评的概率0.650.65mPm.(2)零假设为0H:游客对汕头镇邦美食街餐饮价格满意度与监管部门举办明码标价现场指导会之间无关联,根据列联表中的数据,经计算得到0.00122100 28 3 12 5711.76510.82840 60 85 15x,根据小概率值0.001的独立性检验,我们推断0H不成立,即认为游客对汕头镇邦美食街餐饮价格满意度与监管部门举办明码标价现场指导会之间有关联,此推断犯错误的概率不大于0.001.20(2023黑龙江哈尔滨哈尔滨三中校考二模)中国共产党第二十次全国代表大会上的报告中提到,新时代十年我国经济实力实现历史性跃升,国内生产总值从 54 万亿元增长到 114万亿元,我国经济总量稳居世界第二位.建立年份编号为解释变量,地区生产总值为响应变量的一元线性回归模型,现就 2012-2016 某市的地区生产总值统计如下:年份20122013201420152016年份编号12345地区生产总值(亿元)2.83.13.94.65.6(1)求出回归方程,并计算 2016 年地区生产总值的残差;(2)随着我国打赢了人类历史上规模最大的脱贫攻坚战,该市 2017-2022 的地区生产总值持续增长,现对这 11 年的数据有三种经验回归模型1.0171.200yx、3.8161.645yx、20.1072.365yx,它们的2R分别为 0.976、0.880 和 0.985,请根据2R的数值选择最好的回归模型预测一下 2023 年该市的地区生产总值;(3)若 2012-2022 该市的人口数(单位:百万)与年份编号的回归模型为0.21.2yx,结合(2)问中的最佳模型,预测一下在 2023 年以后,该市人均地区生产总值的变化趋势参考公式:1122211nniiiiiinniiiix ynxyxxyybxnxxx,aybx$;【解析】(1)由数据,1234535x,2.83.1 3.94.65.645y,而512.86.2 11.7 18.42867.1iiix y,521149162555iix,所以267.1 5 3 40.715553b ,则40.71 31.87a ,综上,回归方程为0.711.87yx,当5x 时,0.71 5 1.8.75 42y ,故 2016 年地区生产总值残差为5.65.420.18.(2)根据相关指数越大拟合越好,由于0.9850.9760.880,故20.1072.365yx模型较好,因 2023 年对应12x,则20.107 122.36517.773y 亿元.(3)由(2)及题设知:该市人均地区生产总值220.1072.3650.535(6)6.42(6)31.08531.0850.535(6)6.420.21.266xxxxxxx,令618tx,且31.0850.535ytt,若2118tt,所以122121211 21 231.085()31.0850.535()()(0.535)ttyyttttt tt t,而211 20,18 19342ttt t且,则1 231.0850.5350t t,故21yy,所以31.0850.535ytt在18,)上递增,则在18,)上递增,所以该市人均地区生产总值逐年递增.21(2023山西运城统考三模)数据显示中国车载音乐已步入快速发展期,随着车载音乐的商业化模式进一步完善,市场将持续扩大,下表为 20182022 年中国车载音乐市场规模(单位:十亿元),其中年份 20182022 对应的代码分别为 15年份代码 x12345车载音乐市场规模 y2.83.97.312.017.0(1)由上表数据知,可用指数函数模型xya b拟合 y 与 x 的关系,请建立 y 关于 x 的回归方程(a,b 的值精确到 0.1);(2)综合考虑 2023 年及 2024 年的经济环境及疫情等因素,某预测公司根据上述数据求得 y关于 x 的回归方程后,通过修正,把 b-1.3 作为 2023 年与 2024 年这两年的年平均增长率,请根据2022年中国车载音乐市场规模及修正后的年平均增长率预测2024年的中国车载音乐市场规模参考数据:v51iiixv0.524e0.472e1.9433.821.71.6其中lniivy,5=115iivv参考公式:对于一组数据 1122,nnu vu vu v,其回归直线vau的斜率和截距的最小二乘法估计公式分别为1221,niiiniiu vnu vavuunu【答案】(1)1.7 1.6xy(2)28.73十亿元【详解】(1)解:因为xya b,所以两边同时取常用对数,得lnlnlnyaxb,设lnvy,所以lnlnvaxb,设ln,lnab,因为3,1.94xv,所以515221233.825 3 1.940.472,555355iiiiixvx vxx 1.940.472 30.524vx,所以ln0.524,ln0.472ab所以0.5240.472e1.7,e1.6ab 所以1.7 1.6xy(2)由(1)知 2023 年与 2024 年这两年的年平均增长率1.3.1.60 3,2022 年中国车载音乐市场规模为 17,故预测 2024 年的中国车载音乐市场规模217 1 0.328.73(十亿元).22(2023湖南永州统考三模)为了精准地找到目标人群,更好地销售新能源汽车,某 4S店对近期购车的男性与女性各 100 位进行问卷调查,并作为样本进行统计分析,得到如下列联表40,mmN:购买新能源汽车(人数)购买传统燃油车(人数)男性80m20m女性60m40m(1)当0m 时,将样本中购买传统燃油车的购车者按性别采用分层抽样的方法抽取 6 人,再从这 6 人中随机抽取 3 人调查购买传统燃油车的原因,记这 3 人中女性的人数为 X,求 X 的分布列与数学期望;(2)定义2ijij2ij2i3,2j3,i,jABKNB ,其中ijA为列联表中第 i 行第 j 列的实际数据,ijB为列联表中第 i 行与第 j 列的总频率之积再乘以列联表的总频数得到的理论频数.基于小概率值的检验规则:首先提出零假设0H(变量 X,Y 相互独立,然后计算2K的值,当2Kx时,我们推断0H不成立,即认为 X 和 Y不独立,该推断犯错误的概率不超过;否则,我们没有充分证据推断0H不成立,可以认为 X 和 Y 独立.根据2K的计算公式,求解下面问题:(i)当0m 时,依据小概率值0.005的独立性检验,请分析性别与是否喜爱购买新能源汽车有关;()当10m 时,依据小概率值0.1的独立性检验,若认为性别与是否喜爱购买新能源汽车有关,则至少有多少名男性喜爱购买新能源汽车?附:0.10.0250.005x2.7065.0247.879【答案】(1)分布列见解析,()2E X(2)(i)性别与是否购买新能源汽车有关联;()76 名【详解】(1)当 m=0 时,用分层抽样的方法抽取购买传统燃油车的 6 人中,男性有 2 人,女性有 4 人.由题意可知,X 的可能取值为 1,2,3.211203242424333666C CC CC C1311,2,3.C5C5C5P XP XP XX 的分布列如下表X123P153515131()1232555E X .(2)(i)零假设为0H:性别与是否购买新能源汽车独立,即性别与是否购买新能源汽车无关联.当 m=0 时,2,22,22,32,380,70,20,0.5 0.3 20030ABAB,3,260A,3,23,33,30.5 0.720070,40,0.5 0.3 20030BAB22222,22,22,32,33,23,23,33,322,22,33,23,3ABABABABKBBBB222280702030607040302009.52470307030210.0059.5247.879,x根据小概率值0.005的独立性检验,我们推断0H不成立,即认为性别与是否购买新能源汽车有关联,此推断犯错误的概率不超过 0.005.()2222280m7020m3060m7040m30K7030703022 10m21由题意可知22 10m)2.70621(,整理得210)28.413m(,10mNm又,4m所以m的最大值为 4,又80476,至少有 76 名男性购买新能源汽车.