备战2024年高考数学一轮复习人教a必修第二册第九章 统计、成对数据的统计分析第2节 用样本估计总体.docx
第2节用样本估计总体 选题明细表 知识点、方法题号百分位数计算3,7样本数字特征的计算1,2,6,8,10,12,13综合问题4,5,9,11,14,151.(多选题)(2022·河北石家庄二模)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,发生改变的数字特征是(BCD)A.中位数 B.平均数 C.方差 D.极差解析:中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.2.已知样本数据x1,x2,xn(nN*)的平均数与方差分别是a和b,若yi=-2xi+3(i=1,2,n),且样本数据y1,y2,yn的平均数与方差分别是b和a,则a-b等于(A)A.1B.2C.3D.4解析:由题意得-2a+3=b,a=4b,解得a=43,b=13,故a-b=1.3.高二(1)班共有40人,甲同学在一次测验中的成绩是第9名,则甲同学成绩的百分位数约是(D)A.25 B.20C.40 D.80解析:设甲同学成绩的百分位数约是x,依题意得x100·40=40-9,解得x=77.5,故甲同学成绩的百分位数约为80.4.(2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图,则(B)A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差解析:对于A,讲座前问卷答题的正确率的中位数是70%+75%2=72.5%,所以A错误;对于B,讲座后问卷答题的正确率分别是80%,85%,85%,85%,85%,90%,90%,95%,100%,100%,其平均数显然大于85%,所以B正确;对于C,由题图可知,讲座前问卷答题的正确率波动较大,讲座后问卷答题的正确率波动较小,所以讲座前问卷答题的正确率的标准差大于讲座后问卷答题的正确率的标准差,所以C错误;对于D,讲座前问卷答题的正确率的极差是95%-60%=35%,讲座后问卷答题的正确率的极差是100%-80%=20%,所以讲座前问卷答题的正确率的极差大于讲座后问卷答题的正确率的极差,所以D错误.5.(2021·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图,根据此频率分布直方图,下列结论不正确的是(C)A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间解析:对于A,根据频率分布直方图知该地农户家庭年收入低于4.5万元的农户比率估计为(0.02+0.04)×1=0.06,正确;对于B,根据频率分布直方图知该地农户家庭年收入不低于10.5万元的农户比率估计为(0.04+0.02+0.02+0.02)×1=0.10,正确;对于C,根据频率分布直方图知该地农户家庭年收入的平均值估计为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),错误;对于D,根据频率分布直方图知该地农户家庭年收入介于4.5万元至8.5万元之间的农户比率估计为(0.10 +0.14+0.20+0.20)×1=0.64,正确.6.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间0,10内的一个数来表示,该数越接近10表示满意度越高.甲、乙两名同学分别随机抽取10位本地市民调查他们的幸福感指数,甲得到10位市民的幸福感指数分别为5,6,6,7,7,7,7,8,8,9,乙得到10位市民的幸福感指数的平均数为8,方差为2.2,则这20位市民幸福感指数的方差为(C)A.1.75B.1.85C.1.95D.2.05解析:设甲得到的10位市民的幸福感指数分别为x1,x2,x10,乙得到10位市民的幸福感指数分别为x11,x12,x20,故这20位市民的幸福感指数的方差为120(x12+x22+x102+x112+x202)-x2,因为乙得到10位市民的幸福感指数的平均数为8,方差为2.2,x11+x12+x20=8×10=80,故x=5+6+6+7+7+7+7+8+8+9+10×820=7.5,而110(x112+x202)-64=2.2,故x112+x202=662,而x12+x22+x102=52+62+62+4×72+2×82+92=502,故所求的方差为120(502+662)-7.52=1.95.7.(2022·山东济南二模)2022年4月24日是第七个“中国航天日”,今年的主题是“航天点亮梦想”.某校组织学生参与航天知识竞答活动,某班8名同学成绩如下:7,6,8,9,8,7,10,m.若去掉m,该组数据的第25百分位数保持不变,则正整数m(1m10)的值可以是.(写出一个满足条件的m值即可) 解析:7,6,8,9,8,7,10,m,若去掉m,该组数据从小到大排列为6,7,7,8,8,9,10,则7×0.25=1.75,故第25百分位数为第二个数即7,所以7,6,8,9,8,7,10,m,第25百分位数为7,而8×0.25=2,所以7为第二个数与第三个数的平均数,所以正整数m(1m10)的值可以是7或8或9或10.答案:7(或8或9或10)8.已知某工厂连续5天生产的口罩数依次为x1,x2,x3,x4,x5(单位:十万只),若这组数据x1,x2,x3,x4,x5的方差为1.44,且x12,x22,x32,x42,x52的平均数为4,则该工厂这5天平均每天生产口罩十万只. 解析:依题意,得x12+x22+x52=20.设x1,x2,x3,x4,x5的平均数为x,根据方差的计算公式有15(x1-x)2+(x2-x)2+(x5-x)2=1.44,所以(x12+x22+x52)-2x(x1+x2+x5)+5x2=7.2,即20-10x2+5x2=7.2,所以x=1.6.答案:1.69.为了调查疫情期间物理网课学习情况,某校组织了高一年级学生进行了物理测试.根据测试成绩(总分100分,成绩范围为40,100),将所得数据按照40,50),50,60),60,70),70,80),80,90),90,100分成6组,其频率分布直方图如图所示.(1)求图中a的值;(2)试估计本次物理测试成绩的平均分;(同一组中的数据用该组区间的中点值为代表)(3)该校准备对本次物理测试成绩优异(将成绩从高到低排列,排在前13%的为优异)的学生进行嘉奖,则受嘉奖的学生分数不低于多少.解:(1)由(0.005+0.010+0.015×2+a+0.030)×10=1,解得a=0.025.(2)45×0.05+55×0.15+65×0.3+75×0.25+85×0.15+95×0.1=71,故本次物理测试成绩的平均分为71.(3)设受嘉奖的学生分数不低于x分,因为80,90),90,100对应的频率分别为0.15,0.1,所以(90-x)×0.015+0.1=0.13,解得x=88,故受嘉奖的学生分数不低于88分.10.某创业公司共有36名职工,为了了解该公司职工的年龄构成情况,随机采访了9个代表,得到的数据分别为36,36,37,37,40,43,43,44,44,若用样本估计总体,年龄在(x-s,x+s)内的人数占公司人数的百分比是(其中x是平均数,s为标准差,结果精确到1%)(C)A.14% B.25% C.56% D.67%解析:依题意,x=19×(36+36+37+37+40+43+43+44+44)=40,s=19×(42×4+32×4+0)=103,所以年龄在(x-s,x+s)内的人数即在(1103,1303)的人数有5人,故年龄在(x-s,x+s)内的人数占公司人数的百分比为59×100%56%.11.(多选题)(2022·广东湛江高三月考)某中学为了解高三男生的体能情况,通过随机抽样,获得了200名男生的100 m体能测试成绩(单位:s),将数据按照11.5,12),12,12.5),15.5,16分成9组,制成了如图所示的频率分布直方图.由频率分布直方图推断,下列选项正确的是(BC)A.a的值为0.38B.估计本校高三男生100 m体能测试成绩的众数为13.75 sC.估计本校高三男生100 m体能测试成绩不大于13 s的人数为54D.估计本校高三男生100 m体能测试成绩的中位数为13.7 s解析:因为在频率分布直方图中,所有小矩形的面积之和为1,所以(0.08+0.16+0.30+a+0.52+0.30+0.12+0.08+0.04)×0.5=1a=0.4,因此A错误;分布在13.5,14)小组的矩形面积最大,所以众数出现在这个小组内,所以估计众数为13.5+142=13.75,因此B正确;成绩不大于13 s的频率之和为(0.08+0.16+0.30)×0.5=0.27,0.27×200=54,因此C正确;设中位数为b,则(0.08+0.16+0.30+0.40)×0.5+0.52(b-13.5)=0.5b13.56,因此D错误.12.气象意义上从春季进入夏季的标志为连续5天的日平均温度均不低于22.现有甲、乙、丙三地连续5天的日平均温度(都是正整数,单位:)的记录数据如下:甲地5个数据的中位数为26,众数为22;乙地5个数据的平均数为26,方差为5.2;丙地5个数据的中位数为26,平均数为26.4,极差为8,则从气象意义上肯定进入夏季的地区是(D)A.B.C.D.解析:因为众数为22,所以至少出现2次,若有一天低于22,则中位数不可能是26,所以甲地肯定进入夏季;设温度由低到高为x1,x2,x3,x4,x5,根据方差的定义,15(x1-26)2+(x2-26)2+(x3-26)2+(x4-26)2+(x5-26)2=5.2,所以(x1-26)2+(x2-26)2+(x3-26)2+(x4-26)2+(x5-26)2=26,若有一天低于22,不妨设x1=21,则有一天为25或27,其他天均为26.不满足平均数26,故没有低于22的,所以乙地进入夏季;设温度由低到高为a,b,c,d,e,由题意可得c=26,e=a+8,取a=21,则e=29,故b26,d29,b+d55,由平均数的定义可得15(a+b+c+d+e)=26.4,则a+b+c+d+e=132,可得b+d=56,与b+d55矛盾,所以丙地进入夏季.13.某校高一年级有甲、乙、丙三名学生,他们前三次月考的物理成绩如表所示,第一次月考物理成绩第二次月考物理成绩第三次月考物理成绩学生甲808590学生乙818385学生丙908682则下列结论正确的是.(填序号) 甲、乙、丙第三次月考物理成绩平均数为86;在这三次月考的物理成绩中,丙的平均分最高;在这三次月考的物理成绩中,乙的成绩最稳定;在这三次月考的物理成绩中,丙的成绩方差最大.解析:由题表中数据知,甲、乙、丙第三次月考的物理成绩的平均数为90+85+823=2573<86,因此错误;这三次月考的物理成绩中,x甲=13×(80+85+90)=85,x乙=13×(81+83+85)=83,x丙=13×(90+86+82)=86,所以正确;由s甲2=13×(80-85)2+(85-85)2+(90-85)2=503,s乙2=13×(81-83)2+(83-83)2+(85-83)2=83,s丙2=13×(90-86)2+(86-86)2+(82-86)2=323,这三次月考的物理成绩中,甲的成绩方差最大,乙的方差最小,所以正确,错误.答案:14.(2022·黑龙江哈尔滨高三模拟)某经销商采购了一批水果,根据某些评价指标进行打分,现从中随机抽取20筐(每筐10 kg),得分数据为17,23,29,31,34,40,46,50,51,51,58,62,62,68,71,78,79,80,85,95.根据以往的大数据认定:得分在区间(0,25,(25,50,(50,75,(75,100内的分别对应四级、三级、二级、一级.(1)试求这20筐水果得分的平均数;(2)用样本估计总体,经销商参考以下两种销售方案进行销售,方案1:将得分的平均数换算为等级,按换算后的等级出售;方案2:分等级出售.不同等级水果的售价如表所示:等级一级二级三级四级售价/(万元/吨)21.81.41.2请从经销商的角度,根据售价分析采用哪种销售方案较好?并说明理由.解:(1)这20筐水果得分的平均数为120×(17+23+29+31+34+40+46+50+51+51+58+62+62+68+71+78+79+80+85+95)=55.5.(2)方案1:由于得分的平均数55.5(50,75,所以可以估计这批水果的销售单价为1.8万元/吨.方案2:设这批水果售价的平均值为x万元/吨,由已知数据得,得分在(0,25内的有17,23,共2个,所以估计四级水果所占比例为110,得分在(25,50内的有29,31,34,40,46,50,共6个,所以估计三级水果所占比例为310,得分在(50,75内的有51,51,58,62,62,68,71,共7个,所以估计二级水果所占比例为720,得分在(75,100内的有78,79,80,85,95,共5个,所以估计一级水果所占比例为14,则x=2×14+1.8×720+1.4×310+1.2×110=1.67(万元/吨).所以从经销商的角度考虑,采用方案1的售价较高,所以采用方案1较好.15.为了切实维护居民合法权益,提高居民识骗防骗能力,守好居民的“钱袋子”,某社区开展“全民反诈在行动反诈骗知识竞赛”活动.现从参加该活动的居民中随机抽取了100名,统计出他们的竞赛成绩(成绩范围为40,100)分布如表所示:成绩X人数40,50)250,60)a60,70)2270,80)b80,90)2890,100a(1)求a,b的值,并补全频率分布直方图;(2)估计该社区居民竞赛成绩的平均数x和方差s2;(同一组中的数据用该组区间的中点值为代表)(3)以频率估计概率,若P(Xx-s)(0.8,0.9,社区可获得“反诈先进社区”称号,若P(Xx-s)(0.9,1,社区可获得“反诈先锋社区”称号,试判断该社区可获得哪种称号?(s为竞赛成绩标准差)解:(1)由题可知,a=0.004×10×100=4,b=100-(2+4+22+28+4)=40,所以100名居民中,竞赛成绩在70,80)内的频率为40100=0.4,所以频率组距=0.4÷10=0.040,补全频率分布直方图如图所示.(2)估计该社区居民竞赛成绩的平均数x=45×2100+55×4100+65×22100+75×40100+85×28100+95×4100=75,估计该社区居民竞赛成绩的方差s2=(45-75)2×2100+(55-75)2×4100+(65-75)2×22100+(75-75)2×40100+(85-75)2×28100+(95-75)2×4100=100.(3)由(1)可得s=100=10,所以P(Xx-s)=P(X65)=1-P(X<65)=1-(0.002×10+0.004×10+0.022×5)=0.83.因为0.83(0.8,0.9,所以该社区可获得“反诈先进社区”称号.