2025版新高考版高考总复习数学 抽样方法与总体分布的估计(十年高考).docx
2025版新高考版高考总复习数学11.4抽样方法与总体分布的估计考点 抽样方法与总体分布的估计1.(多选)(2023新课标,9,5分,中)有一组样本数据x1,x2,x6,其中x1是最小值,x6是最大值,则()A.x2,x3,x4,x5的平均数等于x1,x2,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,x6的极差答案BDA错误,举例说明,设样本数据x1,x2,x6分别为1,2,3,4,5,8,则x2+x3+x4+x54=144=3.5,x1+x2+x3+x4+x5+x66=2363.5;B正确,设这组数据从小到大排列为x1,x'2,x'3,x'4,x'5,x6,则x2,x3,x4,x5的中位数为x'3+x'42,x1,x2,x3,x4,x5,x6的中位数为x'3+x'42,x2,x3,x4,x5的中位数等于x1,x2,x3,x4,x5,x6的中位数;C错误,设样本数据x1,x2,x6分别为1,2,2,2,2,3,则x=16i=16xi=2,x2,x3,x4,x5的平均数为2,则x2,x3,x4,x5的标准差为0,x1,x2,x3,x4,x5,x6的标准差s=16i=16(xix)2=33>0;D正确,由B选项知x2,x3,x4,x5的极差为x'5-x'2,x1,x2,x3,x4,x5,x6的极差为x6-x1,显然x6-x1x'5-x'2.2.(2015湖南文,2,5分)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数是()A.3B.4C.5D.6答案B从35人中用系统抽样方法抽取7人,则可将这35人分成7组,每组5人,从每一组中抽取1人,而成绩在139,151上的有4组,所以抽取4人,故选B.3.(2015北京文,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()类别人数老年教师900中年教师1 800青年教师1 600合计4 300A.90B.100C.180D.300答案C本题考查分层抽样,根据样本中的青年教师有320人,且青年教师与老年教师人数的比为1 600900=169,可以得到样本中的老年教师的人数为916×320=180,故选C.4.(2014重庆文,3,5分)某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100B.150C.200D.250答案A由分层抽样的特点可知703 500=n3 500+1 500,解之得n=100.6.(2016山东,理3文3,5分)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30.根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140答案D由频率分布直方图知这200名学生每周的自习时间不少于22.5小时的频率为1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140,故选D.7.(2016课标理,4,5分)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ,B点表示四月的平均最低气温约为5 .下面叙述不正确的是()A.各月的平均最低气温都在0 以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 的月份有5个答案D由雷达图易知A、C正确;七月的平均最高气温超过20 ,平均最低气温约为12 ,一月的平均最高气温约为6 ,平均最低气温约为2 ,所以七月的平均温差比一月的平均温差大,故B正确;由雷达图知平均最高气温超过20 的月份有3个月.故选D.8.(2015课标理,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案D由柱形图可知:A、B、C均正确,2006年以来我国二氧化硫年排放量在逐渐减少,所以排放量与年份负相关,D不正确.9.(2015陕西理,2,5分)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.167B.137C.123D.93答案B初中部女教师的人数为110×70%=77,高中部女教师的人数为150×(1-60%)=60,则该校女教师的人数为77+60=137,故选B.10.(2022全国甲,理2,文2,5分,应用性)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则()A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差答案B对于A项,将讲座前的10个数据从小到大排列依次为60%,60%,65%,65%,70%,75%,80%,85%,90%,95%,易知这10个数据的中位数是第5个与第6个数据的平均数,为70%+75%2=72.5%>70%,故A错误;对于B项,x后=110×(90%+85%+80%+90%+85%+85%+95%+100%+85%+100%)=89.5%>85%,故B正确;对于C项,x前=110×(60%+60%+65%+65%+70%+75%+80%+85%+90%+95%)=74.5%,s前=110×(60%74.5%)2+(95%74.5%)211.93%,s后=110×(90%89.5%)2+(100%89.5%)2=6.5%,11.93%>6.5%,故C错误;对于D项,讲座前问卷答题的正确率的极差为95%-60%=35%,讲座后问卷答题的正确率的极差为100%-80%=20%,20%<35%,故D错误.故选B.11.(2021全国甲理,2,5分)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间答案C解题指导:利用频率分布直方图估计频率,再将频率转化为比率.解析由频率分布直方图可得,该地农户家庭年收入低于4.5万元和不低于10.5万元的频率分别为0.06和0.1,则农户比率分别为6%和10%,故A、B中结论正确;家庭年收入介于4.5万元和8.5万元之间的频率为0.1+0.14+0.2+0.2=0.64,故D中结论正确;家庭年收入的平均值为0.02×3+0.04×4+0.1×5+0.14×6+0.2×7+0.2×8+0.1×9+0.1×10+0.04×11+0.02×12+0.02×13+0.02×14=7.68万元,因为7.68>6.5,所以估计该地区农户家庭年收入的平均值超过6.5万元,故C中结论不正确.故选C.12.(多选)(2021新高考,9,5分)有一组样本数据x1,x2,xn,由这组数据得到新样本数据y1,y2,yn,其中yi=xi+c(i=1,2,n),c为非零常数,则()A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同答案CDA项,设x=1ni=1nxi,则y=1ni=1nyi=1ni=1n(xi+c)=1ni=1nxi+c,因为c0,所以y=x+c,所以xy,所以A选项错误.B项,因为yi=xi+c(i=1,2,n),所以y1,y2,yn的中位数是x1,x2,xn的中位数加c,所以B选项错误.C项,设s12=1ni=1n(xi-x)2,s22=1ni=1n(yi-y)2,所以s22=1ni=1n(xi+c-x-c)2=1ni=1n(xi-x)2,所以s12=s22,所以两组数据的方差相同,从而这两组数据的标准差相同,所以C选项正确.D项,设x1<x2<<xn,则第一组数据的极差为xn-x1,设y1<y2<<yn,则第二组数据的极差为yn-y1=(xn+c)-(x1+c)=xn-x1,所以两组数据的极差相同,所以D选项正确,故选CD.13.(2015安徽理,6,5分)若样本数据x1,x2,x10的标准差为8,则数据2x1-1,2x2-1,2x10-1的标准差为()A.8B.15C.16D.32答案C设样本数据x1,x2,x10的标准差为s,则s=8,可知数据2x1-1,2x2-1,2x10-1的标准差为2s=16.14.(2014陕西文,9,5分)某公司10位员工的月工资(单位:元)为x1,x2,x10,其均值和方差分别为x和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为()A.x,s2+1002B.x+100,s2+1002C.x,s2D.x+100,s2答案D设增加工资后10位员工下月工资均值为x',方差为s'2,则x'=110(x1+100)+(x2+100)+(x10+100)=110(x1+x2+x10)+100=x+100;方差s'2=110(x1+100-x')2+(x2+100-x')2+(x10+100-x')2=110(x1-x)2+(x2-x)2+(x10-x)2=s2.故选D.15.(2015福建文,13,4分)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为. 答案25解析男生人数为900-400=500.设应抽取男生x人,则由45900=x500得x=25.即应抽取男生25人.16.(2014天津理,9,5分)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4556,则应从一年级本科生中抽取名学生. 答案60解析420×300=60(名).17.(2012天津理,9,5分)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取所学校,中学中抽取所学校. 答案18;9解析应从小学中抽取150150+75+25×30=18(所).应从中学中抽取75150+75+25×30=9(所).评析本题考查分层抽样及数据处理能力.18.(2012福建文,14,4分)一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是. 答案12解析男女运动员人数比例为569856=43,分层抽样中男女人数比例不变,则女运动员人数为28×37=12.故应抽取女运动员人数是12.评析本题考查分层抽样方法.考查学生运算求解能力.19.(2011江苏,6,5分)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2=. 答案165解析记星期一到星期五收到的信件数分别为x1,x2,x3,x4,x5,则x=x1+x2+x3+x4+x55=10+6+8+5+65=7.s2=15(x1-x)2+(x2-x)2+(x3-x)2+(x4-x)2+(x5-x)2=15(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2=165.评析本题主要考查方差的公式,考查学生的运算求解能力.公式记忆准确,运算无误是解答本题的关键,属中等难度题.20.(2015湖北文,14,5分)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间0.3,0.9内,其频率分布直方图如图所示.(1)直方图中的a=; (2)在这些购物者中,消费金额在区间0.5,0.9内的购物者的人数为. 答案(1)3(2)6 000解析(1)由频率分布直方图可知:0.1×(0.2+0.8+1.5+2.0+2.5+a)=1,解得a=3.(2)消费金额在区间0.5,0.9内的购物者的频率为0.1×(3.0+2.0+0.8+0.2)=0.6,所以所求购物者的人数为0.6×10 000=6 000.21.(2014江苏文,6,5分)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间80,130上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100 cm. 答案24解析60×(0.015+0.025)×10=24(株).22.(2019课标,理13文14,5分)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为. 答案0.98解析本题考查离散型随机变量的均值计算;考查抽象概括能力和运算求解能力;考查的核心素养为数学抽象和数学运算.设经停该站高铁列车所有车次中正点率为0.97的事件为A,正点率为0.98的事件为B,正点率为0.99的事件为C,则用频率估计概率有P(A)=1010+20+10=14,P(B)=2010+20+10=12,P(C)=1010+20+10=14,所以经停该站高铁列车所有车次的平均正点率的估计值为0.97×14+0.98×12+0.99×14=0.98.23.(2023新课标,19,12分,中)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);误诊率是将未患病者判定为阳性的概率,记为q(c).假设数据在组内均匀分布.以事件发生的频率作为相应事件发生的概率.(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);(2)设函数f(c)=p(c)+q(c).当c95,105时,求f(c)的解析式,并求f(c)在区间95,105的最小值.解析(1)由题意知(c-95)×0.002=0.5%,得c=97.5,q(c)=0.01×2.5+5×0.002=0.035=3.5%.(2)当c95,100时,f(c)=p(c)+q(c)=(c-95)×0.002+(100-c)×0.01+5×0.002=-0.008c+0.820.02.当c(100,105时,f(c)=p(c)+q(c)=5×0.002+(c-100)×0.012+(105-c)×0.002=0.01c-0.98>0.02.f(c)=0.008c+0.82,95c100,0.01c0.98,100<c105,f(c)min=0.02.24.(2023全国乙理,17,12分,中)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,10),试验结果如下:试验序号i12345678910伸缩率xi545533551522575544541568596548伸缩率yi536527543530560533522550576536记zi=xi-yi(i=1,2,10),记z1,z2,z10的样本平均数为z,样本方差为s2.(1)求z,s2;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高如果z2s210,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高.解析(1)zi=xi-yi(i=1,2,10)依次为9,6,8,-8,15,11,19,18,20,12,则z=110×(9+6+8-8+15+11+19+18+20+12)=11,s2=110×(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-11)2=61.(2)由(1)知z=11,s2=61,则z2s210=1126110>0,z2s210,即甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.25.(2021全国乙理,17,12分)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为 x和y,样本方差分别记为s12和s22.(1)求x,y,s12,s22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高如果yx2s12+s2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高.解析(1)x=110×(9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.7)=10.y=110×(10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.5)=10.3.s12=110×(0.22+0.32+02+0.22+0.12+0.22+02+0.12+0.22+0.32)=0.036.s22=110×(0.22+0.12+0.22+0.32+0.22+02+0.32+0.22+0.12+0.22)=0.04.(2)yx=10.310=0.3=310=1550,2s12+s2210=20.036+0.0410=2×0.007 6=7650,且1550=22550>7650,yx2s12+s2210成立,认为新设备生产产品的该项指标的均值较旧设备有显著提高.易错警示1.要牢记数据方差的计算公式;2.注意数据计算的准确性.26.(2022新高考,19,12分,应用性)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);(2)估计该地区一位这种疾病患者的年龄位于区间20,70)的概率;(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间40,50),求此人患这种疾病的概率(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.000 1).解析(1)平均年龄为(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023+55×0.020+65×0.017+75×0.006+85×0.002)×10=47.9(岁).(2)设事件A=“该地区一位这种疾病患者的年龄位于区间20,70)”,则P(A)=1-P(A)=1-(0.001+0.002+0.006+0.002)×10=1-0.11=0.89.(3)设事件B=“任选一人年龄位于区间40,50)”,事件C=“任选一人患这种疾病”,由条件概率公式可得P(C|B)=P(BC)P(B)=0.1%×0.023×1016%=0.001×0.230.16=0.001 437 50.001 4.27.(2022全国乙,理19,文19,12分,应用性)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:样本号i12345 67 8910总和根部横截面积xi0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.070.060.6材积量yi0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.420.403.9并计算得i=110xi2=0.038,i=110yi2=1.615 8,i=110xiyi=0.247 4.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数i=1n(xix)(yiy)i=1n(xix)2i=1n(yiy)2ri=1n(xix)(yiy)i=1n(xix)2i=1n(yiy)2=,1.8961.377.解析(1)估计该林区这种树木平均一棵的根部横截面积为x=0.610=0.06(m2),平均一棵的材积量为y=3.910=0.39(m3).(2)样本相关系数i=110(xix)(yiy)i=110(xix)2i=110(yiy)2ri=110(xix)(yiy)i=110(xix)2i=110(yiy)2=i=110xiyi10xy(i=110xi210x2)(i=110yi210y2)=0.247 410×0.06×0.39(0.03810×0.062)(1.615 810×0.392)=0.013 40.002×0.094 8=0.013 40.011.8960.013 40.013 770.97.即该林区这种树木的根部横截面积与材积量的样本相关系数约为0.97.(3)设这种树木的根部横截总面积为X m2,总材积量为Y m3,则XY=xy,则Y=X·yx=186×0.390.06=1 209,所以该林区这种树木的总材积量的估计值为1 209 m3.25.(2019课标文,19,12分)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组-0.20,0)0,0.20)0.20,0.40)0.40,0.60)0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:748.602.解析本题考查了统计的基础知识、基本思想和方法,考查学生对频数分布表的理解与应用,考查样本的平均数,标准差等数字特征的计算方法,以及对现实社会中实际数据的分析处理能力.(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y=1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s2=1100i=15ni(yi-y)2=11002×(-0.40)2+24×(-0.20)2+53×02+14×0.202+7×0.402=0.029 6,s=0.029 6=0.02×740.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.方法总结利用频数分布表求平均数估计值的方法:各组区间中点值乘该组频数,并求和,再除以样本容量.利用频数分布表求标准差估计值的方法:用各组区间中点值代表该组,代入标准差公式即可.26.(2016四川理,16,12分)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照0,0.5),0.5,1),4,4.5分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.解析(1)由频率分布直方图知,月均用水量在0,0.5)中的频率为0.08×0.5=0.04,同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5x<3.由0.3×(x-2.5)=0.85-0.73,解得x=2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.思路分析由图易知组距为0.5,再由频率之和等于1即可求出a;由图可知前6组的频率之和为0.88>0.85,前5组的频率之和为0.73<0.85,说明x2.5,3),再由0.3×(x-2.5)=0.85-0.73即可求出x.评析本题中求a值的关键是抓住频率之和为1,确定x在哪个区间内是解题的关键.29.(2015课标文,18,12分)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.B地区用户满意度评分的频数分布表满意度评分分组50,60)60,70)70,80)80,90)90,100频数2814106 (1)作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大,说明理由. 解析(1)通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(2)A地区用户的满意度等级为不满意的概率大.记CA表示事件:“A地区用户的满意度等级为不满意”;CB表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6,P(CB)的估计值为(0.005+0.02)×10=0.25.所以A地区用户的满意度等级为不满意的概率大.30.(2015广东文,17,12分)某城市100户居民的月平均用电量(单位:度),以160,180),180,200),200,220),220,240),240,260),260,280),280,300分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为220,240),240,260),260,280),280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在220,240)的用户中应抽取多少户?解析(1)由已知得,20×(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)=1,解得x=0.007 5.(2)由题图可知,面积最大的矩形对应的月平均用电量区间为220,240),所以月平均用电量的众数的估计值为230;因为20×(0.002+0.009 5+0.011)=0.45<0.5,20×(0.002+0.009 5+0.011+0.012 5)=0.7>0.5,所以中位数在区间220,240)内.设中位数为m,则20×(0.002+0.009 5+0.011)+0.012 5×(m-220)=0.5,解得m=224.所以月平均用电量的中位数为224.(3)由题图知,月平均用电量为220,240)的用户数为(240-220)×0.012 5×100=25,同理可得,月平均用电量为240,260),260,280),280,300的用户数分别为15,10,5.故用分层抽样的方式抽取11户居民,月平均用电量在220,240)的用户中应抽取11×2525+15+10+5=5(户).31.(2014课标文,18,12分)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组75,85)85,95)95,105)105,115)115,125)频数62638228(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解析(1)(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.评析本题考查绘制频率分布直方图,计算样本的数字特征,及用样本估计总体等知识,同时考查统计的思想方法.32.(2014北京文,18,13分)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号分组频数10,2)622,4)834,6)1746,8)2258,10)25610,12)12712,14)6814,16)2916,18)2合计100(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)解析(1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10名,所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9.故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在组4,6)内的