2019版理科数学一轮复习高考帮试题:第14章第1讲 随机抽样与用样本估计总体(考题帮.数学理) .docx
第一讲随机抽样与用样本估计总体题组1随机抽样1.2015湖北,2,5分理数学文化题我国古代数学名著数书九章有“米谷粒分”题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.134石 B.169石 C.338石 D.1 365石2.2014湖南,3,5分对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p33.2013新课标全国,3,5分理为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样 B.按性别分层抽样C.按学段分层抽样 D.系统抽样4.2017江苏,3,5分理某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.题组2统计图表的绘制及应用5.2017全国卷,3,5分理某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图(图14-1-1).图14-1-1根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳6.2016山东,3,5分理 某高校调查了200名学生每周的自习时间(单位:小时),制成了如图14-1-2所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30.根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()图14-1-2A.56 B.60 C.120 D.1407.2014广东,6,5分理已知某地区中小学生人数和近视情况如图14-1-3所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()图14-1-3A.100,10 B.200,10C.100,20 D.200,208.2015新课标全国,18,12分理某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:6273819295857464537678869566977888827689B地区:7383625191465373648293486581745654766579()根据两组数据完成两地区用户满意度评分的茎叶图如图14-1-4,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);图14-1-4()根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.9.2015 广东,17,12分某城市100户居民的月平均用电量(单位:度),以160,180),180,200),200,220),220,240),240,260),260,280),280,300分组的频率分布直方图如图14-1-5所示.图14-1-5(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为220,240),240,260),260,280),280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在220,240)的用户中应抽取多少户?题组3求样本的数字特征10.2017山东,8,5分如图14-1-6所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()图14-1-6A.3,5B.5,5C.3,7D.5,711.2015 安徽,6,5分理若样本数据x1,x2,x10的标准差为8,则数据2x1-1,2x2-1,2x10-1的标准差为()A.8 B.15 C.16 D.3212.2014陕西,9,5分某公司10位员工的月工资(单位:元)为x1,x2,x10,其均值和方差分别为x和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为()A.x,s2+1002B.x+100,s2+1002C.x,s2 D.x+100,s213.2016江苏,4,5分理已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是.14.2015 广东,12,5分已知样本数据x1,x2,xn的均值x=5,则样本数据2x1+1,2x2+1,2xn+1的均值为.15.2015 广东,17,12分理某工厂36名工人的年龄数据如下表.工人编号年龄工人编号年龄工人编号年龄工人编号年龄140103619272834244113120432939340123821413043441133922373138533144323343242640154524423353745163925373437842173826443549943183627423639(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;(2)计算(1)中样本的均值x和方差s2;(3)36名工人中年龄在x-s与x+s之间有多少人?所占的百分比是多少(精确到0.01%)?A组基础题1.2018陕西省部分学校摸底检测,5某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为42的样本,则分别应抽取老年人、中年人、青年人的人数是()A.7,11,18 B.6,12,18 C.6,13,17 D.7,14,212.2018黔东南州第一次联考,3近年呼吁高校招生改革的呼声越来越高,在赞成高校招生改革的市民中按年龄分组,得到样本频率分布直方图如图14-1-7所示,其中年龄在区间30,40)内的有2 500人,在区间20,30)内的有1 200人,则m的值为()图14-1-7A.0.013 B.0.13 C.0.012D.0.123.2018长春市第一次质量监测,5已知某班级部分同学一次测验的成绩统计如图14-1-8所示,则其中位数和众数分别为()图14-1-8A.95,94 B.92,86 C.99,86 D.95,914.2017青海省西宁市高三一检,3某班一次测试成绩的茎叶图和频率分布直方图的可见部分如图14-1-9(1)(2)所示,根据图中的信息可确定被抽测的人数及分数在90,100内的人数分别为() (1)(2)图14-1-9A.20,2B.24,4C.25,2D.25,45.2018南昌市调考,13某校高三(2)班现有64名学生,随机编号为0,1,2,63,依编号顺序平均分成8组,组号依次为1,2,3,8.现用系统抽样方法抽取一个容量为8的样本,若在第1组中随机抽取的号码为5,则在第6组中抽取的号码为.6.2018广雅中学、东华中学、河南名校高三第一次联考,14数学文化题九章算术第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何?”其意为:“今有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱”,则丙应出钱(结果保留整数).7.2018唐山市五校联考,18某篮球队在本赛季已结束的8场比赛中,队员甲得分统计的茎叶图如图14-1-10所示.07810579213图14-1-10(1)求甲在比赛中得分的均值和方差;(2)从甲比赛得分在20分以下的6场比赛中随机抽取2场进行失误分析,求抽到2场的得分都不超过均值的概率.B组提升题8.2018益阳市、湘潭市高三调考,18某中学为了了解全校学生的上网情况,在全校采取随机抽样的方法抽取了80名学生(其中男女生人数恰好各占一半)进行问卷调查,并进行了统计,按性别分为两组,再将每组学生的月上网次数按0,5),5,10),10,15),15,20),20,25分为5组,得到如图14-1-11所示的频率分布直方图.(1)写出a的值;(2)求80名学生中月上网次数不少于15次的学生人数;(3)在80名学生中,从月上网次数少于5次的学生中随机抽取2人,求至少抽取到1名男生的概率.图14-1-119.2018惠州市一调,18某大学生在开学季准备销售一种文具盒进行试创业,在一个开学季内,每售出1盒该产品获得的利润为30元,未售出的产品,每盒亏损10元.该大学生通过查询资料得到开学季市场需求量的频率分布直方图,如图14-1-12所示.该大学生为这个开学季购进了160盒该产品,以x(单位:盒,100 x 200 )表示这个开学季内的市场需求量,y(单位:元)表示这个开学季内经销该产品的利润.(1)根据直方图估计这个开学季内市场需求量x的众数和平均数;(2)将y表示为x的函数;(3)根据直方图估计利润y不少于4 000元的概率.图14-1-1210.2017宁夏银川市、吴忠市部分重点中学高三联考,18某教师为了了解本校高三学生一模考试的数学成绩,将所教两个班级的数学成绩(单位:分)绘制成如图14-1-13所示的茎叶图.甲班乙班889 9 8 7 6 5 5 4 3 1 1 090 1 1 2 2 2 2 4 6 7 8 8 99 8 8 7 7 6 5 5 4 3 3 3 3 0100 1 1 1 1 2 2 5 6 6 7 9 99 7 5 5 5 2 2 1 0110 3 4 5 5 6 7 99 8 6 5 3 3 1 0 0120 1 2 2 3 3 5 8 96 2 1 1130 1 86 0143图14-1-13(1)分别求出甲、乙两个班级数学成绩的中位数、众数;(2)若规定成绩大于等于115分为优秀,分别求出两个班级数学成绩的优秀率;(3)在(2)的条件下,若用甲班学生数学成绩的频率估计概率,从该校高三年级中随机抽取3人,记这3人中数学成绩优秀的人数为X,求X的分布列和数学期望.答案1.B依题意,可得这批米内夹谷约为282541 534169石,选B.2.D根据抽样方法的概念可知,简单随机抽样、系统抽样和分层抽样这三种抽样方法中每个个体被抽到的概率都是p=nN,故p1=p2=p3,故选D.3.C由于该地区的中小学生人数比较多,不能采用简单随机抽样,排除选项A;由于小学、初中、高中三个学段的学生视力差异比较大,可采取按照学段进行分层抽样,而男女生视力情况差异不大,不能按照性别进行分层抽样,排除B和D,选C.4.18应从丙种型号的产品中抽取60300200+400+300+100=18(件).5.A根据题中折线图可知,2014年8月到9月、2014年10月到11月等期间月接待游客量都是减少,所以A错误.6.D由题中的频率分布直方图可知,这200名学生每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)2.5=0.7,故这200名学生中每周的自习时间不少于22.5小时的人数为2000.7=140.故选D.7.D由题意知,样本容量为(3 500+4 500+2 000)2%=200;抽取的高中生人数为2 0002%=40,由于其近视率为50%,所以抽取的高中生近视的人数为4050%=20.故选D.8.()两地区用户满意度评分的茎叶图如图D 14-1-2所示,图D 14-1-2通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.()记CA1表示事件“A地区用户的满意度等级为满意或非常满意”;CA2表示事件“A地区用户的满意度等级为非常满意”;CB1表示事件“B地区用户的满意度等级为不满意”;CB2表示事件“B地区用户的满意度等级为满意”,则CA1与CB1独立,CA2与CB2独立,CB1与CB2互斥,C=CB1CA1CB2CA2.P(C)=P(CB1CA1CB2CA2)=P(CB1CA1)+P(CB2CA2)=P(CB1)P(CA1)+P(CB2)P(CA2).由所给数据得CA1,CA2,CB1,CB2发生的频率分别为1620,420,1020,820,故P(CA1)=1620=45,P(CA2)=420=15,P(CB1)=1020=12,P(CB2)=820=25,P(C)=1245+2515=0.48.9.(1)依题意,20(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)=1,解得x=0.007 5.(2)由题图可知,最高矩形的数据组为220,240),众数为220+2402=230.160,220)的频率之和为(0.002+0.009 5+0.011)20=0.45,依题意,设中位数为y,则0.45+(y-220)0.012 5=0.5,解得y=224,中位数为224.(3)月平均用电量在220,240)内的用户在四组用户中所占比例为0.012 50.012 5+0.007 5+0.005+0.002 5=511,月平均用电量在220,240)的用户中应抽取11511=5(户).10.A根据两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等,所以56+62+65+74+(70+x)5=59+61+67+65+785,解得x=3.故选A.11.C令yi=2xi-1(i=1,2,3,10),则(y)=2(x)=16.故选C.12.D解法一对平均数和方差的意义深入理解可巧解.因为每个数据都加上了100,故平均数也增加100,而离散程度应保持不变,故选D.解法二由题意知x1+x2+xn=nx,s2=1n(x1-x)2+(x2-x)2+(xn-x)2,则所求均值y=1n(x1+100)+(x2+100)+(xn+100)=1n(nx+n100)=x+100,而所求方差t2=1n(x1+100-y)2+(x2+100-y)2+(xn+100-y)2=1n(x1-x)2+(x2-x)2+(xn-x)2=s2,故选D.13.0.1这组数据的平均数x=4.7+4.8+5.1+5.4+5.55=5.1,则方差s2=(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)25=0.16+0.09+0+0.09+0.165=0.1. 14.11由x=5,得(2x1+1)+(2x2+1)+(2xn+1)n=2x1+x2+xnn+1=2x+1=11.15.(1)由系统抽样的知识可知,36人分成9组,每组4人,其中第一组中抽到工人年龄为44,所以其编号为2,故所有样本数据的编号为4n-2,n=1,2,9.其数据为44,40,36,43,36,37,44,43,37.(2)x=44+40+379=40.由方差公式知,s2=19(44-40)2+(40-40)2+(37-40)2=1009.(3)因为s2=1009,所以s=103(3,4),所以36名工人中年龄在x-s和x+s之间的人数等于年龄在区间37,43内的人数,即40,40,41,39,共23人.所以36名工人中年龄在x-s和x+s之间的人数所占的百分比为233663.89%.A组基础题1.D因为该单位共有27+54+81=162(人),样本容量为42,所以应当按42162=727的比例分别从老年人、中年人、青年人中抽取样本,且分别应抽取的人数是7,14,21.故选D. 2.C由题意,得年龄在区间30,40)内的频率为0.02510=0.25,则赞成高校招生改革的市民有2 5000.25=10 000(人),因为年龄在区间20,30)内的有1 200人,所以m=1 20010 00010=0.012.3.B由题中茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故中位数为92,出现次数最多的为众数,故众数为86,故选B.4.C解法一频率分布直方图中,50,60)对应的频率为0.00810=0.08,而茎叶图中50,60)内有2(人),所以总人数为20.08=25,又90,100的频率为0.08,所以分数在90,100内的有0.0825=2(人),故选C.解法二由频率分布直方图可知50,60)和90,100的频率相同,所以90,100内的人数和50,60)内的人数一样多,而50,60)内有2人,所以90,100内也有2人,排除B,D;又50,60)和90,100内各有2人,60,70)内有7人,70,80)内有10人,共21人,所以总人数应该大于21,排除A,选C.5.45依题意,分组间隔为648=8,因为在第1组中随机抽取的号码为5,所以在第6组中抽取的号码为5+58=45.6.17因为依照钱的多少按比例出钱,所以丙应该出的钱为180560+350+180100=180109010017.7.(1)甲在比赛中得分的均值x=18(7+8+10+15+17+19+21+23)=15,方差s2=18(-8)2+(-7)2+(-5)2+02+22+42+62+82=32.25.(2)题设所述的6场比赛中甲的得分分别为:7,8,10,15,17,19.从中随机抽取2场,这2场比赛的得分如下:(7,8),(7,10),(7,15),(7,17),(7,19),(8,10),(8,15),(8,17),(8,19),(10,15),(10,17),(10,19),(15,17),(15,19),(17,19),共15种,其中抽到2场的得分都不超过均值的情况有(7,8),(7,10),(7,15),(8,10),(8,15),(10,15),共6种,所以所求概率P=615=25.组提升题8.(1)a=1-(20.02+0.03+0.08)55=0.05.(2)在所抽取的女生中,月上网次数不少于15次的学生人数的频率为(0.05+0.02)5=0.35,所以月上网次数不少于15次的女生有0.3540=14(人).在所抽取的男生中,月上网次数不少于15次的学生人数的频率为(0.04+0.03)5=0.35,所以月上网次数不少于15次的男生有0.3540=14(人).故抽取的80名学生中月上网次数不少于15次的学生有28人.(3)记“在80名学生中,从月上网次数少于5次的学生中随机抽取2人,至少抽到1名男生”为事件A,在抽取的女生中,月上网次数少于5次的学生人数的频率为0.025=0.1,人数为0.140=4,在抽取的男生中,月上网次数少于5次的学生人数的频率为0.015=0.05,人数为0.0540=2,则在80名学生中,从月上网次数少于5次的学生中随机抽取2人,所有可能的结果有15种,而事件A包含的结果有9种,所以P(A)=915=35.9.(1)由题中频率分布直方图得,这个开学季内市场需求量x的众数是150盒,需求量在100,120)内的频率为0.005 020=0.1,需求量在120,140)内的频率为0.010 020=0.2,需求量在140,160)内的频率为0.015 020=0.3,需求量在160,180)内的频率为0.012 520=0.25,需求量在180,200内的频率为0.007 520=0.15.则平均数x =1100.1+1300.2+1500.3+1700.25+1900.15=153(盒).(2)因为每售出1盒该产品获得的利润为30元,未售出的产品,每盒亏损10元,所以当100x<160时,y=30x-10(160-x)=40x-1 600; 当160x 200时,y=16030=4 800.所以y=40x-1 600,100x<160,4 800,160x200.(3)因为利润y不少于4 000元,所以当100x<160时,由40x-1 6004 000,解得140x<160;当160x200时,y=4 800>4 000恒成立,所以40x200时,利润y不少于4 000元.故由(1)知利润y不少于4 000元的概率P=1-0.1-0.2=0.7. 10.(1)由题中所给的茎叶图知,甲班50名同学的成绩由小到大排序,排在第25,26位的是108,109,数量最多的是103,故甲班数学成绩的中位数是108.5,众数是103;乙班48名同学的成绩由小到大排序,排在第24,25位的是106,107,数量最多的是92和101,故乙班数学成绩的中位数是106.5,众数为92和101.(2)由题中茎叶图中的数据可知,甲班中数学成绩优秀的人数为20,优秀率为2050=25;乙班中数学成绩优秀的人数为18,优秀率为1848=38.(3)用甲班学生数学成绩的频率估计概率,则该校高三学生数学成绩的优秀率P=25.X的所有可能取值为0,1,2,3,X服从二项分布,即XB(3,25),P(X=0)=C30(35)3=27125;P(X=1)=C3125(35)2=54125;P(X=2)=C32(25)235=36125;P(X=3)=C33(25)3=8125.因此X的分布列为X0123P2712554125361258125E(X)=027125+154125+236125+38125=65(或E(X)=325=65).