全国通用2016高考数学二轮复习第一部分微专题强化练专题19统计与统计案例含解析.doc
【走向高考】(全国通用)2016高考数学二轮复习 第一部分 微专题强化练 专题19 统计与统计案例(含解析)一、选择题1(2015·北京文,4)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()类别人数老年教师900中年教师1 800青年教师1 600合计4 300A90B100C180 D300答案C解析由题意,总体中青年教师与老年教师比例为;设样本中老年教师的人数为x,由分层抽样的性质可得总体与样本中青年教师与老年教师的比例相等,即,解得x180.方法点拨解决抽样问题,首先要深刻理解各种抽样方法的特点和适用范围,如分层抽样,适用于数目较多且各部分之间具有明显差异的总体其次要抓住无论哪种抽样方法,每一个个体被抽到的概率都等于样本容量与总体容量的比值2(2015·湖南文,2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数是()A3 B4 C5 D6答案B解析根据茎叶图中的数据得:成绩在区间139,151上的运动员人数是20,用系统抽样方法从35人中抽取7人,成绩在区间139,151上的运动员应抽取7×4(人),故选B方法点拨1.三种抽样方法的比较类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率相等从总体中逐个抽取总体中的个体数较少系统抽样将总体均分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,分层进行抽取分层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成2.当总体数N不能被样本容量整除,用系统抽样法剔除多余个体时,必须随机抽样3(文)已知x、y的取值如下表所示:x0134y0.91.93.24.4从散点图分析,y与x线性相关,且0.8xa,则a()A0.8 B1C1.2 D1.5答案B解析2,2.6,又因为回归直线0.8xa过样本中心点(2,2.6)所以2.60.8×2a,解得a1.(理)(2015·福建理,4)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程x,其中0.76,.据此估计,该社区一户年收入为15万元家庭的年支出为()A11.4万元 B11.8万元C12.0万元 D12.2万元答案B解析考查线性回归方程由已知得10(万元),8(万元),故80.76×100.4.所以回归直线方程为0.76x0.4,社区一户年收入为15万元家庭年支出为0.76×150.411.8(万元),故选B方法点拨1.要熟记用最小二乘法求回归直线的方程的系数公式设线性回归方程为x,则.2回归直线一定经过样本的中心点(,),据此性质可以解决有关的计算问题4(文)(2015·安徽理,6)若样本数据x1,x2,x10的标准差为8,则数据2x11,2x21,2x101的标准差为()A8 B15 C16 D32答案C解析考查样本的方差与标准差的应用设样本数据x1,x2,x10的标准差为,则8,即方差D(X)64,而数据2x11,2x21,2x101的方差D(2X1)22D(X)22×64,所以其标准差为16.故选C(理)等差数列x1,x2,x3,x9的公差为1,若以上述数据x1,x2,x3,x9为样本,则此样本的方差为()A B C60 D30答案A解析令等差数列为1,2,3,9,则样本的平均值5,S2(15)2(25)2(95)2.方法点拨平均数与方差样本数据的平均数(x1x2xn)方差s2(x1)2(x2)2(xn)2注意:(1)现实中总体所包含的个体数往往较多,总体的平均数与标准差、方差是不知道(或不可求)的,所以我们通常用样本的平均数与标准差、方差来估计总体的平均数与标准差、方差(2)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散(波动)程度越大,越不稳定5(文)(2015·河北邯郸市一模)某班的一次数学考试后,按学号统计前20名同学的考试成绩如茎叶图所示,则该样本数据的中位数为()A74.5 B75 C75.5 D76答案C解析中位数为75.5.(理)(2015·河南省高考适应性测试)某中学为了检验1000名在校高三学生对函数模块掌握的情况,进行了一次测试,并把成绩进行统计,得到样本频率分布直方图如下图所示,则考试成绩的众数大约为()A55 B65 C75 D85答案C解析最高小矩形中点的横坐标75为众数方法点拨1.茎叶图当数据有两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图当数据有三位有效数字,前两位相对比较集中时,常以前两位为茎,第三位(个位)为叶(其余类推)2样本的数字特征(1)众数在样本数据中,频率分布最大值所对应的样本数据(或出现次数最多的那个数据)(2)中位数样本数据中,将数据按大小排列,位于最中间的数据如果数据的个数为偶数,就取当中两个数据的平均数作为中位数3求中位数、平均数、方差主要依据公式进行计算4在频率分布直方图中,平均数的估计值等于每个小矩形的面积乘以小矩形底边中点横坐标之和;在中位数的估计值两侧直方图的面积相等;最高小矩形中点对应数据为这组数据的众数6(文)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列an已知a22a1,且样本容量为300,则小长方形面积最大的一组的频数为()A100 B120 C150 D 200答案A解析设公差为d,则a1d2a1,a1d,d2d3d4d5d1,d,面积最大的一组的频率等于×5.小长方形面积最大的一组的频数为300×100.(理)某电视传媒公司为了了解某类体育节目的收视情况,随机抽取了100名观众进行调查,如图是根据调查结果绘制的观众日均收看该类体育节目时间的频率分布直方图,其中收看时间分组区间是:0,10),10,20),20,30),30,40),40,50),50,60将日均收看该类体育节目时间不低于40分钟的观众称为“体育迷”,则图中x的值为()A0.01 B0.02 C0.03 D0.04答案A解析由题设可知(0.005x0.0120.0200.0250.028)×101,解得x0.01,选A方法点拨1.在频率分布直方图中:各小矩形的面积表示相应各组的频率,各小矩形的高;各小矩形面积之和等于1;中位数左右两侧的直方图面积相等,因此可以估计其近似值2准确理解给出图表及已知条件中数据的含义是解决统计问题的关键7(文)(2015·湖北文,4)已知变量x和y满足关系y0.1x1,变量y与z正相关下列结论中正确的是()Ax与y正相关,x与z负相关Bx与y正相关,x与z正相关Cx与y负相关,x与z负相关Dx与y负相关,x与z正相关答案C解析因为变量x和y满足关系y0.1x1,其中0.1<0,所以x与y成负相关;又因为变量y与z正相关,不妨设zkyb(k>0),则将y0.1x1代入即可得到:zk(0.1x1)b0.1kx(kb),所以0.1k<0,所以x与z负相关,综上可知,应选C(理)(2015·新课标理,3)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A逐年比较,2008年减少二氧化硫排放量的效果最显著B2007年我国治理二氧化硫排放显现成效C2006年以来我国二氧化硫年排放量呈减少趋势D2006年以来我国二氧化硫年排放量与年份正相关答案D解析考查正、负相关及对柱形图的理解由柱形图得,从2006年以来,我国二氧化硫排放量呈下降趋势,故年排放量与年份负相关,故选D8(文)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了8次试验,收集数据如下:零件数x(个)1020304050607080加工时间y(min)626875818995102108设回归方程为ybxa,则点(a,b)在直线x45y100的()A左上方 B左下方C右上方 D右下方答案C解析45,85,a45b85,a45b10>0,故点(a,b)在直线x45y100的右上方,故选C(理)(2014·沈阳市质检)某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试现随机调查了24名笔试者的成绩,如下表所示:分数段60,65)65,70)70,75)75,80)80,85)85,90)人数234951据此估计允许参加面试的分数线大约是()A75 B80 C85 D90答案B解析由题可知,在24名笔试者中应选出6人参加面试由表可得面试分数线大约为80.故选B二、填空题910名工人某天生产同一零件,生产的件数分别是10,12,14,14,14,15,15,16,16,17,设这10个数的中位数为a,众数为b,则ab_.答案0.5解析从数据中可以看出,众数b14,且中位数a14.5,ab14.5140.5.10(文)为了解某校高三学生身体状况,用分层抽样的方法抽取部分男生和女生的体重,将男生体重数据整理后,画出了频率分布直方图,已知图中从左到右前三个小组频率之比为123,第二小组频数为12,若全校男、女生比例为32,则全校抽取学生数为_答案80解析第四小组和第五小组的频率之和是5×(0.01250.0375)0.25,故前三个小组的频率之和是0.75,则第二小组的频率是0.25,则抽取的男生人数是12÷0.2548人,抽取的女生人数是48×32人,全校共抽取80人(理)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为_答案10解析设5个班级中参加的人数分别为x1,x2,x3,x4,x5,则7,4,即5个整数平方和为20,x1,x2,x3,x4,x5这5个数中最大数比7大,但不能超过10,因此最大为10,平方和2001199(77)2(87)2(67)2(107)2(47)2.因此参加的人数为4,6,7,8,10,故最大值为10,最小值为4.三、解答题11(文)(2015·山西太原市模拟)某网络广告A公司计划从甲、乙两个网站选择一个网站拓展广告业务,为此A公司随机抽取了甲、乙两个网站某月中10天的日访问量n(单位:万次),整理后得到如下茎叶图,已知A公司要从网站日访问量的平均值和稳定性两方面进行考量选择(1)请说明A公司应选择哪个网站;(2)现将抽取的样本分布近似看作总体分布,A公司根据所选网站的日访问量n进行付费,其付费标准如下:选定网站的日访问量n(单位:万次)A公司的付费标准(单位:元/日)n<2550025n35700n>351000求A公司每月(按30天计)应付给选定网站的费用S.解析(1)由茎叶图可知甲(15242825303630323545)÷1030,S×(1530)2(2430)2(2830)2(2530)2(3030)2(3630)2(3030)2(3230)2(3530)2(4530)258.乙(18252224323830363540)÷1030,S×(1830)2(2530)2(2230)2(2430)2(3230)2(3830)2(3030)2(3630)2(3530)2(4030)249.8甲乙,S>S,A公司应选择乙网站;(2)由(1)得A公司应选择乙网站,由题意可知乙网站日访问量n<25的概率为0.3,日访问量25n35的概率为0.4,日访问量n>35的概率为0.3,A公司每月应付给乙网站的费用S30×(500×0.3700×0.41000×0.3)21900元(理)(2015·郑州市质检)最新高考改革方案已在上海和江苏开始实施,某教育机构为了解我省广大师生对新高考改革方案的看法,对某市部分学校500名师生进行调查,统计结果如下:赞成改革不赞成改革无所谓教师120y40学生xz130在全体师生中随机抽取1名“赞成改革”的人是学生的概率为0.3,且z2y.(1)现从全部500名师生中用分层抽样的方法抽取50名进行问卷调查,则应抽取“不赞成改革”的教师和学生人数各是多少?(2)在(1)中所抽取的“不赞成改革”的人中,随机选出三人进行座谈,求至少有一名教师被选出的概率解析(1) 由题意0.3,x150,所以yz60,因为z2y,所以y20,z40,则应抽取教师人数×202,应抽取学生人数×404.(2)解法1:所抽取的“不赞成改革”的2名教师记为a,b,4名学生记为1,2,3,4,随机选出三人的不同选法有(a,b,1),(a,b,2),(a,b,3),(a,b,4),(a,1,2),(a,1,3),(a,1,4),(a,2,3),(a,2,4),(a,3,4),(b,1,2),(b,1,3),(b,1,4),(b,2,3),(b,2,4),(b,3,4),(1,2,3),(1,2,4),(1,3,4),(2,3,4),共20种,至少有一名教师的选法有(a,b,1),(a,b,2),(a,b,3),(a,b,4),(a,1,2),(a,1,3),(a,1,4),(a,2,3),(a,2,4),(a,3,4),(b,1,2),(b,1,3),(b,1,4),(b,2,3),(b,2,4),(b,3,4)共16种,至少有一名教师被选出的概率p.解法2:抽取的“不赞成改革”的人中,教师2人,学生4人共6人,从中任取3人,有C种取法,其中至少有一名教师的取法有CC种,故所求概率P.12(文)某个团购网站为了更好地满足消费者需求,对在其网站发布的团购产品展开了用户调查,每个用户在使用了团购产品后可以对该产品进行打分,最高分是10分上个月该网站共卖出了100份团购产品,所有用户打分的平均分作为该产品的参考分值,将这些产品按照得分分成以下几组:第一组0,2),第二组2,4),第三组4,6),第四组6,8),第五组8,10,得到的频率分布直方图如图所示(1)分别求第三,四,五组的频率;(2)该网站在得分较高的第三,四,五组中用分层抽样的方法抽取了6个产品作为下个月团购的特惠产品,某人决定在这6个产品中随机抽取2个购买,求他抽到的两个产品均来自第三组的概率解析(1)第三组的频率是0.150×20.3;第四组的频率是0.100×20.2;第五组的频率是0.050×20.1(2)设“抽到的两个产品均来自第三组”为事件A,由题意可知,从第三、四、五组中分别抽取3个,2个,1个不妨设第三组抽到的是A1,A2,A3;第四组抽到的是B1,B2;第五组抽到的是C1,所含基本事件总数为: A1,A2,A1,A3,A2,A3,A1,B1,A1,B2,A1,C1,A2,B1,A2,B2,A2,C1,A3,B1,A3,B2,A3,C1,B1,B2,B1,C1,B2,C1所以P(A).(理)甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)用茎叶图表示这两组数据;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由;(3)若将频率视为概率,对甲同学在今后的3次数学竞赛成绩进行预测,记这3次成绩中高于80分的次数为,求的分布列及数学期望E()解析(1)作出茎叶图如下:甲乙9875842180035539025(2)派甲参赛比较合适,理由如下:甲(70×280×490×289124835)85乙(70×180×490×350035025)85.S(7885)2(7985)2(8185)2(8285)2(8485)2(8885)2(9385)2(9585)235.5S(7585)2(8085)2(8085)2(8385)2(8585)2(9085)2(9285)2(9585)241甲乙,S<S,甲的成绩较稳定,派甲参赛比较合适注:本小题的结论及理由均不唯一,如果考生能从统计学的角度分析,给出其他合理回答,同样给分:如:从统计的角度看,甲获得85分以上(含85分)的概率P1乙获得85分以上(含85分)的概率为P2P2>P1,派乙参赛比较合适(3)记“甲同学在一次数学竞赛中成绩高于80分”为事件A,则P(A),随机变量的分布列为0123PE()0×1×2×3×.(或E()np3×)13(文)(2015·邯郸市一模)某市教育局邀请教育专家深入该市多所中小学,开展听课、访谈及随堂检测等活动,他们把收集到的180节课分为三类课堂教学模式,教师主讲的为A模式,少数学生参与的为B模式,多数学生参与的为C模式,A、B、C三类课的节数比例为321.(1)为便于研究分析,教育专家将A模式称为传统课堂模式,B、C统称为新课堂模式,根据随堂检测结果,把课堂教学效率分为高效和非高效,根据检测结果统计得到如下2×2列联表(单位:节)高效非高效总计新课堂模式603090传统课堂模式405090总计10080180请根据统计数据回答:有没有99%的把握认为课堂教学效率与教学模式有关?并说明理由(2)教育专家采用分层抽样的方法从收集到的180节课中选出12节课作为样本进行研究,并从样本中的B模式和C模式课堂中随机抽取2节课,求至少有一节课为C模式课堂的概率参考临界值有:P(K2k0)0.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828参考公式:K2,其中nabcd.解析(1)由列联表中的统计数据计算随机变量K2的观测值为:K29>6.635由临界值表P(k26.635)0.010,有99%的把握认为课堂效率与教学模式有关(2)样本中的B模式课堂和C模式课堂分别是4节和2节分别记为B1、B2、B3、B4、C1、C2,从中取出2节课共有15种情况:(C1,B1),(C1,B2),(C1,B3),(C1,B4),(C2,B1),(C2,B2),(C2,B3),(C2,B4),(C1,C2),(B1,B2),(B1,B3),(B1,B4),(B2,B3),(B2,B4),(B3,B4)至少有一节课为C模式课堂的事件为(C1,B1),(C1,B2),(C1,B3),(C1,B4),(C2,B1),(C2,B2),(C2,B3),(C2,B4),(C1,C2)共9种至少有一节课为C模式课堂的概率为.(理)(2015·辽宁葫芦岛市一模)为了调查学生星期天晚上学习时间利用问题,某校从高二年级1 000名学生(其中走读生450名,住宿生550名)中,采用分层抽样的方法抽取n名学生进行问卷调查根据问卷取得了这n名同学每天晚上学习时间(单位:分钟)的数据,按照以下区间分为八组0,30),30,60),60,90),90,120),120,150),150,180),180,210),210,240,得到频率分布直方图如图已知抽取的学生中星期天晚上学习时间少于60分钟的人数为5人(1)求n的值并补全频率分布直方图;(2)如果把“学生晚上学习时间达到两小时”作为是否充分利用时间的标准,对抽取的n名学生,完成下列2×2列联表:利用时间充分利用时间不充分总计走读生住宿生10总计据此资料,你是否有95%的把握认为学生“利用时间是否充分”与走读、住宿有关?(3)若在第组、第组、第组中共抽出3人调查影响有效利用时间的原因,记抽到“学习时间少于60分钟”的学生人数为X,求X的分布列及期望参考公式:K2解析(1)设第i组的频率为Pi(i1,2,8),由图可知:P1×30, P2×30学习时间少于60分钟的频率为P1P2由题意:n×5,n100.又P3×30, P5×30,P6×30,P7×30, P8×30,P41(P1P2P3P5P6P7P8).第组的高度为:h×频率分布直方图如图:(注:未标明高度1/250扣1分)(2)由频率分布直方图可知,在抽取的100人中,“走读生”有45人,“住宿生”有55人,其中“住宿生”中利用时间不充分的有10人,从而走读生中利用时间不充分的有251015人,利用时间充分的有451530人,由此可得2×2列联表如下:利用时间充分利用时间不充分总计走读生301545住宿生451055总计7525100将2×2列联表中的数据代入公式计算,得K23.030因为3.030<3.841,所以没有95%的把握认为学生“利用时间是否充分”与走读、住宿有关(3)由(1)知:第组2人,第组3人,第组5人,总计10人,则X的所有可能取值为0,1,2,3P(Xi)(i0,1,2,3)P(X0),P(X1),P(X2),P(X3)X的分布列为:X0123PE(X)0×1×2×3×(或由超几何分布的期望计算公式EXn×3×)14为加强中学生实践、创新能力和团队精神的培养,促进教育教学改革,郑州市教育局举办了全市中学生创新知识竞赛某校举行选拔赛,共有200名学生参加,为了解成绩情况,从中选取50名学生的成绩(得分均为整数,满分为100分)进行统计请你根据尚未完成的频率分布表,解答下列问题:分组频数频率一60.570.5a0.26二70.580.515c三80.590.5180.36四90.5100.5bd合计50e(1)若用系统抽样的方法抽取50个样本,现将所有学生随机地编号为000,001,002,199,试写出第二组第一位学生的编号;(2)求出a、b、c、d、e的值(直接写出结果),并作出频率分布直方图;(3)若成绩在85.595.5分的学生为二等奖,问参赛学生中获得二等奖的学生约为多少人解析(1)004(2)a,b,c,d,e的值分别为13,4,0.30,0.08,1.频率分布直方图如下:(3)由样本中成绩在80.590.5的频数为18,成绩在90.5100.5的频数为4,可估计成绩在85.595.5的人数为11人,故获得二等奖的学生约为×1144人16