2019届高考数学二轮复习 第二部分专项二 专题六 2 第2讲 统计与统计案例 学案 .doc
-
资源ID:2678582
资源大小:777.50KB
全文页数:21页
- 资源格式: DOC
下载积分:5金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
2019届高考数学二轮复习 第二部分专项二 专题六 2 第2讲 统计与统计案例 学案 .doc
第2讲统计与统计案例年份卷别考查内容及考题位置命题分析2018卷扇形统计图的应用T31.统计与统计案例在选择或填空题中的命题热点主要集中在随机抽样、用样本估计总体以及变量间的相关性判断等,难度较低,常出现在34题的位置.2.统计解答题多在第18题的位置,且多以频率分布直方图或茎叶图与线性回归分析或独立性检验相交汇的形式考查,难度中等.卷回归分析及其应用T18卷统计案例T182017卷频率分布直方图、独立性检验T18卷折线图的识别及应用T32016卷统计图表的应用T4折线图、相关性检验、线性回归方程及其应用T18抽样方法(基础型) 系统抽样总体容量为N,样本容量为n,则要将总体均分成n组,每组个(有零头时要先去掉)若第一组抽到编号为k的个体,则以后各组中抽取的个体编号依次为k,k(n1). 分层抽样按比例抽样,计算的主要依据是:各层抽取的数量之比总体中各层的数量之比考法全练1福利彩票“双色球”中红色球的号码可以从01,02,03,32,33这33个两位号码中选取,小明利用如下所示的随机数表选取红色球的6个号码,选取方法是从第1行第9列的数字开始,从左到右依次读取数据,则第四个被选中的红色球号码为()81 47 23 68 63 93 17 90 12 69 86 81 62 93 50 60 91 33 75 85 61 39 8506 32 35 92 46 22 54 10 02 78 49 82 18 86 70 48 05 46 88 15 19 20 49A.12B33C06D16解析:选C.被选中的红色球号码依次为17,12,33,06,32,22.所以第四个被选中的红色球号码为06,故选C.2利用系统抽样法从编号分别为1,2,3,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为()A73B78C77D76解析:选B.样本的分段间隔为5,所以13号在第三组,则最大的编号为13(163)578.故选B.3某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20 000人,其中各种态度对应的人数如下表所示:最喜爱喜爱一般不喜欢4 8007 2006 4001 600电视台为了了解观众的具体想法和意见,打算从中抽选出100人进行更为详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽选出的人数分别为()A25,25,25,25B48,72,64,16C20,40,30,10D24,36,32,8解析:选D.法一:因为抽样比为,所以每类人中应抽选出的人数分别为4 80024,7 20036,6 40032,1 6008.故选D.法二:最喜爱、喜爱、一般、不喜欢的比例为4 8007 2006 4001 6006982,所以每类人中应抽选出的人数分别为10024,10036,10032,1008,故选D.“双图”“五数”估计总体(基础型) 统计中的5个数据特征(1)众数:在样本数据中,出现次数最多的那个数据(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据如果数据的个数为偶数,就取中间两个数据的平均数作为中位数(3)平均数:样本数据的算术平均数,即(x1x2xn)(4)方差与标准差:s2(x1)2(x2)2(xnx)2;s. 从频率分布直方图中得出有关数据的技巧(1)频率:频率分布直方图中横轴表示组数,纵轴表示,频率组距.(2)频率比:频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比,从而根据已知的几组数据个数比求有关值(3)众数:最高小长方形底边中点的横坐标(4)中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标(5)平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和(6)性质应用:若纵轴上存在参数值,则根据所有小长方形的高之和组距1,列方程即可求得参数值考法全练1某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量,如下表所示:用电量/度120140160180200户数23582则这20户家庭该月用电量的众数和中位数分别是()A180,170B160,180C160,170D180,160解析:选A.用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B,C;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A.2(2018贵阳模拟)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80100分的学生人数是()A15B18C20D25解析:选A.根据频率分布直方图,得第二小组的频率是0.04100.4,因为频数是40,所以样本容量是100,又成绩在80100分的频率是(0.010.005)100.15,所以成绩在80100分的学生人数是1000.1515.故选A.3(2018武汉调研)某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个得分的平均数为91,如图,该选手的7个得分的茎叶图有一个数据模糊,无法辨认,在图中用x表示,则剩余5个得分的方差为()A.B.C6D30解析:选C.由茎叶图知,最低分为87分,最高分为99分依题意得,(879390910x91)91,解得x4.则剩余5个得分的方差s2(8791)2(9391)2(9091)2(9491)2(9191)2(16419)6.故选C.4“中国人均读书4.3本(包括网络文学和教科书),比韩国的11本、法国的20本、日本的40本、犹太人的64本少得多,是世界上人均读书最少的国家”这个论断被各种媒体反复引用出现这样的统计结果无疑是令人尴尬的某小区为了提高小区内人员的读书兴趣,准备举办读书活动,并进一定量的书籍丰富小区图书站由于不同年龄段的人看不同类型的书籍,为了合理配备资源,现对小区内看书人员进行年龄调查,随机抽取了40名读书者进行调查,将他们的年龄(单位:岁)分成6段:20,30),30,40),40,50),50,60),60,70),70,80后得到如图所示的频率分布直方图(1)求在这40名读书者中年龄分布在40,70)的人数;(2)求这40名读书者的年龄的平均数和中位数解:(1)由频率分布直方图知年龄在40,70)的频率为(0.0200.0300.025)100.75,故这40名读书者中年龄分布在40,70)的人数为400.7530.(2)这40名读书者年龄的平均数为250.05350.10450.20550.30650.25750.1054.设中位数为x,则0.005100.010100.020100.030(x50)0.5,解得x55,故这40名读书者年龄的中位数为55.回归分析(综合型)典型例题命题角度一线性回归分析 (2018广州模拟)某地110岁男童年龄xi(单位:岁)与身高的中位数yi(单位:cm)(i1,2,10)如下表:x/岁12345678910y/cm76.588.596.8104.1111.3117.7124.0130.0135.4140.2对上表的数据作初步处理,得到下面的散点图及一些统计量的值 (xi)2 (yi)2 (xi)(yi)5.5112.4582.503 947.71566.85(1)求y关于x的线性回归方程(线性回归方程系数精确到0.01);(2)某同学认为ypx2qxr更适宜作为y关于x的回归方程类型,他求得的回归方程是0.30x210.17x68.07.经调查,该地11岁男童身高的中位数为145.3 cm.与(1)中的线性回归方程比较,哪个回归方程的拟合效果更好?附:回归方程x中的斜率和截距的最小二乘估计公式分别为:,.【解】(1)6.8716.87,112.456.8715.574.66,所以y关于x的线性回归方程为6.87x74.66.(2)若回归方程为6.87x74.66,当x11时,150.23.若回归方程为0.30x210.17x68.07,当x11时,y143.64.|143.64145.3|1.66<|150.23145.3|4.93,所以回归方程0.30x210.17x68.07对该地11岁男童身高中位数的拟合效果更好求回归直线方程的关键及实际应用(1)关键:正确理解计算,的公式和准确地计算(2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值 命题角度二非线性回归分析 (2018潍坊模拟)某机构为研究某种图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的关系,收集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值 (xi)2 (xi)(yi) (ui)2 (ui)(yi)15.253.630.2692 085.5230.30.7877.049表中ui,ui.(1)根据散点图判断:yabx与yc哪一个模型更适合作为该图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的回归方程?(只要求给出判断,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程(回归系数的结果精确到0.01);(3)若该图书每册的定价为10元,则至少应该印刷多少册才能使销售利润不低于78 840元?(假设能够全部售出结果精确到1)附:对于一组数据(w1,v1),(w2,v2),(wn,vn),其回归直线w的斜率和截距的最小二乘估计分别为,v.【解】(1)由散点图判断,yc更适合作为该图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的回归方程(2)令u,先建立y关于u的线性回归方程,由于8.9578.96,所以3.638.9570.2691.22,所以y关于u的线性回归方程为1.228.96u,所以y关于x的回归方程为1.22.(3)假设印刷x千册,依题意得10xx78.840,所以x10,所以至少印刷10 000册才能使销售利润不低于78 840元求非线性回归方程的步骤(1)确定变量,作出散点图(2)根据散点图,选择恰当的拟合函数 (3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程(4)分析拟合效果:通过计算相关指数或画残差图来判断拟合效果(5)根据相应的变换,写出非线性回归方程命题角度三回归分析与正态分布的综合问题 (2018兰州模拟)某地一商场记录了12月份某5天当中某商品的销售量y(单位:kg)与该地当日最高气温x(单位:)的相关数据,如下表:x119852y7881012(1)试求y与x的回归方程x;(2)判断y与x之间是正相关还是负相关;若该地12月某日的最高气温是6 ,试用所求回归方程预测这天该商品的销售量;(3)假定该地12月份的日最高气温XN(,2),其中近似取样本平均数,2近似取样本方差s2,试求P(3.8<X<13.4)附:参考公式和有关数据,3.2,1.8,若XN(,2),则P(<X<)0.682 7,且P(2<X<2)0.954 5.【解】(1)由题意,7,9,xiyin28757928,xn229557250,0.56,9(0.56)712.92.所以所求回归直线方程为0.56x12.92.(2)由0.56<0知,y与x负相关将x6代入回归方程可得,0.56612.929.56,即可预测当日该商品的销售量为9.56 kg.(3)由(1)知7,3.2,所以P(3.8<X<13.4)P(<X<2)P(<X<)P(2<X<2)0.818 6.解决与正态分布有关的问题,在理解,2的意义情况下,记清正态分布的密度曲线是一条关于对称的钟形曲线,很多问题都是利用图象的对称性解决的 对点训练(2018高考全国卷)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:30.413.5 t;根据2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型:9917.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由解:(1)利用模型,该地区2018年的环境基础设施投资额的预测值为30.413.519226.1(亿元)利用模型,该地区2018年的环境基础设施投资额的预测值为9917.59256.5(亿元)(2)利用模型得到的预测值更可靠理由如下:(以下2种理由,任选其一)()从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y30.413.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型9917.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠()从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠统计案例(综合型)典型例题 (2018福州模拟)某学校八年级共有学生400人,现对该校八年级学生随机抽取50名进行实践操作能力测试,实践操作能力测试结果分为四个等级水平,一、二等级水平的学生实践操作能力较弱,三、四等级水平的学生实践操作能力较强,测试结果统计如下表:等级水平一水平二水平三水平四男生/名48126女生/名6842(1)根据表中统计的数据填写下面22列联表,并判断是否有95%的把握认为学生实践操作能力强弱与性别有关?实践操作能力较弱实践操作能力较强总计男生/名女生/名总计(2)现从测试结果为水平一的学生中随机抽取4名进行学习力测试,记抽到水平一的男生的人数为,求的分布列和数学期望下面的临界值表供参考:P(K2k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828参考公式:K2,其中nabcd.【解】(1)22列联表如下:实践操作能力较弱实践操作能力较强总计男生/名121830女生/名14620总计262450所以K24.327>3.841.所以有95%的把握认为学生实践操作能力强弱与性别有关(2)的取值为0,1,2,3,4.P(0),P(1),P(2),P(3),P(4).所以的分布列为01234P所以E()012341.6.独立性检验的关键(1)根据22列联表准确计算K2,若22列联表没有列出来,要先列出此表(2)K2的观测值k越大,对应假设事件H0成立的概率越小,H0不成立的概率越大 对点训练(2018高考全国卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人第一组工人用第一种生产方式,第二组工人用第二种生产方式根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2,P(K2k)0.0500.0100.001k3.8416.63510.828解:(1)第二种生产方式的效率更高理由如下:(以下4种理由,任选其一)()由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟因此第二种生产方式的效率更高()由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟因此第二种生产方式的效率更高()由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟因此第二种生产方式的效率更高()由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少因此第二种生产方式的效率更高(2)由茎叶图知m80.列联表如下:超过m不超过m第一种生产方式155第二种生产方式515(3)由于K2106.635,所以有99%的把握认为两种生产方式的效率有差异一、选择题1某班对八校联考成绩进行分析,利用随机数法抽取样本时,先将60个同学按01,02,03,60进行编号,然后从随机数表第9行第5列的数开始向右读,则选出的第6个个体是()(注:下表为随机数表的第8行和第9行)6301 6378 5916 9555 6719 9810 5071 7512 8673 5807 4439 5238 793321 1234 2978 6456 0782 5242 0744 3815 5100 1342 9966 0279 54A07B25C42D52解析:选D.依题意得,依次选出的个体分别是12,34,29,56,07,52,因此选出的第6个个体是52.2(2018高考全国卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:则下面结论中不正确的是()A新农村建设后,种植收入减少B新农村建设后,其他收入增加了一倍以上C新农村建设后,养殖收入增加了一倍D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析:选A.法一:设建设前经济收入为a,则建设后经济收入为2a,则由饼图可得建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的故选A.法二:因为0.6<0.372,所以新农村建设后,种植收入增加,而不是减少,所以A是错误的故选A.3(2018昆明模拟)AQI(Air Quality Index,空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度AQI共分六级,从一级优(050);二级良(51100);三级轻度污染(101150);四级中度污染(151200);直至五级重度污染(201300);六级严重污染(大于300)如图是昆明市2017年4月份随机抽取10天的AQI茎叶图,利用该样本估计昆明市2018年4月份空气质量优的天数为()A3B4C12D21解析:选C.从茎叶图知10天中有4天空气质量为优,所以空气质量为优的频率为,所以估计昆明市2018年4月份空气质量为优的天数为3012,故选C.4对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间25,30)的为一等品,在区间20,25)和30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为()A5B7C10D50解析:选D.根据题中的频率分布直方图可知,三等品的频率为1(0.050 00.062 50.037 5)50.25,因此该样本中三等品的件数为2000.2550.5(2018桂林、白色、梧州、崇左、北海五市联考)如图是2017年第一季度五省GDP情况图,则下列陈述正确的是()2017年第一季度GDP总量和增速均居同一位的省只有1个;与去年同期相比,2017年第一季度五个省的GDP总量均实现了增长;去年同期的GDP总量前三位是D省、B省、A省;2016年同期A省的GDP总量也是第三位ABCD解析:选B.2017年第一季度GDP总量和增速均居同一位的省有2个,B省和C省的GDP总量和增速分别居第一位和第四位,故错误;由图知正确;由图计算2016年同期五省的GDP总量,可知前三位为D省、B省、A省,故正确;由知2016年同期A省的GDP总量是第三位,故正确故选B.6(一题多解)(2018石家庄质量检测(二)某学校A、B两个班的数学兴趣小组在一次数学对抗赛中的成绩绘制茎叶图如下,通过茎叶图比较两个班数学兴趣小组成绩的平均值及标准差A班数学兴趣小组的平均成绩高于B班的平均成绩;B班数学兴趣小组的平均成绩高于A班的平均成绩;A班数学兴趣小组成绩的标准差大于B班成绩的标准差;B班数学兴趣小组成绩的标准差大于A班成绩的标准差其中正确结论的编号为()ABCD解析:选B.法一:由于A(536264767478787681858688829295)78,B(454851535662646573737470838291)66,所以A>B,所以正确s(5378)2(6278)2(6478)2(7678)2(7478)2(7878)2(7878)2(7678)2(8178)2(8578)2(8678)2(8878)2(8278)2(9278)2(9578)2121.6,s(4566)2(4866)2(5166)2(5366)2(5666)2(6266)2(6466)2(6566)2(7366)2(7366)2(7466)2(7066)2(8366)2(8266)2(9166)2175.2.故s>s,B班的方差大,则B班的标准差也大,正确,故选B.法二:由茎叶图可知,A班数学兴趣小组的平均成绩明显高于B班;A班的数学成绩较稳定,大多在7090分,B班的数学成绩较分散,显然B班的方差、标准差较大,故选B.二、填空题7给出下列四个命题:某班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中另一位同学的编号为23;一组数据1,2,3,3,4,5的平均数、众数、中位数都相同;若一组数据a,0,1,2,3的平均数为1,则其标准差为2;根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为x,其中2,1,3,则1.其中真命题有_(填序号)解析:在中,由系统抽样知抽样的分段间隔为52413,故抽取的样本的编号分别为7号、20号、33号、46号,故是假命题;在中,数据1,2,3,3,4,5的平均数为(123345)3,中位数为3,众数为3,都相同,故是真命题;在中,因为样本的平均数为1,所以a01235,解得a1,故样本的方差为(11)2(01)2(11)2(21)2(31)22,标准差为,故是假命题;在中,回归直线方程为x2,又回归直线过点(,),把(1,3)代入回归直线方程2,得1,故是真命题答案:8(2018长沙模拟)为了解某社区居民购买水果和牛奶的年支出费用与购买食品的年支出费用的关系,随机调查了该社区5户家庭,得到如下统计数据表:购买食品的年支出费用x/万元2.092.152.502.842.92购买水果和牛奶的年支出费用y/万元1.251.301.501.701.75根据上表可得回归直线方程x,其中0.59,据此估计,该社区一户购买食品的年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约为_万元解析:2.50(万元),1.50(万元),其中0.59,0.025,0.59x0.025,故年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约为0.593.000.0251.795万元答案:1.7959某同学在高三学年的五次阶段性考试中,数学成绩依次为110,114,121,119,126,则这组数据的方差是_解析:因为对一组数据同时加上或减去同一个常数,方差不变,所以本题中可先对这5个数据同时减去110,得到新的数据分别为0,4,11,9,16,其平均数为8,根据方差公式可得s2(08)2(48)2(118)2(98)2(168)230.8.答案:30.8三、解答题10某校为了解高一学生周末的“阅读时间”,从高一年级中随机抽取了100名学生进行调查,获得了每人的周末“阅读时间”(单位:小时),按照0,0.5),0.5,1),4,4.5分成9组,制成样本的频率分布直方图如图所示:(1)求图中a的值;(2)估计该校高一学生周末“阅读时间”的中位数;(3)用样本频率代替概率现从全校高一年级随机抽取20名学生,其中有k名学生“阅读时间”在1,2.5)内的概率为P(Xk),其中k0,1,2,20.当P(Xk)最大时,求k的值解:(1)由频率分布直方图可知,周末“阅读时间”在0,0.5)内的频率为0.080.50.04.同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5内的频率分别为0.08,0.20,0.25,0.07,0.04,0.02,所以1(0.040.080.200.250.070.040.02)0.5a0.5a,解得a0.30.(2)设该校高一学生周末“阅读时间”的中位数为m小时因为前5组的频率之和为0.040.080.150.200.250.72>0.5,而前4组的频率之和为0.040.080.150.200.47<0.5,所以2m<2.5.由0.5(m2)0.50.47,解得m2.06.故可估计该校高一学生周末“阅读时间”的中位数为2.06小时(3)设在取出的20名学生中,周末“阅读时间”在1,2.5)内的有X人,则X服从二项分布,即XB(20,0.6),所以恰好有k名学生周末“阅读时间”在1,2.5)内的概率为P(Xk)C(0.6)k(0.4)20k,其中k0,1,2,20.设t,k1,2,20.若t>1,则k<12.6,P(Xk1)<P(Xk);若t<1,则k>12.6,P(Xk1)>P(Xk)又<1,所以当k12时,P(Xk)最大所以k的值为12.11(2018石家庄质量检测(二)随着网络的发展,网上购物越来越受到人们的喜爱,各大购物网站为增加收入,促销策略越来越多样化,促销费用也不断增加下表是某购物网站2017年18月促销费用(单位:万元)和产品销量(单位:万件)的具体数据月份12345678促销费用x2361013211518产品销量y11233.5544.5(1)根据数据可知y与x具有线性相关关系,请建立y关于x的回归方程x(系数精确到0.01);(2)已知6月份该购物网站为庆祝成立1周年,特制定奖励制度:以z(单位:件)表示日销量,z1 800,2 000),则每位员工每日奖励100元;z2 000,2 100),则每位员工每日奖励150元;z2 100,),则每位员工每日奖励200元现已知该网站6月份日销量z服从正态分布N(0.2,0.000 1),请你计算某位员工当月奖励金额总数大约多少元(当月奖励金额总数精确到百分位)参考数据:xiyi338.5,x1 308,其中xi,yi分别为第i个月的促销费用和产品销量,i1,2,3,8.若随机变量z服从正态分布N(,2),则P(<z<)0.682 7,P(2<z<2)0.954 5.解:(1)由题可知11,3,将数据代入得0.2190.22.30.219110.59,所以y关于x的回归方程为0.22x0.59.(2)由6月份日销量z服从正态分布N(0.2,0.000 1),得日销量在1 800,2 000)的概率为0.477 25,日销量在2 000,2 100)的概率为0.341 35,日销量在2 100,)的概率为0.158 65,所以每位员工当月的奖励金额大约为(1000.477 251500.341 352000.158 65)303 919.7253 919.73(元)12(2018南京模拟)某校为了推动数学教学方法的改革,学校将高一年级部分生源情况基本相同的学生分成甲、乙两个班,每班各40人,甲班按原有模式教学,乙班实施教学方法改革经过一年的教学实验,将甲、乙两个班学生一年来的数学成绩取平均数,两个班学生的平均成绩均在50,100,按照区间50,60),60,70),70,80),80,90),90,100进行分组,绘制成如下频率分布直方图,规定不低于80分(百分制)为优秀(1)完成表格,并判断是否有90%以上的把握认为“数学成绩优秀与教学改革有关”;甲班乙班总计大于等于80分的人数小于80分的人数总计(2)从乙班70,80),80,90),90,100分数段中,按分层抽样随机抽取7名学生座谈,从中选3名学生发言,记来自80,90)发言的人数为随机变量X,求X的分布列和数学期望参数数据和公式:P(K2k0)0.100.050.025k02.7063.8415.024K2解:(1)补全表格如下:甲班乙班总计大于等于80分的人数122032小于80分的人数282048总计404080依题意得K23.333>2.706,故有90%以上的把握认为“数学成绩优秀与教学改革有关”(2)从乙班70,80),80,90),90,100分数段中抽取的人数分别为2,3,2,依题意随机变量X的所有可能取值为0,1,2,3,P(X0),P(X1),P(X2),P(X3),其分布列如下表:X0123P所以E(X)0123.