《统计与统计案例课件.pptx》由会员分享,可在线阅读,更多相关《统计与统计案例课件.pptx(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计与统计案例统计与统计案例高考理数高考理数(课标专用)全国名校高考数学复习优质学案汇编(附详解)A A组组统一命题统一命题课标卷题组课标卷题组考点一抽样方法与总体分布的估计考点一抽样方法与总体分布的估计1.(优质试题课标全国,3,5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:五年高考下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经
2、济收入的一半答案答案A设建设前经济收入为a,则建设后经济收入为2a,由题图可知:根据上表可知B、C、D结论均正确,结论A不正确,故选A.种植收入第三产业收入养殖收入其他收入建设前经济收入0.6a0.06a0.3a0.04a建设后经济收入0.74a0.56a0.6a0.1a2.(优质试题课标全国,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了优质试题年1月至优质试题年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月
3、的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案答案A本题考查统计,数据分析.观察优质试题年的折线图,发现从8月至9月,以及10月开始的三个月接待游客量都是减少的,故A选项是错误的.3.(优质试题课标,3,5分,0.782)根据下面给出的2004年至优质试题年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案答案D由柱形图可知:A、B、C均正确,2006年以来我国二氧化
4、硫年排放量在逐渐减少,所以排放量与年份负相关,D不正确.考点二变量间的相关关系、统计案例考点二变量间的相关关系、统计案例1.(优质试题课标全国,18,12分)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高,并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列
5、联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=,.解析解析本题考查统计图表的含义及应用、独立性检验的基本思想及其应用.(1)第二种生产方式的效率更高.理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.
6、因此第二种生产方式的效率更高.(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.以上给出了4种理由,
7、答出其中任意一种或其他合理理由均可.(2)由茎叶图知m=80.列联表如下:超过m不超过m第一种生产方式155第二种生产方式515(3)由于K2=106.635,所以有99%的把握认为两种生产方式的效率有差异.思路分析思路分析(1)根据茎叶图中的数据大致集中在哪个茎,作出判断;(2)通过茎叶图确定数据的中位数,按要求完成22列联表;(3)根据(2)中的列联表,将有关数据代入公式计算得K2的值,查表作出统计推断.易错警示易错警示数据分析容易出错.(1)审清题意:弄清题意,理顺条件和结论;(2)找数量关系:把图形语言转化为数字,找关键数量关系;(3)建立解决方案:找准公式,将22列联表中数值代入公式
8、计算;(4)作出结论:依据数据,查表作出正确判断.解后反思解后反思独立性检验问题的常见类型及解题策略(1)已知分类变量的数据,判断两个分类变量的相关性,可依据数据及公式计算K2,然后作出判断;(2)独立性检验与概率统计的综合问题,关键是根据独立性检验的一般步骤,作出判断,再根据概率统计的相关知识求解.2.(优质试题课标全国,18,12分)下图是某地区2000年至优质试题年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区优质试题年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至优质试题年的数据(时间变量t的值依次为1,2,17)建立模型:=-30.4+13
9、.5t;根据2010年至优质试题年的数据(时间变量t的值依次为1,2,7)建立模型:=99+17.5t.(1)分别利用这两个模型,求该地区优质试题年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.解析解析(1)利用模型,该地区优质试题年的环境基础设施投资额的预测值为=-30.4+13.519=226.1(亿元).利用模型,该地区优质试题年的环境基础设施投资额的预测值为=99+17.59=256.5(亿元).(2)利用模型得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至优质试题年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,
10、这说明利用2000年至优质试题年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至优质试题年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至优质试题年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠.(ii)从计算结果看,相对于优质试题年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得
11、到的预测值更可靠.以上给出了2种理由,答出其中任意一种或其他合理理由均可.方法总结方法总结利用直线方程进行预测是对总体的估计,此估计值不是准确值;利用回归方程进行预测(把自变量代入回归直线方程)是对因变量的估计,此时,需要注意自变量的取值范围.3.(优质试题课标全国,18,12分)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg”,估计A的概率;箱产量50kg箱产量50kg旧养殖法新养殖法
12、(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:,K2=.解析解析本题考查了频率分布直方图,独立性检验.(1)记B表示事件“旧养殖法的箱产量低于50kg”,C表示事件“新养殖法的箱产量不低于50kg”.由题意知P(A)=P(BC)=P(B)P(C).旧养殖法的箱产量低于50kg的频率为(0.012+0.014+0.024+0.034+0.040)5=0.62,故P(B)的估计值为0.62.新养殖法的箱产量不低于50kg的频率为(0.068+0.046+0.010+0.00
13、8)5=0.66,故P(C)的估计值为0.66.因此,事件A的概率估计值为0.620.66=0.4092.(2)根据箱产量的频率分布直方图得列联表箱产量6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50kg的直方图面积为(0.004+0.020+0.044)5=0.340.5,故新养殖法箱产量的中位数的估计值为50+52.35(kg).解后反思解后反思解独立性检验问题的关注点:(1)两个明确:明确两类主体;明确研究的两个问题.(2)两个关键:准确画出22列联表;准确理解K2.考点三回归分析考点三回归分析1.(优质试题课标全国,18,
14、12分)下图是我国2008年至优质试题年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测优质试题年我国生活垃圾无害化处理量.附注:参考数据:yi=9.32,tiyi=40.17,=0.55,2.646.参考公式:相关系数r=,回归方程=+t中斜率和截距的最小二乘估计公式分别为:=,=-.解析解析(1)由折线图中数据和附注中参考数据得=4,(ti-)2=28,=0.55,(ti-)(yi-)=tiyi-yi=40.17-49.32=2.89,r0.99.(4分)因为y与
15、t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.(6分)(2)由=1.331及(1)得=0.10,=-=1.331-0.1040.93.所以,y关于t的回归方程为=0.93+0.10t.(10分)将优质试题年对应的t=9代入回归方程得=0.93+0.109=1.83.所以预测优质试题年我国生活垃圾无害化处理量约为1.83亿吨.(12分)2.(优质试题课标,19,12分,0.349)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi
16、(i=1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.(xi-)2(wi-)2(xi-)(yi-)(wi-)(yi-)46.65636.8289.81.61469108.8(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:(i)年宣传费x=49时,年销售量及年利润的预报值是多少?(ii)年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1
17、,v1),(u2,v2),(un,vn),其回归直线v=+u的斜率和截距的最小二乘估计分别为=,=-.解析解析(1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.(2分)(2)令w=,先建立y关于w的线性回归方程.由于=68,=-=563-686.8=100.6,所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68.(6分)(3)(i)由(2)知,当x=49时,年销售量y的预报值=100.6+68=576.6,年利润z的预报值=576.60.2-49=66.32.(9分)(ii)根据(2)的结果知,年利润z的预报值=0.2(
18、100.6+68)-x=-x+13.6+20.12.所以当=6.8,即x=46.24时,取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.(12分)解后反思解后反思本题考查利用散点图判断回归直线方程的方法、求回归直线方程以及利用回归方程进行分析和预测等知识,考查学生对数据的处理能力.B B组组自主命题自主命题省省(区、市区、市)卷题组卷题组考点一抽样方法与总体分布的估计考点一抽样方法与总体分布的估计1.(优质试题山东,3,5分)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),2
19、0,22.5),22.5,25),25,27.5),27.5,30.根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140答案答案D由频率分布直方图知这200名学生每周的自习时间不少于22.5小时的频率为1-(0.02+0.10)2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为2000.7=140,故选D.2.(优质试题陕西,2,5分)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.167B.137C.123D.93答案答案B初中部女教师的人数为11070%=7
20、7,高中部女教师的人数为150(1-60%)=60,则该校女教师的人数为77+60=137,故选B.3.(优质试题江苏,3,5分)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为.8999011答案答案90解析解析本题考查茎叶图、平均数.5位裁判打出的分数分别为89,89,90,91,91,则这5位裁判打出的分数的平均数为(89+89+90+91+91)=90.方法总结方法总结要明确“茎”处数字是十位数字,“叶”处数字是个位数字,正确写出所有数据,再根据平均数的概念进行计算.4.(优质试题江苏,3,5分)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为
21、200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.答案答案18解析解析本题考查分层抽样方法及用样本估计总体.从丙种型号的产品中抽取的件数为60=18.5.(优质试题湖南,12,5分)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数是.答案答案4解析解析由系统抽样方法知,应把35人分成7组,每组5人,每组按规则抽取1人,因为成绩在区间139,151上的共有4组,故成绩在区间13
22、9,151上的运动员人数是4.6.(优质试题四川,16,12分)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照0,0.5),0.5,1),4,4.5分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨)
23、,估计x的值,并说明理由.解析解析(1)由频率分布直方图知,月均用水量在0,0.5)中的频率为0.080.5=0.04,同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5)中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5a+0.20+0.26+0.5a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为3000000.12=360
24、00.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.880.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.730.85,所以2.5x0.85,前5组的频率之和为0.733.841,所以在犯错误不超过5%的前提下,认为“小白鼠是否被感染与有没有服用疫苗有关”.答案答案5%考点三回归分析考点三回归分析1.(优质试题四川成都七中4月月考,3)已知x,y的取值如下表所示:从散点图分析y与x的关系,且=0.95x+a,则a=()A.2.2B.3.36C.2.6D.1.95x0134y2.24.34.86.7答案答案C=2,=
25、4.5,a=4.5-0.952=2.6.2.(优质试题广西南宁、百色、玉林大联考,18)如图所示是某企业2010年至优质试题年污水净化量(单位:吨)的折线图.注:年份代码17分别对应年份2010优质试题.(1)由折线图看出,可用线性回归模型拟合y和t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程,预测优质试题年该企业污水净化量;(3)请用数据说明回归方程预报的效果.附注:参考数据:=54,(ti-)(yi-)=21,3.74,(yi-)2=;参考公式:相关系数r=,回归方程=+t中斜率和截距的最小二乘法估计公式分别为=,=-;反映回归效果的公式为R2=1-,其中R2越接近于1,表示
26、回归的效果越好.解析解析(1)由折线图中的数据和附注中的参考数据得,=4,(ti-)2=28,(yi-)2=18,所以r=0.935.因为y与t的相关系数近似为0.935,说明y与t的线性相关程度相当大,从而可以用线性回归模型拟合y与t的关系.(2)由=54及(1)得=,=-=54-4=51,所以y关于t的回归方程为=+=t+51,将优质试题年对应的t=8代入得=8+51=57,所以预测优质试题年该企业污水净化量约为57吨.(3)因为R2=1-=1-=1-=0.875,所以“污水净化量的差异”有87.5%是由年份引起的,这说明回归方程预测的效果是良好的.1.(优质试题四川成都高三一诊,3)空气
27、质量指数AQI是检测空气质量的重要参数,其数值越大说明空气污染状况越严重,空气质量越差.某地环保部门统计了该地区12月1日至12月24日连续24天的空气质量指数AQI,根据得到的数据绘制出如图所示的折线图.则下列说法错误的是()A.该地区在12月2日空气质量最好B B组组优质试题优质试题优质试题年高考模拟优质试题年高考模拟综合题组综合题组(时间:35分钟分值:55分)一、选择题(每题5分,共20分)B.该地区在12月24日空气质量最差C.该地区从12月7日到12月12日AQI持续增大D.该地区的空气质量指数AQI与这段日期成负相关答案答案D由题图可知A、B、C正确;显然D错误.2.(优质试题贵
28、州遵义高三第二次联考,4)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,n)都在直线y=x+1上,则这组样本数据的样本相关系数为()A.-1B.0C.D.1答案答案D两个变量的线性相关性越强,相关系数越接近1.由题意知所有的数据都在回归直线上,所以相关系数为1.3.(优质试题四川成都外国语学校12月月考,8)从某中学甲、乙两个班中各随机抽取10名同学,测量他们的身高(单位:cm)后获得身高数据的茎叶图如图,在这20人中,记身高在150,160),160,170),170,180),180,190
29、)的人数依次为A1,A2,A3,A4,图是统计样本中身高在一定范围内的人数的程序框图,则下列说法正确的是()图图A.由图可知甲、乙两班中平均身高较高的是甲班,图输出的S的值为18B.由图可知甲、乙两班中平均身高较高的是乙班,图输出的S的值为16C.由图可知甲、乙两班中平均身高较高的是乙班,图输出的S的值为18D.由图可知甲、乙两班中平均身高较高的是甲班,图输出的S的值为16答案答案C由茎叶图可知,甲班学生身高的平均数为170.4cm,乙班学生身高的平均数为170.7cm,故乙班学生的平均身高较高.由题意可知,A1=2,A2=7,A3=9,A4=2,由程序框图易知,最后输出的结果为S=7+9+2
30、=18.4.(优质试题广西南宁二模,9)某种产品的质量以其质量指标值来衡量,质量指标值越大表明质量越好,且质量指标值大于或等于100的产品为优质品,现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值(都在区间90,110内),将这些数据分成4组:90,95),95,100),100,105),105,110,得到如下两个频率分布直方图:已知这2种配方生产的产品利润y(单位:百元)与其质量指标值t的关系式均为y=若以上面数据的频率作为概率,分别从用A配方和B配方生产的产品中随机抽取一件,且抽取的这2件产品相互独立,则抽得的这两件产品利润之和为0
31、的概率为()A.0.125B.0.195C.0.215D.0.235答案答案B由题图可知,A配方利润为-1,0,1的频率分别为0.2,0.3,0.2,B配方利润为-1,0,1的频率分别为0.1,0.35,0.35,故抽得的这两件产品利润之和为0的概率为0.20.35+0.30.35+0.20.1=0.07+0.105+0.02=0.195.二、填空题(共5分)5.(优质试题四川成都七中2月月考,14)将参加冬季越野跑的600名选手编号为:001,002,600,采用系统抽样方法抽取一个容量为50的样本,把编号分为50组后,第一组的001到012这12个编号中随机抽得的号码为004,这600名选
32、手穿着三种颜色的衣服,从001到301穿红色衣服,从302到496穿白色衣服,从497到600穿黄色衣服,则抽到穿白色衣服的选手人数为.答案答案17解析解析=12,所以抽到穿白色衣服的选手号码为304,316,496,共+1=17.三、解答题(共30分)6.(优质试题广西南宁一模,18)某中学是走读中学,为了让学生更有效率地利用下午放学后的时间,学校在本学期第一次月考后设立了多间自习室,以便让学生在自习室自主学习、完成作业,同时每天派老师轮流值班.在本学期第二次月考后,高一某班数学老师统计了两次考试中该班数学成绩优良人数和非优良人数,得到如下22列联表:非优良优良总计未设立自习室251540设
33、立自习室103040总计354580(1)能否在犯错误的概率不超过0.005的前提下认为设立自习室对提高学生的成绩有效?(2)设从该班第一次月考的所有学生的数学成绩中任取2个,取到优良成绩的个数为X;从该班第二次月考的所有学生的数学成绩中任取2个,取到优良成绩的个数为Y,求X与Y的期望并比较大小,请解释所得结论的实际意义.下面的临界值表供参考:P(K2k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828参考公式:K2=,其中n=a+b+c+d解析解析(1)能.理由:根据22列联表可求得K2的观测值k=
34、7.879,能在犯错误的概率不超过0.005的前提下认为设立自习室对提高学生的成绩有效.(2)X的取值为0,1,2,则P(X=0)=,P(X=1)=,P(X=2)=,X的分布列为X012PE(X)=0+1+2=.Y的取值为0,1,2,P(Y=0)=,P(Y=1)=,P(Y=2)=,Y的分布列为Y012PE(Y)=0+1+2=.E(X)E(Y),设立自习室对提高学生的数学成绩有一定的效果.思路分析思路分析(1)求出K2的值,对照临界值表即可得到正确答案;(2)分别求X的取值为0,1,2和Y的取值为0,1,2时相应的概率,求出其期望,即可得到结论.7.(优质试题广西南宁第二中学1月月考,18)某地
35、4个蔬菜大棚顶部,阳光照在一棵棵茁壮生长的蔬菜上,这些采用水培、无土栽培方式种植的各类蔬菜,成为该地区居民争相购买的对象,过去50周的资料显示:该地光照量X(小时)都在30以上,其中不足50的大约有5周,不低于50且不超过70的大约有35周,超过70的大约有10周,根据统计,某种改良黄瓜每个蔬菜大棚增加量y(百斤)与每个蔬菜大棚使用农夫1号液体肥料x(千克)之间对应数据为如图所示的折线图.(1)依据数据的折线图,用最小二乘法求出y关于x的线性回归方程=x+;并根据所求线性回归方程,估计如果每个蔬菜大棚使用农夫1号肥料10千克,则这种改良黄瓜每个蔬菜大棚增加量y是多少斤;(2)因蔬菜大棚对光照要
36、求较大,某光照控制仪商家为应对恶劣天气对光照的影响,为该基地提供了部分光照控制仪,该商家希望安装的光照控制仪尽可能运行,但每周光照控制仪最多可运行台数受周光照量X限制,并有如下关系:周光照量X(单位:小时)30 x70光照控制仪最多可运行台数321若某台光照控制仪运行,则该台光照控制仪周利润为4000元;若某台光照控制仪未运行,则该台光照控制仪周亏损500元,欲使商家周总利润的均值达到最大,应安装光照控制仪多少台?附:回归方程系数公式=,=-.解析解析(1)=5,=4,xiyi=23+44+54+64+85=106,=22+42+52+62+82=145,=0.3,=-=4-0.35=2.5,
37、所以y关于x的线性回归方程为=0.3x+2.5,当x=10时,=0.310+2.5=5.5百斤=550斤,所以估计如果每个蔬菜大棚使用农夫1号肥料10千克,则这种改良黄瓜每个蔬菜大棚增加量y是550斤.(2)记商家总利润为Y元,由已知条件可知至少需安装1台,安装1台光照控制仪可获得周利润4000元,安装2台光照控制仪的情形:当X70时,一台光照控制仪运行,此时Y=4000-500=3500元,当3070时,一台光照控制仪运行,此时Y=4000-2500=3000元,当50X70时,两台光照控制仪运行,此时Y=4000+4000-500=7500元,当30X50时,三台光照控制仪都运行,此时Y=4000+4000+4000=12000元.故Y的分布列为Y35008000P0.20.8Y3000750012000P0.20.70.1所以EY=30000.2+75000.7+120000.1=7050元.综上,为使商家周总利润的均值达到最大应该安装2台光照控制仪.
限制150内