选修12讲义精练第4章4.4一元线性回归案例.docx
4. 4元线性回归案例抽象问题情境化,新知无师自通接教材蟆要点1.相关系数定义:样本量是的成对观测数据用(xi, yi)9(必,yi)9,%)表示,用即表 示数据Xi,工2,,xn9用回表示数据也,用x与y分别表示%和5的均 值,用Sx表示趋的标准差,用与表示»的标准差,再引入xm+x2y2HVxnyn一 一§盯=- x y当“s声0时,称F=*为即和对的相关系数.当F>o,我们称瞥力和,正相关;当飞<0,我们称方和旧负相关;当F=0,我们称% 和M 不相关.(2)性质:R总在区间匕LU中取值;当r盯越接近于1时,X增加,y也倾向于增加,这时数据(修,山),(工2, 72),,(工, %),分散在一条上升的直线四周:当r孙越接近于一1时,%增加,y倾向于削减,这时数据(修,yi),(必,刈), %),分散在一条削减的直线四周.2. 一元线性回归(1)回归直线方程:/: y=bx-a9其中 b=*,a= y b x .(2)一元线性回归模型:假设样本量n的成对观测数据(xi,刃),(82, 72),,(x,%)中M和乐满意关系: =bxi+a+ei, i=l,2, , n9其中了,e?,,e表示随机误差,那么称该模型为一元线 性回归模型.小同题夫思箍1. %,|越接近1,及越接近于0,表示两个变量X与y之间线性相关程度如何?提示:IfI越接近1,说明两个变量的线性相关程度越强,它们的散点图越接近于一条 直线,这时用线性回归模型拟合这组数据的效果就越好;卜孙|越接近0,说明两个变量的线温度0io205070溶解度(y)如下:由此,得到回归直线的斜率是n解析:依据s盯=3胃一嚏 7,及方=*,得)=0.880 9.答案:0.880 9三、解答题9.在关于人体的脂肪含量(百分比)和年龄关系讨论中,讨论人员获得了如下一组数据:年龄X2226384145485053545657脂肪含 量y画出散点图;(2)求y与x之间的回归方程;(3)猜测39岁的人脂肪含量.(保存四位有效数字) 解:画出散点图.4540353025201510-520 25 30 35 40 45 50 5560 ”WV由散点图可以看出y与X之间有较强的线性相关关系, 1 11可算得x=石»:产44.545 5,rii=i1 111111y =五»产253364,渺=13 205,1?=23224,/=ii=i:= 1=詈勺0.5657,。=亍 bT =0.137 0.力与工之间的线性回归方程为j=0.565 7x+0.137 0.(3)当 x=39 时,j=0.565 7X39+0.137 0心22.20,,39岁的人的脂肪含量约为22.20%.10.随着我国经济的开展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份20132014201520162017时间代号t12345储蓄存款y(千亿元)567810A A A(1)求y关于t的回归方程3 =从十;用所求回归方程猜测该地区2018年=6)的人民币储蓄存款.11一»沙一 t yAAA 八 LIA A附:回归方程)=4+中,b=, a= y b t , t 2i=i解:(1)列表计算如下:*1tigUyi11515226412337921448163255102550153655120_ 1A 15_ 1A 36这里 n=5, t =Xti=彳=3, 7 =)»i=M=72又t2=555义32=10,lty= itiyi-n t y =120-5X3X7.2=12,从而=夕=itt12ioA A a= y b t X3=3.6,A故所求回归方程为yf+3.6.A将f=6代入回归方程可猜测该地区2018年的人民币储蓄存款为7*6+3.6=108(千 亿元). 性相关程度越弱,通常|f|>0.8时,认为有很强的相关关系.2 .在一元线性回归模型中,变量y由变量x唯一确定吗?提示:不唯一.y值由工和随机误差。共同确定,即自变量”只能解释局部y的变化.3 .随机误差e产生的主要缘由有哪些?提示:随机误差C产生的主要缘由有:(1)所用确实定性函数不恰当引起的误差;(2)忽视了某些因素的影响;(3)存在观测误差.4 .回归分析中,利用线性回归方程求出的函数值肯定是真实值吗?为什么?提示:不肯定是真实值.利用线性回归方程求的值,在许多时候是个预报值,例如, 人的体重与身高存在肯定的线性关系,但体重除了受身高的影响外,还受其他因素的影响, 如饮食,是否喜爱运动等.镇例D在某种产品外表进行腐蚀性刻线试验,得到腐蚀深度y与腐蚀时间x之间相 应的一组观看值,如下表:X(s)5101520304050607090120y(jim)610101316171923252946用散点图及相关系数两种方法推断x与y的相关性. 自主解答(1)作出如下图的散点图.Y50-40-30-.20-. . . .10- 020 40 60 80 100 120 X从散点图可看出腐蚀深度Hum)与腐蚀时间黑之间存在着较强的线性相关关系.(2)相关系数,盯=当,其中卬1+卬2+孙山1-Qsxy x y 362.562.s产34.515 8,10.697 1.A34.515 8X10.697 l)0.98.明显修1>0.8,所以腐蚀深度y与腐蚀时间x之间有很强的线性相关关系.现画总画推断两个变量x和y线性相关的方法:画出散点图,呈条状分布,那么x与y线性相关.用公式求出相关系数,据其推断x与y的相关性.假如|>0.8,那么有很强的线性相关关系.| 力之作1 .要分析同学学校升学的数学成果对高中一班级数学学习有什么影响,在高中一班级同学中随机抽选10名同学,分析他们入学的数学成果(幻和高中一班级期末数学考试成果 (y)(如表):编号12345678910X63674588817152995876y65785282928973985675用散点图及相关系数两种方法推断“与y的相关性.解:(1)入学成果(%)与高一期末考试成果任)两组变量的散点图(如图),从散点图看,这 两组变量具有线性相关关系.y10090 80-70-60-50-4d 111 一40 50 60 70 80 90 100 4由于工=70, j =76,s肛=189.4, Sx= 15.729, =14.339.由,盯=詈,得匕产。839 8>0.8.所以X与y有较强的线性关系.考查点三线性回归分析心 为了讨论某种细菌在特定环境下随时间变化的系列状况,得如下试验数据:天数t(天)34567繁殖个数y(千个)346求y关于,的线性回归方程;利用中的回归方程,猜测1=8时,细菌繁殖个数.自主解答由表中数据得7 =5, 7=4, ££»=108.5, i=i5i=l那么 Sty=-z-fy' =1.7, S?=2.a= y b t =0.25,工回归方程式为"一025将£=8代入(1)的回归方程中得jX 8-0.25=6.55.故猜测t=8时,细菌繁殖个数为655千个.现鹿总用进行线性回归分析的关键是画出样本点的散点图,确定出变量具有线性相关关系,再 求出回归直线方程.假如“,y的线性相关关系具有统计意义,就可以用线性回归方程来作 猜测和掌握.2 .某饮料店的日销售收入双单位:百元)与当天平均气温x(单位:摄氏度)之间有以下 数据:X-21012y54221甲、乙、丙三位同学对上述数据进行了讨论,分别得到了 X与y之间的三个线性回归 方程:尸一x+2.8,y=x+3,/+2.6.其中正确的选项是()A.B.C.D.解析:回归方程表示的直线必过点(三,J),即必过点(0,2.8),而给出的三 个线性回归方程中,只有表示的直线过点(0,2.8),故正确的选项是.答案:A解题高手II妙解题什么是智慧.智慈就是简单、高效、不走弯路一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 10次试验, 测得数据如下:零件数 M个)102030405060708090100加工时间626875818995102108115122y(分)(l)J与X是否具有线性相关关系?假如y与X具有线性相关关系,求回归直线方程.巧思(1)利用相关系数r推断;利用最小二乘法求得G,。的值,进而求得回归方程.妙解(1)列出下表,并用科学计算器进行计算. 112345678910Xi102030405060708090100626875818995102108115122xiyi62013602 2503 2404 4505 70071408 640103501220010-T 川工=55 6= 91 . 7101038 500,2=87 777,.*yi = 55 950. i=ii=i10S xiyi_ 10 jc. y于是rxy=10/ 10才冠一1 OS J t « 10 5?55 950-10 X 55 Xyl38 500-10X552/87 777-10X20.999 8.所以y与具有线性相关关系.设所求的回归直线方程为y=bx+a9那么由上表可得分=曾仁0.668,a= y -b x X 5554.96,即所求的回归直线方程为jx+54.96.随堂练习常态化,当堂强化所学1.在对两个变量”,y进行线性回归分析时,有以下步骤:对所求出的回归直线方程作出解释;收集数据(如M), i=l,2,,n求线性回归方程;求相关系数;依据所搜集的数据绘制散点图.假如依据可行性要求能够作出变量X, y具有线性相关的结论,那么在以下操作挨次中正确的选项是()A.B.C.D.解析:对两个变量进行回归分析时,首先收集数据(即,M), i=l,2,,w;依据所搜 集的数据绘制散点图.观看散点图的外形,推断线性相关关系的强弱,求相关系数,写出 线性回归方程,最终依据所求出的回归直线方程作出解释;故正确挨次是,应 选D.答案:D2 .变量”和y满意关系卢+1,变量y与z正相关.以下结论中正确的选项是()A. %与y正相关,与z负相关B. “与y正相关,X与z正相关C. x与y负相关,与z负相关D. “与y负相关,与z正相关解析:由于卢+1的斜率小于0,故X与y负相关.由于y与z正相关,故X与z负相关.答案:C3 .相关变量”,y的样本数据如下表:X12345y22356经回归分析可得y与x线性相关,并由最小二乘法求得回归直线方程为卢+,那么q =()解析:,回归直线经过样本中心点(三,7),且由题意得(工,7) = (3,3.6),,X3+,=0.3.答案:C4 .在关于两个变量的回归分析中,作散点图的目的是.答案:观看两个变量之间是否存在线性相关关系5 .某服装厂的产品产量x(万件)与单位本钱兴元/件)之间的回归直线方程是卢,当产量 每增加一万件时,单位本钱下降 元.解析:由回归系数的意义得下降19.5元.答案:6 .在一段时间内,分5次测得某种商品的价格”(万元)和需求量y(t)之间的一组数据为:12345价格X2需求量y121075355 222田=62,= 16.6.i=i/=画出散点图;求出y对*的回归方程;如价格定为19万元,猜测需求量大约是多少?(精确到001t).解:(1)散点图如以下图所示:y/t1612.84- JO123 x/7J7G, 1 1(2)由于 x =tX9=1.8, y =tX37=7.4, 00Z孙=62,=16.6,i=i _ _LT -J = 12.4-13.32=-0.92. °所以方=常=,0.08) = 11.5,a= y b x X 1.8=28.1, 故y对x的回归方程为yx. (3)jX1.9=6.25(t).课下训练经典化,贵在触类旁通一、选择题A 点(2,2)C.点(1,2)1 .下表是“与y之间的一组数据,那么y关于X的线性回归方程必过()解析:0+1+2+3 64=41+3+5+7y =4=4X0123y1357B.点(1.5,2)D.点(1.5,4),线性回归方程必过点(15,4).答案:D2 .变量”与y正相关,且由观测数据算得样本平均数嚏=3, 7 =3.5,那么由该观测数据算得的线性回归方程可能为()A. jx+2.3B. y=2xC. j=2x+9.5D. yx解析:依题意知,相应的回归直线的斜率应为正,排解C、D.且直线必过点(3,3.5)代入 A、B得A正确.答案:A3.某咖啡厅为了了解热饮的销售量y(个)与气温x(C)之间的关系,随机统计了某4天 的销售量与气温,并制作了对比表:气温()1813101销售量(个)24343864由表中数据,得线性回归方程y=-2x+a,当气温为一4C时,猜测销售量约为()A. 68B.66C. 72D.7011解析:V x =(18+13+10-1) = 10, y =丁24+34+38+64)=40,40=2义10+,。=60,当工=-4 时,y=-2X(4)+60=68.答案:A4 .为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)支出y(万元)依据上表可得回归直线方程其中5=0.76, a= y b x.据此估量,该社区一户年收入为15万元家庭的年支出为()解析:由题意知,x =,5) = 10,y=,5)=8,/.aX 10=0.4,,当 x=15 时,yX15+0.4=ll.8(万元).答案:B二、填空题5 .调查了某地假设干户家庭的年收入x(单位:万元)和年饮食支出我单位:万元),调 查显示年收入x与年饮食支出j具有线性相关关系,并由调查数据得到y对x的回归直线方 程:/+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加 万元.解析:以工+1代X,得y=0.254(x+1)+0.321,与卢+0.321相减可得,年饮食支出平 均增加0.254万元.答案:6 .下表是某厂14月份用水量(单位:百吨)的一组数据,月份X1234用水量y43由某散点图可知,用水量y与月份工之间有较好的线性相关关系,其线性回归方程是 jx+a,那么a=解析:T =2.5, y =3.5,。=一0.7, A a X 2.5=5.25.答案:7 .回归直线的斜率的估量值为1.23.样本点的中心为(4,5),那么回归直线方程是解析:由斜率的估量值为123,且回归直线肯定经过样本点的中心(4,5), 可得 y-5=1.23(“-4), Fp jx+0.08.答案:yx8 .在讨论硝酸钠的可溶性程度时,观看它在不同温度的水中的溶解度,得观测结果