回归分析的基本思想及其初步应用ppt课件(复习).ppt
《回归分析的基本思想及其初步应用ppt课件(复习).ppt》由会员分享,可在线阅读,更多相关《回归分析的基本思想及其初步应用ppt课件(复习).ppt(71页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、3.13.1回归分析的基本思想及其初步应用回归分析的基本思想及其初步应用( (习题课)习题课)一、线性回归模型一、线性回归模型1.1.回归方程的相关计算回归方程的相关计算对于两个具有线性相关关系的变量的一组数据对于两个具有线性相关关系的变量的一组数据(x(x1 1,y,y1 1) ),(x(x2 2,y,y2 2) ),(x(xn n,y,yn n).).设其回归直线方程为设其回归直线方程为y=bx+ay=bx+a,其中,其中a a,b b是待定参数,由最小二乘法得是待定参数,由最小二乘法得 分别是分别是a,ba,b的估计值的估计值. .2.2.线性回归模型线性回归模型(1)(1)线性回归模型
2、线性回归模型其中其中a a,b b为未知参数,通常为未知参数,通常e e为随机变量,称为为随机变量,称为_._.(2)x(2)x称为称为_变量,变量,y y称为称为_变量变量. .niii 1n2ii 1(xx)(y - y)b_,a_.(xx)niii 1n22ii 1x ynx yxnxx_,y_,其中12nxxxn12nyyyn ybxaeE e_,D e_,02随机误差随机误差解释解释预报预报a,bybx思考:思考: 相同吗?试说明缘由相同吗?试说明缘由. .提示:提示:不相同不相同.y.yi i是样本点是样本点(x(xi i,y,yi i) )的纵坐标;的纵坐标; 是样是样本点的中心
3、本点的中心 的纵坐标;的纵坐标; 是是y yi i的估计值的估计值. .iiy y y, ,(x, y)yiy二、线性回归分析二、线性回归分析1.1.残差残差对于样本点对于样本点(x(xi i,y,yi i)(i=1,2,n)(i=1,2,n)的随机误差的的随机误差的估计值估计值 称为相应于点称为相应于点(x(xi i,y,yi i) )的残差,的残差,_称为残差平方和称为残差平方和. .iiieyyn2iii 1yy2.2.残差图残差图利用图形来分析残差特性,作图时纵坐标为利用图形来分析残差特性,作图时纵坐标为_,横坐,横坐标可以选为标可以选为_,也可用其他测量值,这样作出,也可用其他测量值
4、,这样作出的图形称为残差图的图形称为残差图. .3.3. R R2 2越接近于越接近于_,表示回归效果越好,表示回归效果越好. .残差残差样本编号样本编号n2ii2i 1n2ii 1yyR1,yy1 1判断判断:(:(正确的打正确的打“”, ,错误的打错误的打“”) )(1)(1)残差平方和越小残差平方和越小, ,线性回归方程的拟合效果越线性回归方程的拟合效果越好好. .( () )(2)R(2)R2 2就是相关系数就是相关系数. .( () )(3)R(3)R2 2越接近于越接近于1,1,线性回归方程的拟合效果越好线性回归方程的拟合效果越好. .( () )提示提示: :(1)(1)正确正确
5、. .残差平方和越小残差平方和越小, ,说明样本数据与线性回说明样本数据与线性回归方程的偏离程度越小归方程的偏离程度越小, ,即该方程的拟合效果越好即该方程的拟合效果越好. .(2)(2)错误错误. .两者是截然不同的概念两者是截然不同的概念, ,前者刻画了线性回归前者刻画了线性回归方程的拟合效果方程的拟合效果, ,后者描述了变量相关性的程度后者描述了变量相关性的程度. .(3)(3)正确正确. .由由R R2 2的计算公式可知这句话正确的计算公式可知这句话正确. .答案答案: :(1)(1)(2)(2)(3)(3)【知识点拨知识点拨】1.1.对线性回归模型的两点说明对线性回归模型的两点说明(
6、1)(1)线性回归模型较好地解释了利用线性回归方程求出线性回归模型较好地解释了利用线性回归方程求出的函数值不一定是真实值的缘由的函数值不一定是真实值的缘由. .例如例如, ,人的体重与身人的体重与身高存在一定的线性关系高存在一定的线性关系, ,但体重除了受身高的影响外但体重除了受身高的影响外, ,还受其他因素的影响还受其他因素的影响, ,如饮食如饮食, ,是否喜欢运动等是否喜欢运动等. .(2)(2)线性回归模型中随机误差的主要来源线性回归模型中随机误差的主要来源线性回归模型与真实情况引起的误差线性回归模型与真实情况引起的误差; ;省略了一些因素的影响产生的误差省略了一些因素的影响产生的误差;
7、 ;观测与计算产生的误差观测与计算产生的误差. .2.2.线性回归分析线性回归分析(1)(1)残差分析是回归分析的一种方法残差分析是回归分析的一种方法. .利用残差图利用残差图, ,可可以较直观形象地观测到样本数据同线性回归方程间的以较直观形象地观测到样本数据同线性回归方程间的关系关系. .(2)(2)对对R R2 2的理解的理解. .可以用可以用R R2 2来刻画回归的效果来刻画回归的效果. .在线性回归模型中在线性回归模型中,R,R2 2表示解释变量对预报变量表示解释变量对预报变量变化的贡献率变化的贡献率.R.R2 2越接近于越接近于1,1,表示解释变量和预报表示解释变量和预报变量的线性相
8、关性越强变量的线性相关性越强, ,回归的效果越好回归的效果越好. .如果某组数据可能采取几种不同回归方程进行回归如果某组数据可能采取几种不同回归方程进行回归分析分析, ,则可以通过比较则可以通过比较R R2 2的值来进行选择的值来进行选择, ,即选取即选取R R2 2较较大的模型作为这组数据的模型大的模型作为这组数据的模型. .3.3.相关系数与相关系数与R R2 2(1)R(1)R2 2是相关系数的平方是相关系数的平方, ,其变化范围为其变化范围为0,1,0,1,而相关而相关系数的变化范围为系数的变化范围为-1,1.-1,1.(2)(2)相关系数可较好地反映变量的相关性及正相关或相关系数可较
9、好地反映变量的相关性及正相关或负相关负相关, ,而而R R2 2反映了回归模型拟合数据的效果反映了回归模型拟合数据的效果. .(3)(3)当相关系数当相关系数|r|r|接近于接近于1 1时说明两变量的相关性较时说明两变量的相关性较强强, ,当当|r|r|接近于接近于0 0时说明两变量的相关性较弱时说明两变量的相关性较弱, ,而当而当R R2 2接近于接近于1 1时时, ,说明线性回归方程的拟合效果较好说明线性回归方程的拟合效果较好. .1.(20131.(2013南安高二检测南安高二检测) )下表是下表是x x和和y y之间的一组数之间的一组数据,据,则则y y关于关于x x的线性回归方程必过
10、点的线性回归方程必过点( )( )A A(2,2) B(2,2) B(1.5,0)(1.5,0)C C(1,2) D(1,2) D(1.5,4)(1.5,4)x x0 01 12 23 3y y1 13 35 57 7类型一 求线性回归方程2.(20132.(2013临沂高二检测临沂高二检测) )下表提供了某厂节能下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量降耗技术改造后生产甲产品过程中记录的产量x(x(吨吨) )与相应的生产能耗与相应的生产能耗y(y(吨标准煤吨标准煤) )的几组对的几组对照数据照数据x x3 34 45 56 6y y2.52.53 34 44.54.5(1)
11、(1)请画出上表数据的散点图请画出上表数据的散点图. .(2)(2)请根据上表提供的数据,用最小二乘法求出请根据上表提供的数据,用最小二乘法求出y y关于关于x x的线性回归方程的线性回归方程 (3)(3)已知该厂技改前已知该厂技改前100100吨甲产品的生产能耗为吨甲产品的生产能耗为9090吨标吨标准煤试根据准煤试根据(2)(2)求出的线性回归方程,预测生产求出的线性回归方程,预测生产100100吨甲产品的生产能耗比技改前降低多少吨标准煤吨甲产品的生产能耗比技改前降低多少吨标准煤? ?( (参考数值:参考数值:3 32.5+42.5+43+53+54+64+64.5=66.5)4.5=66.
12、5)ybxa.【解题探究解题探究】1.1.线性回归方程必过哪个点?线性回归方程必过哪个点?2.2.计算线性回归方程计算线性回归方程 中中 值的依据是什么?值的依据是什么?探究提示:探究提示:1.1.线性回归方程必过样本点的中心线性回归方程必过样本点的中心 2.2.利用由最小二乘法得到的公式,即利用由最小二乘法得到的公式,即其中其中, , 分别是分别是a a,b b的估计值的估计值. .ybxaa,b(x,y).nniiiii 1i 1nn222iii 1i 1xxyyx ynx yb,aybx.xxxnxa,ba,b【解析解析】1.1.选选D.D.由题意可知,由题意可知,又因为线性回归方程必过
13、样本点的中心又因为线性回归方程必过样本点的中心 故故y y关于关于x x的线性回归方程必过点的线性回归方程必过点(1.5,4).(1.5,4).0 1 2 31 3 5 7x1.5,y4.44 (x,y),2.(1)2.(1)由题设所给数据,可得散点图如图由题设所给数据,可得散点图如图. .(2)(2)由数据,计算得:由数据,计算得:又已知又已知 所以,所以,由最小二乘法确定的回归方程的系数为:由最小二乘法确定的回归方程的系数为:42ii 13 4 5 62.5 3 4 4.5x86,x4.5,y3.5,44 4i ii 1xy 66.5.因此,所求的线性回归方程为因此,所求的线性回归方程为y
14、0.7x0.35.aybx3.5 0.7 4.50.35,4iii 14222ii 1xy4x y66.5 4 4.5 3.5b0.7,86 4 4.5x4x(3)(3)由由(2)(2)的回归方程及技改前生产的回归方程及技改前生产100100吨甲产品的吨甲产品的生产能耗,得降低的生产能耗为生产能耗,得降低的生产能耗为90(0.790(0.7100+0.35)100+0.35)=19.65(=19.65(吨标准煤吨标准煤).).【拓展提升拓展提升】求线性回归方程的三个步骤求线性回归方程的三个步骤(1)(1)画散点图:由样本点是否呈条状分布来判断两个量是否具画散点图:由样本点是否呈条状分布来判断两
15、个量是否具有线性相关关系有线性相关关系. .(2)(2)求回归系数:若存在线性相关关系,则求回归系数求回归系数:若存在线性相关关系,则求回归系数. .(3)(3)写方程:写出回归直线方程,并利用回归直线方程进行预写方程:写出回归直线方程,并利用回归直线方程进行预测说明测说明. .【变式训练变式训练】假设关于某设备的使用年限假设关于某设备的使用年限x x和所支和所支出的维修费用出的维修费用y(y(万元万元) )有如下的统计数据:有如下的统计数据:由此资料可知由此资料可知y y与与x x线性相关线性相关. .(1)(1)求回归直线方程求回归直线方程. .(2)(2)求使用年限为求使用年限为1010
16、时,该设备的维修费用为多少时,该设备的维修费用为多少. .x x2 23 34 45 56 6y y2.22.23.83.85.55.56.56.57.07.0【解析解析】(1)(1)由上表中的数据可得由上表中的数据可得所以所以所以所以552iiii 1i 1x4,y5,x90,x y112.3,5iii 15222ii 1x y5x y112.3 5 4 5b1.23,90 5 4x5x a y bx 5 1.23 4 0.08. (2)(2)当当x=10 x=10时,时,即使用年限为即使用年限为1010时,该设备的维修费用为时,该设备的维修费用为12.3812.38万元万元. .1.23
17、100.08 12.38.y万元所以回归直线方程为所以回归直线方程为1.23x0.08.y类型二类型二 线性回归分析线性回归分析1 1甲、乙、丙、丁甲、乙、丙、丁4 4位同学各自对位同学各自对A A,B B两变量进行回归分两变量进行回归分析,分别得到散点图与残差平方和析,分别得到散点图与残差平方和 如表所示:如表所示:甲甲乙乙丙丙丁丁散散点点图图残差残差平方和平方和115115106106124124103103n2iii 1yy 哪位同学的试验结果体现拟合哪位同学的试验结果体现拟合A A,B B两变量关系两变量关系的模型拟合精度高的模型拟合精度高( )( )A.A.甲甲 B.B.乙乙 C.C
18、.丙丙 D.D.丁丁2.2.某运动员训练次数与成绩之间的数据关系如下:某运动员训练次数与成绩之间的数据关系如下:(1)(1)作出散点图作出散点图. (2). (2)求出回归方程求出回归方程. .(3)(3)作出残差图,并说明选用的模型的拟合效果作出残差图,并说明选用的模型的拟合效果. .(4)(4)计算计算R R2 2,并说明选用的模型的拟合效果,并说明选用的模型的拟合效果. .次数次数x x30303333353537373939444446465050成绩成绩y y30303434373739394242464648485151【解题探究解题探究】1.1.利用残差平方和判断回归方程的拟合效
19、果的理论依利用残差平方和判断回归方程的拟合效果的理论依据是什么?据是什么?2.2.计算计算R R2 2的公式是什么?的公式是什么?探究提示:探究提示:1.1.依据是残差平方和越小,说明回归模型的拟合效依据是残差平方和越小,说明回归模型的拟合效果越好;反之,拟合效果越差果越好;反之,拟合效果越差. .2.2.n2ii2i1n2ii1yyR1.yy【解析解析】1.1.选选D.D.根据线性相关的知识,散点图中各根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小样本点条状分布越均匀,同时保持残差平方和越小( (对于已经获取的样本数据,对于已经获取的样本数据,R R2 2的表达式
20、中的表达式中 为确定的数,则残差平方和越小,为确定的数,则残差平方和越小,R R2 2越大越大) ),由回归,由回归分析建立的线性回归模型的拟合效果越好,由试验分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些故选结果知丁要好些故选D.D.n2ii 1yy2.(1)2.(1)作出该运动员训练次数作出该运动员训练次数(x)(x)与成绩与成绩(y)(y)之间之间的散点图,如图所示,由散点图可知,它们之的散点图,如图所示,由散点图可知,它们之间具有线性相关关系间具有线性相关关系(2) (2) 所以所以所以回归方程为所以回归方程为882ii ii 1i 1x 39.25,y 40.875,x1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 基本 思想 及其 初步 应用 ppt 课件 复习
限制150内