第6章回归分析.ppt
《第6章回归分析.ppt》由会员分享,可在线阅读,更多相关《第6章回归分析.ppt(106页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编 第六章第六章 回归分析回归分析第一节第一节 引言引言第二节第二节 一元线性回归模型一元线性回归模型第三节第三节 多元线性回归模型多元线性回归模型第四节第四节 虚拟变量回归模型虚拟变量回归模型第五节第五节 非线性回归模型非线性回归模型本章小节本章小节主要内容主要内容上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编回归是研究自变量与因变量之间的关系形式的分析方法。回归是研究自变量与因变量之间的关系形式的分析方法。一、回归分析的提出一、回归分析
2、的提出 回归分析起源于生物学研究,是由英国生物学家兼回归分析起源于生物学研究,是由英国生物学家兼统计学统计学家高尔登家高尔登(Francis Galton 1822-1911)在)在19世纪末叶研世纪末叶研究遗传学特性时首先提出来的。究遗传学特性时首先提出来的。 高尔登在高尔登在1889年发表的著作年发表的著作自然的遗传自然的遗传中,提出了回中,提出了回归分析方法以后,很快就应用到经济领域中来,而且这一名归分析方法以后,很快就应用到经济领域中来,而且这一名词也一直为生物学和统计学所沿用。词也一直为生物学和统计学所沿用。 回归的现代涵义与过去大不相同。一般说来,回归是研回归的现代涵义与过去大不相
3、同。一般说来,回归是研究因变量随自变量变化的关系形式的分析方法。其目的在于究因变量随自变量变化的关系形式的分析方法。其目的在于根据已知自变量来估计和预测因变量的总平均值。根据已知自变量来估计和预测因变量的总平均值。 第一节第一节 引言引言 上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编根据因变量与自变量之间的关系不同,可以分为两种类型:根据因变量与自变量之间的关系不同,可以分为两种类型:函数关系函数关系 相关关系相关关系 第一节第一节 引言引言 因变量因变量(Y)与自变量与自变量(X)之间的关系之间的关系上一页上一页下一下一页页返回本章首
4、页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编二、回归分析和相关分析二、回归分析和相关分析函数关系函数关系函数关系反映客观事物之间存在着严格函数关系反映客观事物之间存在着严格的依存关系。在这种关系中,的依存关系。在这种关系中,当一个或几个当一个或几个变量取值一定时,另一个变量有确定的值与变量取值一定时,另一个变量有确定的值与之相对应,之相对应,并且这种关系可以用一个确定的并且这种关系可以用一个确定的数学表达式反映出来。数学表达式反映出来。 一般把作为影响因素的变量称为自变量,一般把作为影响因素的变量称为自变量,把发生对应变化的变量称为因变量。把发生对应变化的变量称为因变量
5、。 第一节第一节 引言引言 上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编相关关系相关关系相关关系反映的相关关系反映的是客观事物之间的非严格、不确定的线性是客观事物之间的非严格、不确定的线性依存关系。依存关系。这种线性依存关系有两个显著的特点:这种线性依存关系有两个显著的特点: 二、回归分析和相关分析二、回归分析和相关分析客观事物之间在数量上确实存在一定的内在联系。客观事物之间在数量上确实存在一定的内在联系。表现在一个变量发生数量上的变化,要影响另一个变表现在一个变量发生数量上的变化,要影响另一个变量也相应地发生数量上的变化。量也相应地发
6、生数量上的变化。客观事物之间的数量依存关系不是确定的,具有一定的随客观事物之间的数量依存关系不是确定的,具有一定的随机性。表现在当一个或几个相互联系的变量取一定数值时,与机性。表现在当一个或几个相互联系的变量取一定数值时,与之对应的另一个变量可以取若干个不同的数值。这种关系虽然之对应的另一个变量可以取若干个不同的数值。这种关系虽然不确定,但因变量总是遵循一定规律围绕这些数值的平均数上不确定,但因变量总是遵循一定规律围绕这些数值的平均数上下波动。下波动。上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编图图 国内生产总值国内生产总值y与固定资产
7、投资完成额与固定资产投资完成额x间关系的散点图间关系的散点图上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编二、回归分析和相关分析二、回归分析和相关分析回归分析回归分析 回归分析是研究某一随机变量(因变量)与另外回归分析是研究某一随机变量(因变量)与另外一个或几个普通变量(自变量)之间的数量变动的一个或几个普通变量(自变量)之间的数量变动的关系。由回归分析求出的关系式,称为关系。由回归分析求出的关系式,称为回归模型回归模型。 相关分析相关分析 相关分析是研究两个或两个以上随机变量之间线相关分析是研究两个或两个以上随机变量之间线性依存关系的紧
8、密程度。通常用相关系数表示,多元性依存关系的紧密程度。通常用相关系数表示,多元相关时用复相关系数表示。相关时用复相关系数表示。回归分析与相关分析的关系回归分析与相关分析的关系上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编区别区别 相关分析研究的变量都是随机变量,并且不分相关分析研究的变量都是随机变量,并且不分自变量与因变量;自变量与因变量;回归分析研究的变量要首先明确回归分析研究的变量要首先明确那些是自变量,那些是因变量?并且自变量是确定那些是自变量,那些是因变量?并且自变量是确定的普通变量,因变量是随机变量。的普通变量,因变量是随机变量
9、。 二、回归分析和相关分析二、回归分析和相关分析联系联系 由相关系数的大小决定是否需要进行回归分析。由相关系数的大小决定是否需要进行回归分析。在相关分析的基础上建立回归模型,以便进行推算、在相关分析的基础上建立回归模型,以便进行推算、预测,同时相关系数还是检验回归分析效果的标准。预测,同时相关系数还是检验回归分析效果的标准。上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编根据自变量的多少根据自变量的多少 回归模型可以分为一元回归模型和多元回归模型。回归模型可以分为一元回归模型和多元回归模型。 根据回归模型的形式线性与否根据回归模型的形式线性
10、与否 回归模型可以分为线性回归模型和非线性回归模型。回归模型可以分为线性回归模型和非线性回归模型。 根据回归模型是否带有虚拟变量根据回归模型是否带有虚拟变量 回归模型可以分为普通回归模型和带虚拟变量的回回归模型可以分为普通回归模型和带虚拟变量的回归模型。归模型。 此外,根据回归模型是否用滞后的因变量作自变量,此外,根据回归模型是否用滞后的因变量作自变量,回归模型又可分为回归模型又可分为无自回归现象的回归模型和自回归无自回归现象的回归模型和自回归模型。模型。三、回归模型的种类三、回归模型的种类上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编第
11、二节第二节 一元线性回归模型一元线性回归模型 设设x为自变量,为自变量, y为因变量,为因变量,y与与x之间存在某之间存在某种线性关系,即一元线性回归模型为种线性关系,即一元线性回归模型为 (6.2.1) xyba给定给定x,y的的n对观测值对观测值xi,yi,ni, 2 , 1,代入式(,代入式(6.2.1)得)得 iiibxay (6.2.1)当当b0时,时,x与与y为正相关,当为正相关,当b0时,时,x与与y为负相关。为负相关。 、一元线性回归模型、一元线性回归模型上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编二、 OLS (Ord
12、inary Least Square)估计估计 OLS的中心思想的中心思想 最小二乘法的中心思想,是通过数学模型,配合一条较为最小二乘法的中心思想,是通过数学模型,配合一条较为理想的趋势线。这条趋势线必须满足下列两点要求:理想的趋势线。这条趋势线必须满足下列两点要求: 第二节第二节 一元线性回归模型一元线性回归模型上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编二、 OLS (Ordinary Least Square)估计上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编二、OLS (O
13、rdinary Least Square)估计上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编OLS的特性的特性 最小二乘估计量最小二乘估计量 具有线性、无偏性和具有线性、无偏性和最小方差性等良好的性质。最小方差性等良好的性质。线性、无偏性和线性、无偏性和最小方差性统称最小方差性统称BLUE性质。性质。满足满足BLUE性质性质的估计量的估计量 称为称为BLUE估计量。估计量。 ba, ba, 二、OLS (Ordinary Least Square)估计上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主
14、编刘思峰等主编 回归方程的检验回归方程的检验 在一元线性回归模型中最常用的显著在一元线性回归模型中最常用的显著性检验方法有:性检验方法有:相关系数检验法相关系数检验法F检验法检验法t检验法检验法 3.2 一元线性回归预测法一元线性回归预测法 上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编三、离差平方和的分解与可决系数三、离差平方和的分解与可决系数 在一元线性回归模型中,观测值的数值会发生波在一元线性回归模型中,观测值的数值会发生波动,这种波动称为变差。变差产生的原因如下:动,这种波动称为变差。变差产生的原因如下: 3.2 一元线性回归预测
15、法一元线性回归预测法 受自变量变动的影响受自变量变动的影响,即即x x取值不同时的影响;取值不同时的影响;受其他因素(包括观测和实验中产生的误差)的受其他因素(包括观测和实验中产生的误差)的影响影响。为了分析这两方面的影响,需要对总变差进。为了分析这两方面的影响,需要对总变差进行分解。行分解。上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编三、相关系数三、相关系数 离差平方和的分解离差平方和的分解 回归离差平方和回归离差平方和剩余离差平方和剩余离差平方和上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主
16、编刘思峰等主编 总平方和分解总平方和分解总平总平和分解图和分解图 上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编三、相关系数三、相关系数可决系数可决系数 总变差回归变差R2上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编三、相关系数三、相关系数 相关系数的取值范围为相关系数的取值范围为 当当R=0时,说明回归变差为时,说明回归变差为0,自变量,自变量x的变动的变动对总变差毫无影响,这种情况称对总变差毫无影响,这种情况称y与与x不相关不相关。 当当|R|=1时,时,说明回归变差等于总变差
17、,总变差的变化完全说明回归变差等于总变差,总变差的变化完全由自变量由自变量x的变化所引起,这种情况成为完全相关。这时因变的变化所引起,这种情况成为完全相关。这时因变量量y是自变量是自变量x的线性函数的线性函数,二者之间呈函数关系。二者之间呈函数关系。 当0|R|1时,说明自变量时,说明自变量x的变动对总变差的变动对总变差有部分影响,这种情况成为普通相关。有部分影响,这种情况成为普通相关。 Y Y的变差完全由的变差完全由随机因素引起随机因素引起样本的全部观样本的全部观察值都落在所察值都落在所拟和的回归直拟和的回归直线上线上上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归
18、分析刘思峰等主编刘思峰等主编四、显著性检验四、显著性检验相关系数检验法相关系数检验法 第一步,计算相关系数第一步,计算相关系数R; 第二步,根据回归模型的自由度(第二步,根据回归模型的自由度(n-2)和给定的显)和给定的显著性水平值著性水平值,从相关系数临界值表中查出临界值;,从相关系数临界值表中查出临界值;第三步,判别。若第三步,判别。若|R|R(n-2),表明两变量之间,表明两变量之间线性相关关系显著,检验通过,这时回归模型可以用来线性相关关系显著,检验通过,这时回归模型可以用来预测;若预测;若|R|30,式式(6.2.31)可简化为)可简化为y 0stn02)2( 上一页上一页下一下一页
19、页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编六、应用举例六、应用举例 例例6.2.1 某省某省19781989年国内生产总值和固定资产投年国内生产总值和固定资产投资完成额资料如表资完成额资料如表6.2.1所示。所示。上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编六、应用举例六、应用举例 试配合适当的回归模型并进试配合适当的回归模型并进行显著性检验;若行显著性检验;若19991999年该省年该省固定资产投资完成额为固定资产投资完成额为249249亿亿元,当显著性水平元,当显著性水平0.050.05时,时,
20、试估计试估计19901990年国内生产总值的年国内生产总值的预测区间。预测区间。 解:解:. .绘制散点图绘制散点图 上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编六、应用举例六、应用举例2设一元线性回归模型为设一元线性回归模型为3计算回归系数计算回归系数上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编六、应用举例六、应用举例4检验线性关系的显著性检验线性关系的显著性 上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编六、应用举例六、
21、应用举例上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编六、应用举例六、应用举例22nxybyaysy5预测预测(2)当显著性水平,自由度)当显著性水平,自由度nm12210时,查时,查t分布表得分布表得228. 2)10(025. 0t(1)计算估计值的标准误差)计算估计值的标准误差上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编六、应用举例六、应用举例上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编七、几个应当注意的问题七、几个应
22、当注意的问题 1重视数据的收集和甄别重视数据的收集和甄别在收集数据的过程中可能会遇到以下困难:在收集数据的过程中可能会遇到以下困难:(1)一些变量无法直接观测。)一些变量无法直接观测。(2)数据缺失或出现异常数据。)数据缺失或出现异常数据。(3)数据量不够。)数据量不够。(4)数据不准确、不一致、有矛盾。)数据不准确、不一致、有矛盾。2. 合理确定数据的单位合理确定数据的单位 在建立回归方程时,如果不同变量的单位选取不适当,导致模型中在建立回归方程时,如果不同变量的单位选取不适当,导致模型中各变量的数量级差异悬殊,往往会给建模和模型解释带来诸多不便。比各变量的数量级差异悬殊,往往会给建模和模型
23、解释带来诸多不便。比如模型中如模型中有的变量用小数位表示有的变量用小数位表示,有的变量用百位或千位数表示有的变量用百位或千位数表示,可能可能会因舍入误差使模型计算的准确性受到影响。会因舍入误差使模型计算的准确性受到影响。因此,适当选取变量的单因此,适当选取变量的单位,使模型中各变量的数量级大体一致是一种明智的做法。位,使模型中各变量的数量级大体一致是一种明智的做法。上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编 一元线性回归模型研究的是某一因变量与一元线性回归模型研究的是某一因变量与一个自变量之间的关系问题。但是,客观现象一个自变量之间的
24、关系问题。但是,客观现象之间的联系是复杂的,许多现象的变动都涉及之间的联系是复杂的,许多现象的变动都涉及到多个变量之间的数量关系。到多个变量之间的数量关系。 研究某研究某一因变量与多个自变量之间的相互关一因变量与多个自变量之间的相互关系的理论和方法就是多元线性回归模型。系的理论和方法就是多元线性回归模型。 第三节第三节 多元线性回归预测法多元线性回归预测法上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编第三节第三节 多元线性回归预测法多元线性回归预测法上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编
25、刘思峰等主编一、一、 多元线性回归模型及其假设条件多元线性回归模型及其假设条件多元线性回归模型多元线性回归模型上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编一、一、 多元线性回归模型及其假设条件多元线性回归模型及其假设条件上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编一、一、 多元线性回归模型及其假设条件多元线性回归模型及其假设条件上一页上一页下一下一页页返回本章首页返回本章首页第六章第六章 回归分析回归分析刘思峰等主编刘思峰等主编用矩阵形式表示为nnuuuuuuEuuE2121)(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 章回 分析
限制150内