复旦大学-经济学院-谢识予-计量经济学-第五章-线性回归的定式偏差ppt课件.ppt
《复旦大学-经济学院-谢识予-计量经济学-第五章-线性回归的定式偏差ppt课件.ppt》由会员分享,可在线阅读,更多相关《复旦大学-经济学院-谢识予-计量经济学-第五章-线性回归的定式偏差ppt课件.ppt(71页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1第五章第五章 线性回归的定式偏差线性回归的定式偏差 2n前面介绍的线性回归分析建立在模型假设成立的基础上,但这些假设并不必然成立。 n本章讨论变量关系非线性、存在异常值、规律性扰动和解释变量缺落等,导致线性回归模型前两条假设不成立的定式偏差,包括它们对线性回归分析的影响,判断和处理的方法等。 3本章结构本章结构第一节 变量关系非线性 第二节 异常值第三节 规律性扰动 第四节 解释变量缺落 第五节 参数变化4第一节第一节 变量关系非线性变量关系非线性一、问题二、发现与判断三、问题处理和非线性回归 5一、问题n线性回归模型都假设变量关系是线性随机函数关系,或者经过特定数学变换以后是线性随机函数关
2、系。 n但实际变量关系可能会存在偏差,存在用线性模型分析非线性关系的可能性。 n把非线性变量关系当作线性关系处理,也可以说是违反误差项均值为0的假设,对线性回归分析的有效性有根本性的破坏作用。 6n例如若两个变量之间的真实关系为: n其中 满足 =0和线性回归模型的其他假设,但如果我们直接用: 进行回归分析,那么因为:n因此:n 显然不可能始终为0。210XY)(EXY10XX12100 XXE12100)(E7n把非线性变量关系作为线性关系进行分析是变量关系的误识别。n不仅会使得回归分析的拟合程度降低,还会对经济规律作出错误判断,以及导致较大的预测偏差,属于计量经济分析比较严重的问题。 8二
3、、发现与判断n由于有随机扰动因素的影响,线性回归模型的错误设定并不是很容易发现的。 n发现和判断变量关系非线性,首先是用数理经济分析的方法,对模型的函数关系进行更深入的分析。 n其次是根据数据和及其分布图形、散点图进行直接判断。9n更重要的方法是根据回归残差序列,从技术角度发现和判断异常值问题。 n回归残差序列根据被解释变量的实际值和回归理论值之差计算。 n在EViews软件进行回归分析时,可以在得到回归结果后在回归结果窗口点击View/Actual,Fitted,Residual/ Actual,fitted,residual table,直接得到回归残差序列和残差序列图。n如果模型存在变量
4、关系非线性问题,回归残差序列会表现出有规律的变化。 10n例如当发现模型的回归残差序列有图5.1所示的规律性变化,就应该考虑存在把非线性关系(二次函数等)当作线性关系进行回归的问题,必须进行处理。 图图5.1 非线性变量关系的残差序列非线性变量关系的残差序列 ei11n用回归残差序列判断变量关系非线性的最大问题是,线性回归模型的其他某些一些问题,如参数(结构)改变等,与变量关系非线性的表现形式常常很相似,不容易正确区分。 n因此必须结合问题背景分析、相关理论和经验进行综合判断,然后再通过处理和结果的反复比较加以确定。 12三、问题处理和非线性回归 n解决错误的第一步,是恢复变量之间的真实函数关
5、系。n然后再设法通过幂函数、对数化等数学变换等,把非线性关系转化为正确的线性回归模型。 n如果变量关系可以用初等数学变化转化为线性模型,那么只要在转化后再进行线性回归分析就可以了。 13n但也有不少非线性变量关系无法通过初等数学变换转化为线性模型。例如Y和X之间有两变量关系如下:n其中 、 、 是未知参数,这个函数就无法通过初等数学变换转化为线性模型。n这时候就需要直接处理非线性回归模型。非线性回归分析是线性回归分析的自然扩展。 XeY14n我们假设非线性函数关系为:n其中 是K个解释变量, 是模型的P个参数, 为多元非线性函数,且对 是连续可微的。n对于这种非线性回归模型,解决的方法之一是利
6、用级数展开方法作非线性函数的近似线性函数,把模型强制性化为线性模型。 PKXXfY,;,11KXX,1P,1fP,115n泰勒级数展开先要取一组参数的初始值:n然后将上述非线性函数在该点处对 作泰勒级数展开,并只取其中的线性项而忽略所有高次项,得到: 010,PbbP,11001001100110,10,;PPKPbbPPbbPfYfXXbbbfb16n其中 为原变量关系中的误差项 与泰勒级数展开的高阶项之和。 n整理上述展开式,移项合并可化为:10010011000,11,;PPKPPPiibbbbiiiiYfXXbbffb17n若令:n我们得到:n这是一个 对 的线性回归模型,可以用最小二
7、乘法估计其中参数 的估计值,我们记为 PiibbiPKbfbbXXfYMP10,0101010;,010,PbbiifZPPZZZM2211MPZZ,1P,1111,Pbb 18n经过泰勒级数展开得到的线性模型只是原变量关系的近似,虽然可以把 作为原模型参数的估计,但效果可能没有保证。 n由于 和参数真实值的近似程度越高,级数展开忽略的高阶项越不重要,因此提高级数展开初始值与参数真实值的近似程度有利于提高上述间接估计的精度。n提高近似程度的方法是,把前一次回归得到的估计值作为新的级数展开初始值,再进行新的级数展开。然后再作变换和线性回归,得到另一组参数估计值。 111,Pbb 010,Pbb1
8、9n这个程序可以反复进行,直到参数估计值收敛或不再有大的变化。 n最后得到的 就是非线性回归模型的参数估计值。n除了上述泰勒级数展开线性化近似的迭代方法以外,还可以直接进行非线性回归分析。 n不过由计量软件进行非线性回归的迭代优化分析就不存在这方面的困难,只要直接输入相关命令即可。 Pjjbb,120例51某地消费函数 表表5.1 某地消费函数相关数据某地消费函数相关数据年度 Y C 年度 Y C 年度 Y C1950 791.8 733.2 1962 1170.2 1069.0 1974 1896.6 1674.01951 819.0 748.7 1963 1207.3 1108.4 197
9、5 1931.7 1711.91952 844.3 771.4 1964 1291.0 1170.6 1976 2001.0 1803.91953 880.0 802.5 1965 1365.7 1236.4 1977 2066.6 1883.81954 894.0 822.7 1966 1431.3 1298.9 1978 2167.4 1961.01955 944.5 873.8 1967 1493.2 1337.7 1979 2212.6 2004.41956 989.4 899.8 1968 1551.3 1405.9 1980 2214.3 2000.41957 1012.1 919
10、.7 1969 1599.8 1456.7 1981 2248.6 2024.21958 1028.8 932.9 1970 1688.1 1492.0 1982 2261.5 2050.71959 1067.2 979.4 1971 1728.4 1538.8 1983 2334.6 2145.91960 1091.1 1005.1 1972 1797.4 1621.9 1984 2468.4 2239.91961 1123.2 1025.2 1973 1916.3 1689.6 1985 2509.0 2312.621n为了选择进行回归分析的模型,可以用EViews软件作两个变量的散点图。
11、 n建立工作文件和输入收据后,用Graph命令或菜单操作可得到两个变量的如下散点图: 22图5.2 某地收入对消费的散点图 500100015002000250030005001000150020002500CCYY vs. CC23n根据对上述散点图的直观判断,对消费和收入进行线性回归分析基本上是合理的。n但是,如果我们进一步通过该回归结果窗口的菜单操作得到下列残差序列图,如图5.3,可以发现该回归残差序列显示出明显的规律性变化,包含了明显的趋势性。24图5.3 某地消费函数回归残差序列图 -60-40-2002040605055606570758085CC Residuals25n根据该残
12、差序列图,可以考虑变量之间存在非线性关系的可能,因此可考虑采用泰勒级数展开方法作非线性函数的近似线性函数,把模型强制性化为线性模型。 26第二节第二节 异常值异常值一、问题二、异常值的发现判断三、问题的处理27一、问题n现实经济中常常存在这样的情况,一些突发事件或变化对经济活动、经济关系造成短暂的,但却是很显著的冲击影响。n这些影响既不能被看作微小的随机扰动,但又不会决定或改变长期的经济关系,或者说经济规律。 n这种情况在经济数据上反映出来,就会表现为一个脱离基本趋势的异常值。 28n如果所研究的经济问题或相关数据中存在这种情况,建立线性回归模型时又没有预先处理或剔除这种影响,就会表现为模型误
13、差项在相应时点存在均值非0的问题。 n例如变量Y 和X 在长期中的关系基本满足线性回归模型的各个假设,但在时刻 有一个突发情况,使得Y 出现一个C 单位的暂时性波动。那么如果用线性回归模型: 分析这两个变量的关系,其误差项的均值是: 0iXY29n显然不是 对任意i 都成立,也就是模型的假设(2)是不成立的。n这种情况如果不作处理,线性回归分析的有效性也会受到不利影响。n异常值会使回归分析结果出现较大偏差,参数估计量的性质和相关统计推断都会失效。 000)(iiCiiEi当当0)(iE30二、异常值的发现判断n发现和判断异常值的方法之一是分析经济问题的相关背景情况,包括对经济现象、相关社会经济
14、事件以及数据序列的直接分析等。n残差序列分析也是从技术角度发现和判断异常值问题的基本方法。n因为异常值只是个别情况,最小二乘估计仍然是一致估计量,回归残差中会包含由于异常值所导致模型误差项均值非0的信息。 31回归残差序列分析发现和判断异常值问题的方法 n在模型假设成立的前提下,回归残差是服从正态分布的随机变量,其取值95%左右的概率应分布在均值加减2倍标准差的范围内。 n如果发现某个残差 出现: 其中 是残差的标准差,模型在时点i处就很可能存在异常值问题。 ie2Sei122KneSSii32n上述回归残差序列分析等价于下列残差序列图分析。n把根据回归残差序列和残差标准差计算出的 /S数据序
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 复旦大学 经济学院 谢识予 计量 经济学 第五 线性 回归 定式 偏差 ppt 课件
限制150内