2022年计量经济学课件第四章多重共线性 .pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《2022年计量经济学课件第四章多重共线性 .pdf》由会员分享,可在线阅读,更多相关《2022年计量经济学课件第四章多重共线性 .pdf(19页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、学而不思则惘,思而不学则殆第四章多重共线性第一节违背基本假定的一般描述一、基本假定的回顾1、零均值假定。2、同方差假定。3、无自相关假定。4、解释变量与随机误差项不相关。5、无多重共线性假定。6、正态性假定。除此之外,还有一些需要注意的地方,回归模型关于参数线性;在重复抽样中 X 值是固定的(或X 是非随机的);X 的值要有变异;模型设定是正确的。二、假定 1 和假定 6 违背的讨论1、违背假定 1 的情况。(1)正确理解零均值假定是掌握所有假定的关键(参见Wooldridge,计量经济学导轮现代观点, pp.23-25) 。(2)假定 1 不满足的数学描述。设一元线性回归模型为1212121
2、212,1,2,()0,iiiiiiiiiiYXuinE ukE YXE uXkkXX如果有则有()( )()由上式表明,这时在0)(iuE下,改变的只是截距项,而对模型的线性结构并不影响。(3)对假定 1 被破坏的解释。通常在这种情况下,我们认为是变量所取的数据可能出现了异常表现, 即有异常值。 因为按照零均值的意义, 要求各个散点是均匀地分布在回归线的周围。修正的方法将在后面虚拟变量部分介绍。例如, 我们分析江苏省社会商品消费品零售总额与江苏省城乡居民可支配收入之间的关系,发现在1991 年该省的社会消费品零售总额存在异常值,表现为样本回归模型的残差在1991 年有估计值与实际值存在明显的
3、差异。见下图和下精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共 19 页学而不思则惘,思而不学则殆表Dependent Variable: JSSHEHSP Method: Least Squares Date: 10/16/04 Time: 09:38Sample: 1980 1998 Included observations: 19 Variable Coefficient Std. Error t-Statistic Prob. C -70.48491 25.87473 -2.724083 0.0144 JSCZNC 0.243
4、263 0.005811 41.85896 0.0000 R-squared 0.990391 Mean dependent var 751.2384 Adjusted R-squared 0.989826 S.D. dependent var 728.4301 S.E. of regression 73.47491 Akaike info criterion 11.53107 Sum squared resid 91775.55 Schwarz criterion 11.63048 Log likelihood -107.5451 F-statistic 1752.172 Durbin-Wa
5、tson stat 1.905133 Prob(F-statistic) 0.000000 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 2 页,共 19 页学而不思则惘,思而不学则殆另一方面,有时通过变量的时序数据的样本折线图也可直接观察到样本是否存在异常表现。如我们根据全国国有经济单位职工人数(万人)从 1952年到 1998年的数据绘制了折线图为从图形中我们可以看到,在1958 年、1959年、1960年这三年中,全国国有经济单位职工人数存在异常情况, 其背景是这几年为国家大跃进时期,国有单位职工人数增加迅速。因此,要依据这一数据建立模型,
6、零均值假定就不一定成立。2、违背假定 6 的情况。在随机误差项不再服从正态分布的条件下,如果建立回归模型的目的仅是估计参数的话, 则这一假定是否成立并不重要。 但如果利用参数估计对总体进行统计推断,则这一假定不满足将对分析会产生影响。当在大样本情况下, 根据中心极限定理, 随机误差项应近似地服从正态分布。基于上述描述, 对假定 6 是否成立可弱化看待。三、对违背假定2、3、4、5 讨论的思路给出违背假定的定义; 提出违背假定时对模型的影响后果;对违背假定的各种表现的检验(诊断) ;修正违背假定的表现(其中假定4 的讨论将在第七章第四节、第九章第三节和第十一章第一节介绍)。精选学习资料 - -
7、- - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 19 页学而不思则惘,思而不学则殆第二节什么是多重共线性一、一个多重共线性的例子下表为利用丰田公司提供的有关货车的数据,所估计出的样本回归模型各个参数的情况。被解释变量为车辆累计维修费(样本容量n=57)变量模型 A 模型 B 模型 C 截距项-626.24 (-5.98) -796.07 (-5.91) 7.29 (0.06) 购买年限7.35 (22.16) 27.58 (9.58) 累计英里数53.45 (18.27) -151.15 (-7.06) d.f.( 自由度 ) 55 55 54 2R0.89
8、7 0.856 0.946 2?(回归误差的方差 ) 135861 190941 72010 MAPE( 绝对平均百分比误差) 227.9 278.2 47.3 表中括号内为 t 统计值。再例如,有人研究中国的货币供应与宏观经济总量的关系,被解释变量为GDP,解释变量为M2(广义货币供应量) 、商业银行贷款总量。按照我们国家对 M2 的定义是现金加上所有的存款,而贷款一经形成马上转化为存款,因此从经济意义上判断, M2 与贷款总量之间存在很强的(不完全)共线性。二、多重共线性的定义1、完全多重共线性的定义。按照变量之间线性相关的解释,即对于变量23,kXXX ,如果存在不全为零的数,32k使得
9、22220kkXXX成立,则称变量23,kXXX 之间存在 完全的多重共线性 。在经济现象中完全多重共线性十分少见。因为,实际数据不会有这么巧的精确的数学关系式。 但是个别情况也是存在的, 如某一商品的出口量和它的价格有关,如果在回归模型中同时用国内价格和国外价格作为解释变量,就很有可能出精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页,共 19 页学而不思则惘,思而不学则殆现完全的多重共线性。 再如消费与收入有关, 如果用劳动收入和财产收入作为解释变量,还要用总收入作为解释变量,而总收入 =劳动收入 +财产收入这就存在完全多重共线性的危险,
10、 在这种情况下,只能得到总收入对消费的影响,而无法区分劳动收入、 财产收入各自对消费的影响。因此,在建模过程中需要特别注意。完全多重共线性只是共线性的一种极端情况,大多数经济现象是下面的不完全多重共线性,怎样表示才符合在经济学中解释的那种变量之间的非精确关系呢?2、不完全多重共线性的定义。解释变量之间的共线性非精确表示,就是一种 近 似 的 关 系 。 所以 , 在 上 述 表 达 式 中 引 入 随 机 误 差项 , 即 对 于 变 量23,kXXX ,如果存在不全为零的数,32k使得22220kkXXX成立,其中为随机误差项,或者是线性相关的一种近似关系22220kkXXX则称变量23,k
11、XXX 之间存在 不完全的多重共线性 ,或者说是近似的多重共线性。也可以用矩阵或矩阵的秩来表述不完全多重共线性。即()0Rank X XkX X或例如, 用收入和财富作为解释变量来对消费支出作回归分析。数据见下表,精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 5 页,共 19 页学而不思则惘,思而不学则殆其中, Y 为家庭消费水平(元),X2为家庭的可支配收入(元) ,X3为家庭的财富(元) 。根据数据作回归,得如下样本回归函数。从估计结果看,有如下特点: (1)从整体看,拟合效果不错。 (2)从个体看,经济意义不对,显著性检验通不过。 (3)从
12、经济意义分析,财富与收入之间通常存在某种关系,如果这种关系是线性的,则这一关系就是不完全多重共线性。为什么是不完全多重共线性?事实上家庭的财富不仅要受到收入的影响,还要受到其它因素的影响, 如家庭对财产的选择偏好、 价格指数等。 下面以收入为解释变量,作财富对收入的线性回归。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 6 页,共 19 页学而不思则惘,思而不学则殆由 EViews 计算结果,我们发现财富对收入的回归拟合效果相当不错,说明收入对财富的形成有显著性影响。 还可以得到消费水平分别对收入和财富的回归,以及变量之间的简单相关系数表,可进一
13、步观测变量之间这种关系的特征。下面, 通过一个例子来看完全多重共线性与不完全多重共线性之间的区别与联系。设模型为12233YXXu解释变量所取的数据为X2X3 X3*10 50 52 15 75 75 18 90 97 24 120 129 30 150 152 在表中,很明显看到:有线性关系X3=5X2(即 5X2-X3=0) 。但 X2与 X3*之间的关系是一种近似表示X3=5X2+,其中=2,0,7,9,2 为随机数。尽管X2与X3*之间是一种近似,但X2与 X3*之间的相关系数高达0.9959(X2与 X3之间的相关系数为多少?)。我们称前者是完全多重共线性,后者是不完全多重共线性。显
14、然,无论是哪一种情况, 无法区分变量 X2、X3、X3*对被解释变量的单独影响。需要特别注意, 解释变量之间不存在线性关系,不一定不存在非线性关系。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 7 页,共 19 页学而不思则惘,思而不学则殆如231234YXXXu式中 Y 为生产总成本, X 为产量。三、产生多重共线性的背景从经济学角度看, 多重共线性存在的最根本原因是,在经济现象中, 许多要素之间具有内在联系。 经济系统中各要素之间是相互依存、相互制约的, 在数量上就必然有一定的联系。 从这个意义上讲, 多重共线性现象是计量经济学建立模型中不可
15、避免的问题, 只是影响的程度有大小。 依据经济学与经验, 多重共线性的产生有如下原因。1、经济变量在随时间的变化过程中存在共同变化趋势。2、用截面数据建立模型, 解释变量之间常常在经济意义上有密切的关联度。3、模型中引进大量的滞后变量。4、由于变量选择不当。这一情况跟模型的设定有关(设定误差)。5、在抽样中,变量的个数大于观测的次数(此时肯定有矩阵为非满秩。为什么?) 。第二节多重共线性产生的后果一、 完全多重共线性下的后果如果解释变量之间存在完全的多重共线性,则从结论上看有1、参数估计值不确定。设有两个解释变量的线性回归模型为12233iiiYXXu其样本回归模型用离差形式表示为2233?i
16、iiyxx式中,222333?,iiiiiiyYYxXXxXX,则2和3的估计式为精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 8 页,共 19 页学而不思则惘,思而不学则殆2233232222232323222332222323?()?()iiiiiiiiiiiiiiiiiiiiiiy xxy xx xxxx xy xxy xx xxxx x如果变量2X 与3X 存在如下关系,23iiXX(注意这时仍然有23iixx ) ,其中0。将上述关系式代入2和3的估计式,得2233232222223323223333222222332233333322
17、2223333()?()()0()()0()()()0?()0iiiiiiiiiiiiiiiiiiiiiiiiiiiiiiy xxy xx xxxx xy xxy xxxxy xxy xx xxxx x2、参数估计值的方差会无限大。仍以二元回归模型为例,这时参数估计的方差为2322222232322232222323?()()?()()iiiiiiiiiixVarxxx xxVarxxx x如果变量存在完全的共线性,即23iixx ,0,则有223322222223333222222322223333?()()0?()()0iiiiiiiiiiiixxVarxxx xxxVarxxx x说明这
18、时参数估计的方差变为无穷大。二、不完全多重共线性下的后果1、有可能求出参数的估计值,但估计值很不稳定。仍以二元回归模型为例,这时由于是不完全的共线性,设23iiixxv ,式中0,iv 为误差项,且满足30iix v。以参数3的估计为例,有精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 9 页,共 19 页学而不思则惘,思而不学则殆23222332222323?()iiiiiiiiiiiyxxy xx xxxx x222233333222222333?iiiiiiiiiiiiiy xxvy xy vxxvxx对比完全共线性的情况2233333322
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年计量经济学课件第四章多重共线性 2022 计量 经济学 课件 第四 多重 线性
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内