第八章多重共线性.ppt
《第八章多重共线性.ppt》由会员分享,可在线阅读,更多相关《第八章多重共线性.ppt(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八章第八章 多重共线性多重共线性多重共线性多重共线性v多重共线性及其影响多重共线性及其影响v多重共线性的发现和检验多重共线性的发现和检验v多重共线性的克服和处理多重共线性的克服和处理引子:引子:发展农业和建筑业会减少财政收入吗?发展农业和建筑业会减少财政收入吗?为了分析各主要因素对财政收入的影响,建立财政收为了分析各主要因素对财政收入的影响,建立财政收入模型入模型:其中其中:CS财政收入财政收入(亿元亿元);NZ农业增加值农业增加值(亿元亿元);GZ工业增加值工业增加值(亿元亿元);JZZ建筑业增加值建筑业增加值(亿元亿元);TPOP总人口总人口(万人万人);CUM最终消费最终消费(亿元亿元
2、);SZM受灾面积受灾面积(万公顷万公顷)数据样本时期数据样本时期1978年年-2003年(资料来源:年(资料来源:中国统计年鉴中国统计年鉴2004,中国统计出版社,中国统计出版社2004年版)年版)VariableCoefficientStd.Errort-StatisticProb.农业增加增加值NZ-1.5350900.129778-11.828610.0000工工业增加增加值GZ0.8987880.2454663.6615580.0017建筑建筑业增加增加值JZZ-1.5270891.206242-1.2659890.2208总人口人口TPOP0.1511600.0337594.477
3、6460.0003最最终消消费CUM0.1015140.1053290.9637830.3473受灾面受灾面积SZM-0.0368360.018460-1.9953820.0605截距截距项-11793.343191.096-3.6957040.0015R-squared0.995015 Mean dependent var5897.824Adjusted R-squared0.993441 S.D.dependent var5945.854S.E.of regression481.5380 Akaike info criterion15.41665Sum squared resid44056
4、99.Schwarz criterion15.75537Log likelihood-193.4165 F-statistic632.0999Durbin-Watson stat1.873809 Prob(F-statistic)0.000000财政收入模型的财政收入模型的EViewsEViews估计结果估计结果 可决系数为可决系数为0.9950.995,校正的可决系数为,校正的可决系数为0.9930.993,模型,模型拟合很好。模型对财政收入的解释程度高达拟合很好。模型对财政收入的解释程度高达99.5%99.5%。F F统计量为统计量为632.10632.10,说明,说明0.050.05水平
5、下回归方程整体水平下回归方程整体上显著。上显著。t t 检验结果表明,除了工业增加值和总人口以外,检验结果表明,除了工业增加值和总人口以外,其他因素对财政收入的影响均不显著。其他因素对财政收入的影响均不显著。农业增加值和建筑业增加值的回归系数是负数。农业增加值和建筑业增加值的回归系数是负数。农业和建筑业的发展反而会使财政收入减少吗?农业和建筑业的发展反而会使财政收入减少吗?!这样的异常结果显然与理论分析和实践经验不相符。这样的异常结果显然与理论分析和实践经验不相符。若模型设定和数据真实性没问题,问题出在哪里呢?若模型设定和数据真实性没问题,问题出在哪里呢?模型估计与检验结果分析模型估计与检验结
6、果分析一、多重共线性及其分类一、多重共线性及其分类v多重共线性及其分类多重共线性及其分类v完全多重共线性完全多重共线性v近似多重共线性近似多重共线性 多重共线性的概念多重共线性的概念 对于模型对于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n其基本假设之一是解释变量是互相独立的。其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了相如果某两个或多个解释变量之间出现了相关性,则称为关性,则称为多重共线性多重共线性(Multicollinearity)。v 如果存在如果存在 c1X1i+c2X2i+ckXki=0 i=1,2,n 其其中中:ci不不全全为为0,
7、则则称称为为解解释释变变量量间间存存在在完完全全共共线线性性(perfect multicollinearity)。如果存在如果存在 c1X1i+c2X2i+ckXki+vi=0 i=1,2,n 其其中中ci不不全全为为0,vi为为随随机机误误差差项项,则则称称为为 近近似似共共线线性性(approximate multicollinearity)或或交交互互相相关关(intercorrelated)。注意:注意:完全共线性的情况并不多见,一般出现完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线的是在一定程度上的共线性,即近似共线性。性。但无论是解释变量之间严格的线性关但
8、无论是解释变量之间严格的线性关系还是较严重的近似线性关系,都会给多系还是较严重的近似线性关系,都会给多元线性回归分析造成严重的不利影响,甚元线性回归分析造成严重的不利影响,甚至导致回归模型完全失效。至导致回归模型完全失效。(一)多重共线性的理论后果(一)多重共线性的理论后果OLSOLS估计量仍保持估计量仍保持BLUEBLUE性质性质(高斯(高斯-马尔科马尔科夫定理仍然成立)夫定理仍然成立)完全多重共线性导致参数的完全多重共线性导致参数的OLSOLS估计量无估计量无法求出(也可以理解为方差无穷大)法求出(也可以理解为方差无穷大)。近似多重共线性导致参数的近似多重共线性导致参数的OLSOLS估计量
9、的估计量的方差大幅提高方差大幅提高二、二、多重共线性的后果多重共线性的后果 1.1.虽虽是线性无偏且最小方差,但其方差是一个非是线性无偏且最小方差,但其方差是一个非常大的数值,故其常大的数值,故其估计的精度下降估计的精度下降;2.回归系数的置信区间加宽,导致接受零假设的回归系数的置信区间加宽,导致接受零假设的可能性增大可能性增大,从而从而t t 检验失效检验失效 3.3.R R2 2 可能很大,可能很大,F F统计值也很高;统计值也很高;4.4.最小二乘最小二乘估计量估计量及其及其标准差标准差都都对数据的微小变化非常敏对数据的微小变化非常敏感;感;5 5、模型预测、模型预测置信区间加宽,预测方
10、差加大,以至置信区间加宽,预测方差加大,以至失去预失去预测的意义测的意义(二)多重共线性的实际后果(二)多重共线性的实际后果(理论后果的具体表现理论后果的具体表现)二、二、多重共线性的后果多重共线性的后果完全多重共线性及其危害完全多重共线性及其危害v严格多重共线性不是由于数据原因引起,通常是由于模型把严格多重共线性不是由于数据原因引起,通常是由于模型把有严格联系的变量引进同一个模型,或者由于虚拟变量设有严格联系的变量引进同一个模型,或者由于虚拟变量设置不当(如陷入虚拟变量陷阱的情况)而引起的。置不当(如陷入虚拟变量陷阱的情况)而引起的。v对模型对模型 的最小二乘估计量为的最小二乘估计量为 如果
11、存在如果存在完全共线性完全共线性,则,则 不存在,无法得到参数的不存在,无法得到参数的估计量。估计量。v以三变量回归模型为例:以三变量回归模型为例:回归方程为:回归方程为:则求参数最小二乘估计量的正规方程组为:则求参数最小二乘估计量的正规方程组为:设设 和和 两个变量之间有严格的线性关系两个变量之间有严格的线性关系 则则 也成立,把该关系式代入上述正规方程组也成立,把该关系式代入上述正规方程组中的第二个式子,可得中的第二个式子,可得很显然,这个方程和原正规方程组中的第一个式子相同,很显然,这个方程和原正规方程组中的第一个式子相同,这时方程组不再只有一组解而有无穷组解,这就意味着,这时方程组不再
12、只有一组解而有无穷组解,这就意味着,被解释变量究竟受哪些变量的影响无法识别。完全多重被解释变量究竟受哪些变量的影响无法识别。完全多重共线性使多元线性回归模型的参数估计失败,回归分析共线性使多元线性回归模型的参数估计失败,回归分析无法进行。无法进行。完全多重共线性是由于在模型设定时把完全多重共线性是由于在模型设定时把严严格联系的变量引进同一个模型格联系的变量引进同一个模型,或者是,或者是由于虚由于虚拟变量设置不当拟变量设置不当引起的。引起的。因此对完全共线性的处理比较简单,只需因此对完全共线性的处理比较简单,只需要针对性的修改模型,放弃和调整引起完全共要针对性的修改模型,放弃和调整引起完全共线性
13、的部分变量即可。注意,不能放弃形成线线性的部分变量即可。注意,不能放弃形成线性关系的所有解释变量,否则造成解释变量缺性关系的所有解释变量,否则造成解释变量缺落,使模型失去研究意义。落,使模型失去研究意义。近似多重共线性的原因近似多重共线性的原因v近似多重共线性既与变量选择有关,也与数据有关。虽然由于解释变量的选择不当,把内在相关性较强的变量引进同一个模型,是导致近似多重共线性的重要原因,但近似多重共线性更经常的原因是经济数据的共同趋势。v如:时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。横截面数据:生产函数中,资本投入与劳动力投入往往
14、出现高度相关情况,大企业二者都大,小企业都小。近似多重共线性的影响近似多重共线性的影响v近似多重共线性不会导致参数估计失效,最小二乘参数估计近似多重共线性不会导致参数估计失效,最小二乘参数估计能够得到唯一解。在模型存在多重共线性的情况下,参数的能够得到唯一解。在模型存在多重共线性的情况下,参数的最小二乘估计仍然是最小方差线性无偏估计。但最小二乘估计仍然是最小方差线性无偏估计。但参数估计量参数估计量的方差的绝对水平会随着多重共线性程度的提高急剧上升的方差的绝对水平会随着多重共线性程度的提高急剧上升。因此,强的近似多重共线性会对多元回归的有效性产生严重因此,强的近似多重共线性会对多元回归的有效性产
15、生严重的不利影响。的不利影响。v如果用如果用 记为变量记为变量 的离差平方和,的离差平方和,记为变量记为变量 对其余对其余K-1个解释变量的回归平方和,个解释变量的回归平方和,表示原模型第表示原模型第k个解个解释变量对其余释变量对其余K1个解释变量回归的决定系数,那么个解释变量回归的决定系数,那么 的方的方差可以写成差可以写成近似多重共线性的影响近似多重共线性的影响v如果第如果第k个解释变量与其余个解释变量与其余K1个解释变量完全没个解释变量完全没有相关性,那么有相关性,那么 。v当第当第k个解释变量与其他解释变量之间有相关性时,个解释变量与其他解释变量之间有相关性时,。v当第当第k个解释变量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八章 多重共线性 第八 多重 线性
限制150内