多重共线性 优秀课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《多重共线性 优秀课件.ppt》由会员分享,可在线阅读,更多相关《多重共线性 优秀课件.ppt(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多重共线性 第1页,本讲稿共39页多重共线性多重共线性v多重共线性及其影响多重共线性及其影响v多重共线性的发现和检验多重共线性的发现和检验v多重共线性的克服和处理多重共线性的克服和处理第2页,本讲稿共39页引子:引子:发展农业和建筑业会减少财政收入吗?发展农业和建筑业会减少财政收入吗?为了分析各主要因素对财政收入的影响,建立财政收为了分析各主要因素对财政收入的影响,建立财政收入模型入模型:其中其中:CS财政收入财政收入(亿元亿元);NZ农业增加值农业增加值(亿元亿元);GZ工业增加值工业增加值(亿元亿元);JZZ建筑业增加值建筑业增加值(亿元亿元);TPOP总人口总人口(万人万人);CUM最终
2、消费最终消费(亿元亿元);SZM受灾面积受灾面积(万公顷万公顷)数据样本时期数据样本时期1978年年-2003年(资料来源:年(资料来源:中国统计年鉴中国统计年鉴2004,中,中国统计出版社国统计出版社2004年版)年版)第3页,本讲稿共39页 VariableCoefficientStd.Errort-StatisticProb.农业增加增加值NZ-1.5350900.129778-11.828610.0000工工业增加增加值GZ0.8987880.2454663.6615580.0017建筑建筑业增加增加值JZZ-1.5270891.206242-1.2659890.2208总人口人口TP
3、OP0.1511600.0337594.4776460.0003最最终消消费CUM0.1015140.1053290.9637830.3473受灾面受灾面积SZM-0.0368360.018460-1.9953820.0605截距截距项-11793.343191.096-3.6957040.0015R-squared0.995015 Mean dependent var5897.824Adjusted R-squared0.993441 S.D.dependent var5945.854S.E.of regression481.5380 Akaike info criterion15.4166
4、5Sum squared resid4405699.Schwarz criterion15.75537Log likelihood-193.4165 F-statistic632.0999Durbin-Watson stat1.873809 Prob(F-statistic)0.000000财政收入模型的财政收入模型的EViewsEViews估计结果估计结果第4页,本讲稿共39页 可决系数为可决系数为0.9950.995,校正的可决系数为,校正的可决系数为0.9930.993,模型拟合,模型拟合很好。模型对财政收入的解释程度高达很好。模型对财政收入的解释程度高达99.5%99.5%。F F统计
5、量为统计量为632.10632.10,说明,说明0.050.05水平下回归方程整体上水平下回归方程整体上显著。显著。t t 检验结果表明,除了工业增加值和总人口以外,其检验结果表明,除了工业增加值和总人口以外,其他因素对财政收入的影响均不显著。他因素对财政收入的影响均不显著。农业增加值和建筑业增加值的回归系数是负数。农业增加值和建筑业增加值的回归系数是负数。农业和建筑业的发展反而会使财政收入减少吗?农业和建筑业的发展反而会使财政收入减少吗?!这样的异常结果显然与理论分析和实践经验不相符。这样的异常结果显然与理论分析和实践经验不相符。若模型设定和数据真实性没问题,问题出在哪里呢?若模型设定和数据
6、真实性没问题,问题出在哪里呢?模型估计与检验结果分析模型估计与检验结果分析第5页,本讲稿共39页一、多重共线性及其分类一、多重共线性及其分类v多重共线性及其分类多重共线性及其分类v完全多重共线性完全多重共线性v近似多重共线性近似多重共线性第6页,本讲稿共39页 多重共线性的概念多重共线性的概念 对于模型对于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n其基本假设之一是解释变量是互相独立的。其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了相如果某两个或多个解释变量之间出现了相关性,则称为关性,则称为多重共线性多重共线性(Multicollinearity
7、)。第7页,本讲稿共39页v 如果存在如果存在 c1X1i+c2X2i+ckXki=0 i=1,2,n 其其中中:ci不不全全为为0,则则称称为为解解释释变变量量间间存存在在完完全全共共线线性性(perfect multicollinearity)。v 如果存在如果存在 c1X1i+c2X2i+ckXki+vi=0 i=1,2,n 其其中中ci不不全全为为0,vi为为随随机机误误差差项项,则则称称为为 近近似似共共线线性性(approximate multicollinearity)或或 交交 互互 相相 关关(intercorrelated)。第8页,本讲稿共39页 注意:注意:完全共线性的
8、情况并不多见,一般出现完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线的是在一定程度上的共线性,即近似共线性。性。但无论是解释变量之间严格的线性关但无论是解释变量之间严格的线性关系还是较严重的近似线性关系,都会给多系还是较严重的近似线性关系,都会给多元线性回归分析造成严重的不利影响,甚元线性回归分析造成严重的不利影响,甚至导致回归模型完全失效。至导致回归模型完全失效。第9页,本讲稿共39页(一)多重共线性的理论后果(一)多重共线性的理论后果vOLSOLS估计量仍保持估计量仍保持BLUEBLUE性质性质(高斯(高斯-马尔科夫马尔科夫定理仍然成立)定理仍然成立)v完全多重共线
9、性导致参数的完全多重共线性导致参数的OLSOLS估计量无法求出估计量无法求出(也可以理解为方差无穷大)(也可以理解为方差无穷大)。v近似多重共线性导致参数的近似多重共线性导致参数的OLSOLS估计量的方差估计量的方差大幅提高大幅提高二、二、多重共线性的后果多重共线性的后果第10页,本讲稿共39页 1.1.虽虽是线性无偏且最小方差,但其方差是一个非常大的是线性无偏且最小方差,但其方差是一个非常大的数值,故其数值,故其估计的精度下降估计的精度下降;2.回归系数的置信区间加宽,导致接受零假设的可能性增回归系数的置信区间加宽,导致接受零假设的可能性增大大,从而从而t t 检验失效检验失效 3.3.R
10、R2 2 可能很大,可能很大,F F统计值也很高;统计值也很高;4.4.最小二乘最小二乘估计量估计量及其及其标准差标准差都都对数据的微小变化非常敏感;对数据的微小变化非常敏感;5 5、模型预测、模型预测置信区间加宽,预测方差加大,以至置信区间加宽,预测方差加大,以至失去预测的失去预测的意义意义(二)多重共线性的实际后果(二)多重共线性的实际后果(理论后果的具体表现理论后果的具体表现)二、二、多重共线性的后果多重共线性的后果第11页,本讲稿共39页完全多重共线性及其危害完全多重共线性及其危害v严格多重共线性不是由于数据原因引起,通常是由于模型把有严格多重共线性不是由于数据原因引起,通常是由于模型
11、把有严格联系的变量引进同一个模型,或者由于虚拟变量设置不当严格联系的变量引进同一个模型,或者由于虚拟变量设置不当(如陷入虚拟变量陷阱的情况)而引起的。(如陷入虚拟变量陷阱的情况)而引起的。v对模型对模型 的最小二乘估计量为的最小二乘估计量为 如果存在如果存在完全共线性完全共线性,则,则 不存在,无法得到参数的估计不存在,无法得到参数的估计量。量。第12页,本讲稿共39页v以三变量回归模型为例:以三变量回归模型为例:回归方程为:回归方程为:第13页,本讲稿共39页则求参数最小二乘估计量的正规方程组为:则求参数最小二乘估计量的正规方程组为:第14页,本讲稿共39页设设 和和 两个变量之间有严格的线
12、性关系两个变量之间有严格的线性关系 则则 也成立,把该关系式代入上述正规方程组中的也成立,把该关系式代入上述正规方程组中的第二个式子,可得第二个式子,可得很显然,这个方程和原正规方程组中的第一个式子相同,很显然,这个方程和原正规方程组中的第一个式子相同,这时方程组不再只有一组解而有无穷组解,这就意味着,这时方程组不再只有一组解而有无穷组解,这就意味着,被解释变量究竟受哪些变量的影响无法识别。完全多重共被解释变量究竟受哪些变量的影响无法识别。完全多重共线性使多元线性回归模型的参数估计失败,回归分析无法线性使多元线性回归模型的参数估计失败,回归分析无法进行。进行。第15页,本讲稿共39页 完全多重
13、共线性是由于在模型设定时把完全多重共线性是由于在模型设定时把严格严格联系的变量引进同一个模型联系的变量引进同一个模型,或者是,或者是由于虚拟变量设由于虚拟变量设置不当置不当引起的。引起的。因此对完全共线性的处理比较简单,只需要针因此对完全共线性的处理比较简单,只需要针对性的修改模型,放弃和调整引起完全共线性的部对性的修改模型,放弃和调整引起完全共线性的部分变量即可。注意,不能放弃形成线性关系的所有分变量即可。注意,不能放弃形成线性关系的所有解释变量,否则造成解释变量缺落,使模型失去研解释变量,否则造成解释变量缺落,使模型失去研究意义。究意义。第16页,本讲稿共39页近似多重共线性的原因近似多重
14、共线性的原因v近似多重共线性既与变量选择有关,也与数据有关。虽然由于解释变量的选择不当,把内在相关性较强的变量引进同一个模型,是导致近似多重共线性的重要原因,但近似多重共线性更经常的原因是经济数据的共同趋势。v如:时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。第17页,本讲稿共39页近似多重共线性的影响近似多重共线性的影响v近似多重共线性不会导致参数估计失效,最小二乘参数估计能近似多重共线性不会导致参数估计失效,最小二乘参数估计能够得到唯一解
15、。在模型存在多重共线性的情况下,参数的最小够得到唯一解。在模型存在多重共线性的情况下,参数的最小二乘估计仍然是最小方差线性无偏估计。但二乘估计仍然是最小方差线性无偏估计。但参数估计量的方差的参数估计量的方差的绝对水平会随着多重共线性程度的提高急剧上升绝对水平会随着多重共线性程度的提高急剧上升。因此,强的近。因此,强的近似多重共线性会对多元回归的有效性产生严重的不利影响。似多重共线性会对多元回归的有效性产生严重的不利影响。v如果用如果用 记为变量记为变量 的离差平方和,的离差平方和,记为变量记为变量 对其对其余余K-1个解释变量的回归平方和,个解释变量的回归平方和,表示原模型第表示原模型第k个解
16、释变量对其个解释变量对其余余K1个解释变量回归的决定系数,那么个解释变量回归的决定系数,那么 的方差可以写成的方差可以写成第18页,本讲稿共39页近似多重共线性的影响近似多重共线性的影响v如果第如果第k个解释变量与其余个解释变量与其余K1个解释变量完全没个解释变量完全没有相关性,那么有相关性,那么 。v当第当第k个解释变量与其他解释变量之间有相关性时,个解释变量与其他解释变量之间有相关性时,。v当第当第k个解释变量与其他解释变量之间有很强的相个解释变量与其他解释变量之间有很强的相关性时,关性时,接近于接近于1,此时,此时 第19页,本讲稿共39页(一)多重共线性问题的诊断原则:(一)多重共线性
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多重共线性 优秀课件 多重 线性 优秀 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内