第六章多重共线性黑白优秀PPT.ppt
第六章多重共线性黑白第一页,本课件共有33页多重共线性的概念多重共线性的概念多重共线性的后果多重共线性的后果多重共线性的检验多重共线性的检验案例案例第二页,本课件共有33页6.1 多重共线性的概念多重共线性的概念 对于模型 i=1,2,n其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了相关如果某两个或多个解释变量之间出现了相关性,则称为性,则称为多重共线性多重共线性(Multicollinearity)(Multicollinearity)。第三页,本课件共有33页 一般地,产生多重共线性的主要原因有以下三个方面:(1 1)经济变量相关的共同趋势)经济变量相关的共同趋势 时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。第四页,本课件共有33页 (2 2)滞后变量的引入)滞后变量的引入 在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。第五页,本课件共有33页 由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。一般经验一般经验:时间序列数据时间序列数据样本:简单线性模型,往往存在多重共线性。截面数据截面数据样本:问题不那么严重,但多重共线性仍然是存在的。(3)样本资料的限制样本资料的限制第六页,本课件共有33页6.2 多重共线性的后果多重共线性的后果 1 1、完全共线性下参数估计量不存在、完全共线性下参数估计量不存在如果存在如果存在完全共线性完全共线性,则,则(XX)(XX)-1-1不存在,无法得到参不存在,无法得到参数的估计量。数的估计量。的OLS估计量为:第七页,本课件共有33页例:例:对离差形式的二元回归模型如果两个解释变量完全相关,如x2=x1,则这时,只能确定综合参数1+2的估计值:第八页,本课件共有33页 2 2、近似共线性下、近似共线性下OLSOLS估计量非有效估计量非有效 近似共线性下,可以得到OLS参数估计量,但参数估计量方差方差的表达式为 由于|XX|0,引起(XX)-1主对角线元素较大,使参数估计值的方差增大,OLSOLS参参数数估估计计量量非有效。非有效。第九页,本课件共有33页仍以二元线性模型 y=1x1+2x2+为例:恰为X1与X2的线性相关系数的平方r2由于 r2 1,故 1/(1-r2)1第十页,本课件共有33页多重共线性使参数估计值的方差增大重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子方差膨胀因子(Variance Inflation Factor,(Variance Inflation Factor,VIF)VIF)当完全不共线完全不共线时,r2=0 当近似共线近似共线时,0 r2 15.19,故认上述粮食生产的总体线性关系显著成立。但X4、X5 的参数未通过t检验,且符号不正确,故解释变量间可能存在多重共线性解释变量间可能存在多重共线性。(-0.91)(8.39)(3.32)(-2.81)(-1.45)(-0.14)第二十页,本课件共有33页 2 2、检验简单相关系数、检验简单相关系数发现:发现:X1与X4间存在高度相关性。列出X1,X2,X3,X4,X5的相关系数矩阵:第二十一页,本课件共有33页 3 3、找出最简单的回归形式、找出最简单的回归形式可见,应选可见,应选第第1 1个式子个式子为初始的回归模型。为初始的回归模型。分别作Y与X1,X2,X4,X5间的回归:(25.58)(11.49)R2=0.8919 F=132.1 DW=1.56 (-0.49)(1.14)R2=0.075 F=1.30 DW=0.12 (17.45)(6.68)R2=0.7527 F=48.7 DW=1.11 (-1.04)(2.66)R2=0.3064 F=7.07 DW=0.36第二十二页,本课件共有33页 4 4、逐步回归、逐步回归 将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。第二十三页,本课件共有33页 回归方程以回归方程以Y=f(Y=f(X1,X2,X3)为最优:为最优:5 5、结论、结论第二十四页,本课件共有33页关于中国电信业务总量的计量经济模型关于中国电信业务总量的计量经济模型 经初步分析,认为影响中国电信业务总量变化的主要因素是邮政业务总量、中国人口数、市镇人口占总人口的比重、人均GDP、全国居民人均消费水平。用1991-1999年数据建立中国电信业务总量计量经济模型如下,Ln y=24.94+2.16 x1 3.03 x2+33.7 x3+1.29 x4-2.03 x5 (0.7)(1.6)(-0.8)(1.0)(1.5)(-1.2)R2=0.99,F=106.3,DW=3.4,T=9,临界值 t0.05(3)=3.18,R2=0.99,而每个回归参数的t检验在统计上都不显著,这说明模型中存在严重的多重共线性。第二十五页,本课件共有33页第二十六页,本课件共有33页第二十七页,本课件共有33页下面用Klein判别法进行分析。首先给出解释变量间的简单相关系数矩阵。因为其中有一个简单相关系数大于R 2=0.9944,所以根据Klein判别法,模型中存在严重的多重共线性。第二十八页,本课件共有33页用逐步回归法筛选解释变量。(1)用每个解释变量分别对被解释变量做简单回归,以可决系数为标准确定解释变量的重要程度,为解释变量排序。Ln y=-0.34+206 x1 (-2.1)(14.3)R2=0.9668,F=204,T=9 Ln y=-33.26-291 x2 (-22.2)(23.6)R2=0.9875,F=555,T=9 Ln y=-18.46+7075 x3 (-14.9)(16.6)R2=0.9752,F=275.5,T=9 Ln y=-0.49+0.56 x4 (-2.5)(13.8)R2=0.9644,F=189.7,T=9 Ln y=-0.42+1.16 x5 (-2.1)(14.3)R2=0.9633,F=183.5,T=9 第二十九页,本课件共有33页(2)解释变量的重要程度依次为x2,x3,x1,x4,x5。以Ln y=-33.26-291 x2为基础,依次引入x3,x1,x4,x5。首先把x3引入模型,Ln y=-29.9-2024 x2+16.76 x3 (-6.9)(2.7)(0.8)R2=0.988,F=265.5,T=9因为因为x x3 3的引入使各回归系数的的引入使各回归系数的t t值下降,同时值下降,同时x x3 3的系数也未通过的系数也未通过t t检检验,所以应剔除验,所以应剔除x x3 3。第三十页,本课件共有33页接着把x1引入模型,Ln y=-33.37 2.92 x2 0.007 x1 (-3.2)(3.2)(-0.01)R2=0.9875,F=237.9,T=9同理剔除x1引入x4Ln y=-31.94 2.79 x2+0.022 x4 (-3.4)(3.3)(0.14)R2=0.9876,F=238.7,T=9同理剔除x4引入x5Ln y=-31.94 2.79 x2+0.022 x5 (-3.4)(3.3)(0.14)R2=0.9876,F=238.7,T=9 同理剔除x5,最后确定的模型是 Ln y=-33.26-291 x2 (-22.2)(23.6)R2=0.9875,F=555,T=9 第三十一页,本课件共有33页或者用解释变量之间相关系数值最小的x1和x4同做解释变量与Ln y回归,得Ln y=-0.48 1.08 x1+0.28 x4 (-3.4)(2.7)(2.5)R2=0.98,F=184,T=9第三十二页,本课件共有33页结束啦,愿大家每天都开心吧第三十三页,本课件共有33页