《计量经济学》第4章.多重共线性.ppt
《《计量经济学》第4章.多重共线性.ppt》由会员分享,可在线阅读,更多相关《《计量经济学》第4章.多重共线性.ppt(45页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第四章第四章 多重共线性多重共线性Multi-Collinearity计量经济学计量经济学引子:引子:国内生产总值增加会减少财政收入吗?国内生产总值增加会减少财政收入吗?为了分析各主要因素对国家财政收入的影响,建立为了分析各主要因素对国家财政收入的影响,建立财政收入财政收入(亿元亿元)(CZSR)为被解释变量,财政支出为被解释变量,财政支出(亿元)(亿元)(CZZC)、国内生产总值)、国内生产总值(亿元亿元)(GDP)、税收总额税收总额(亿元亿元)(SSZE)等为解释变量的计量模型。等为解释变量的计量模型。数据样本时期:数据样本时期:1978年年-2011年的统计数据。年的统计数据。设定的理
2、论模型为:设定的理论模型为:采用普通最小二乘法得到以下估计结果采用普通最小二乘法得到以下估计结果财政收入模型的财政收入模型的EViewsEViews估计结果估计结果VariableCoefficientStd.Errort-StatisticProb.截距119.0786107.12361.1116000.2751财政支出0.1223550.0488462.5049100.0179国内生产总值国内生产总值-0.0341040.005068-6.7291010.0000税收总额1.1811570.06967616.952040.0000R-squared0.999791Meandependent
3、var18185.17AdjustedR-squared0.999770S.D.dependentvar26129.67S.E.ofregression395.9401Akaikeinfocriterion14.91053Sumsquaredresid4703056.Schwarzcriterion15.09011Loglikelihood-249.4791Hannan-Quinncriter.14.97177F-statistic47897.29Durbin-Watsonstat1.025140Prob(F-statistic)0.000000 可决系数为可决系数为0.99979,校正的可决
4、系数为,校正的可决系数为0.999770.99977,模型拟合很好。模型对财政收入的解释程度高达模型拟合很好。模型对财政收入的解释程度高达99.9%99.9%。F F统计量为统计量为47897.2947897.29,说明,说明0.050.05水平下回归方程整水平下回归方程整体上很显著。体上很显著。t t 检验结果表明,各个解释变量检验结果表明,各个解释变量对财政收入的影对财政收入的影响均显著,但是国内生产总值对财政收入的回归系响均显著,但是国内生产总值对财政收入的回归系数的符号为负,即经济增长反而会使财政收入减少。数的符号为负,即经济增长反而会使财政收入减少。这显然与理论分析和实践经验不相符。
5、为什么会出这显然与理论分析和实践经验不相符。为什么会出现这样的异常结果?如果现这样的异常结果?如果模型设定和数据真实性没模型设定和数据真实性没问题,问题会出在哪里呢?问题,问题会出在哪里呢?模型估计与检验结果分析模型估计与检验结果分析第四章第四章 多重共线性多重共线性 本章讨论五个问题:本章讨论五个问题:什么是多重共线性什么是多重共线性 多重共线性的经济背景多重共线性的经济背景 多重共线性产生的后果多重共线性产生的后果 多重共线性的检验多重共线性的检验 多重共线性的补救措施多重共线性的补救措施一、多重共线性的含义一、多重共线性的含义或者说或者说,时,表明在数据矩阵时,表明在数据矩阵 中,至少有
6、中,至少有一个列向量可以用其余的列向量线性表示,则说明存在完全的多一个列向量可以用其余的列向量线性表示,则说明存在完全的多重共线性。重共线性。对于解释变量对于解释变量 ,如果存在不全为,如果存在不全为0 0的的数数 ,使得,使得则称解释变量则称解释变量 之间存在着之间存在着完全的多完全的多重共线性重共线性完全的多重共线性完全的多重共线性不完全的多重共线性不完全的多重共线性若解释变量若解释变量 ,存在不全为存在不全为0 0的数的数,使得使得 为随机变量为随机变量其中其中,具有近似的多重共线性具有近似的多重共线性则称则称 ,解释变量间毫无线性关系,变量间相互正交。这时已不需要作多元回归,每个参数j
7、都可以通过Y 对 Xj 的一元回归来估计。回归模型中解释变量的关系回归模型中解释变量的关系 可能表现为三种情形:可能表现为三种情形:(1),解释变量间完全共线性。此时模型参数将无法确定。,解释变量间存在一定程度的线性关系。实际中常遇到的情形。(2)(3)二、产生多重共线性的背景二、产生多重共线性的背景 多重共线性产生的经济背景主要有几种情形:多重共线性产生的经济背景主要有几种情形:1.经济变量之间具有共同变化趋势。经济变量之间具有共同变化趋势。时间序列数据时间序列数据:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降横截面数据横截面数据:变量变化与发展
8、规模有关,例如在生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小 2.模型中包含滞后变量。模型中包含滞后变量。例如,消费=f(当期收入,前期收入)3.样本数据自身的原因。样本数据自身的原因。抽样取值有限三、三、多重共线性产生的后果多重共线性产生的后果如果存在如果存在完全共线性完全共线性,则,则(X(XX)X)-1-1不存在,无法得不存在,无法得到唯一的参数估计量。到唯一的参数估计量。1 1、完全共线性下参数估计量无意义、完全共线性下参数估计量无意义OLS估计量为:X1和X2前的参数1、2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。
9、1、2已经失去了应有的经济含义,于是经常表现出似似乎乎反反常常的的现现象象:例如1本来应该是正的,结果恰是负的。这时,实际只能确定综合参数1+2的估计值以离差形式的二元回归模型为例如果两个解释变量完全相关,如x2=x1,则m+=2211xxy近似共线性下,可以得到OLS参数估计量,但参数估计量方差方差的表达式为 由于|XX|0,引起(XX)-1主对角线元素较大,使参数估计值的方差增大,OLSOLS参参数数估估计计量量非非有有效效,亦亦会会使使变变量量的的显显著著性性检检验验和和预预测测检检验验失失去意义去意义 2 2、不完全共线性下估计量方差偏大、不完全共线性下估计量方差偏大四、四、多重共线性
10、的检验多重共线性的检验 本节基本内容:本节基本内容:简单相关系数检验法简单相关系数检验法 方差扩大(膨胀)因子法方差扩大(膨胀)因子法 直观判断法直观判断法 逐步回归法逐步回归法两个问题两个问题(1)(1)是否存在是否存在(2)(2)哪些变量存在?哪些变量存在?1、简单相关系数检验法、简单相关系数检验法判断规则:判断规则:一般而言,如果每两个解释变量的简单一般而言,如果每两个解释变量的简单相关系数相关系数(零阶相关系数零阶相关系数)比较高,例如大于比较高,例如大于0.80.8,则可认为存在着较严重的多重共线性。则可认为存在着较严重的多重共线性。计算解释变量之间的相关系数或相关矩阵计算解释变量之
11、间的相关系数或相关矩阵注意注意:较高的简单相关系数只是多重共线性存在的充分条件,:较高的简单相关系数只是多重共线性存在的充分条件,而不是必要条件而不是必要条件 2 2、方差扩大(膨胀)因子法、方差扩大(膨胀)因子法统计统计上可以上可以证证明,明,的方差可表示的方差可表示为为(Variance Inflation Factor),即,即其中的其中的是是变变量量的方差扩大因子的方差扩大因子其中其中 是是Xj关于其余解关于其余解释变释变量的量的辅辅助回助回归归的可决系数的可决系数经验规则经验规则方差膨胀因子越大,表明解释变量之间的多重共方差膨胀因子越大,表明解释变量之间的多重共性越严重。反过来,方差
12、膨胀因子越接近于性越严重。反过来,方差膨胀因子越接近于1,多重共线性越弱。多重共线性越弱。经验表明,方差膨胀因子经验表明,方差膨胀因子10时,说明解释变量时,说明解释变量与其余解释变量之间有严重的多重共线性,且这与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计。种多重共线性可能会过度地影响最小二乘估计。3、直观判断法、直观判断法1.1.当增加或剔除一个解释变量,或者改变一个观测值当增加或剔除一个解释变量,或者改变一个观测值时,回归参数的估计值发生较大变化时,回归参数的估计值发生较大变化2.2.一些重要的解释变量的回归系数的标准误差较大,一些重要的解释变量的回归
13、系数的标准误差较大,在回归方程中没有通过显著性检验时在回归方程中没有通过显著性检验时3.3.有些解释变量的回归系数所带正负号与定性分析结有些解释变量的回归系数所带正负号与定性分析结果违背时果违背时4.4.模型的可决系数较高,模型的可决系数较高,F F检验显著,回归系数的方差检验显著,回归系数的方差较大,较大,t t值较小,即在统计上均不显著。值较小,即在统计上均不显著。根据经验,通常以下情况的出现可能是由于存在多重共线性根据经验,通常以下情况的出现可能是由于存在多重共线性4、逐步回归检测法、逐步回归检测法 逐步回归的基本思想逐步回归的基本思想 将变量逐个的引入模型,每引入一个解释变量后,都将变
14、量逐个的引入模型,每引入一个解释变量后,都要进行检验,并对已经选入的解释变量逐个进行要进行检验,并对已经选入的解释变量逐个进行t 检验,当原来引入的解释变量由于后面解释变量的引检验,当原来引入的解释变量由于后面解释变量的引入而变得不再显著时,则将其剔除。以确保每次引入入而变得不再显著时,则将其剔除。以确保每次引入新的变量之前回归方程中只包含显著的变量。新的变量之前回归方程中只包含显著的变量。在逐步回归中,高度相关的解释变量,在引入时会被在逐步回归中,高度相关的解释变量,在引入时会被剔除。因而也是一种检测多重共线性的有效方法。剔除。因而也是一种检测多重共线性的有效方法。五、五、多重共线性的补救措
15、多重共线性的补救措施施 本节基本内容本节基本内容:修正多重共线性的经验方法修正多重共线性的经验方法 逐步回归法逐步回归法1、修正多重共线性的经验方法、修正多重共线性的经验方法 (1).剔除变量法剔除变量法把方差扩大因子最大者所对应的自变量首先把方差扩大因子最大者所对应的自变量首先剔除再重新建立回归方程,直至回归方程中剔除再重新建立回归方程,直至回归方程中不再存在严重的多重共线性。不再存在严重的多重共线性。注意注意:若剔除了重要变量,可能引起模型的设若剔除了重要变量,可能引起模型的设定误差。定误差。(2).增大样本容量增大样本容量如果样本容量增加,会减小回归参数的方差,如果样本容量增加,会减小回
16、归参数的方差,标准误差也同样会减小。因此尽可能地收集足标准误差也同样会减小。因此尽可能地收集足够多的样本数据可以改进模型参数的估计。够多的样本数据可以改进模型参数的估计。问题:问题:增加样本数据在实际计量分析中常面临增加样本数据在实际计量分析中常面临许多困难。许多困难。(3).变换模型形式变换模型形式(一般适用于时间序列数据一般适用于时间序列数据)一般而言,差分后变量之间的相关性要比差分一般而言,差分后变量之间的相关性要比差分前弱得多,所以差分后的模型可能降低出现共前弱得多,所以差分后的模型可能降低出现共线性的可能性,此时可直接估计差分方程。线性的可能性,此时可直接估计差分方程。问题:问题:差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量经济学 计量 经济学 多重 线性
限制150内