计量经济学之多重共线性.pptx
《计量经济学之多重共线性.pptx》由会员分享,可在线阅读,更多相关《计量经济学之多重共线性.pptx(45页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第四章第四章 多重共线性多重共线性Multi-Collinearity计量经济学计量经济学引子:引子:国内生产总值增加会减少财政收入吗?国内生产总值增加会减少财政收入吗? 为了分析各主要因素对国家财政收入的影响,建立为了分析各主要因素对国家财政收入的影响,建立财政收入财政收入(亿元亿元) (CZSR)为被解释变量,财政支出为被解释变量,财政支出(亿元)(亿元)(CZZC)、国内生产总值)、国内生产总值(亿元亿元)(GDP)、税收总额税收总额(亿元亿元)(SSZE)等为解释变量的计量模型。等为解释变量的计量模型。数据样本时期:数据样本时期:1978年年-2011年的统计数据。年的统计数据。设定
2、的理论模型为:设定的理论模型为: 采用普通最小二乘法得到以下估计结果采用普通最小二乘法得到以下估计结果iiiiiuSSZEGDPCZZCCZSR3210财政收入模型的财政收入模型的EViewsEViews估计结果估计结果VariableCoefficientStd.Errort-StatisticProb.截距119.0786107.12361.1116000.2751财政支出0.1223550.0488462.5049100.0179国内生产总值国内生产总值-0.0341040.005068-6.7291010.0000税收总额1.1811570.06967616.952040.0000R-
3、squared0.999791Meandependentvar18185.17AdjustedR-squared0.999770S.D.dependentvar26129.67S.E.ofregression395.9401Akaikeinfocriterion14.91053Sumsquaredresid4703056.Schwarzcriterion15.09011Loglikelihood-249.4791Hannan-Quinncriter.14.97177F-statistic47897.29Durbin-Watsonstat1.025140Prob(F-statistic)0.00
4、0000 可决系数为可决系数为0.99979,校正的可决系数为,校正的可决系数为0.999770.99977,模型拟合很好。模型对财政收入的解释程度高达模型拟合很好。模型对财政收入的解释程度高达99.9%99.9%。 F F统计量为统计量为47897.2947897.29,说明,说明0.050.05水平下回归方程整水平下回归方程整体上很显著。体上很显著。 t t 检验结果表明,各个解释变量检验结果表明,各个解释变量对财政收入的影对财政收入的影响均显著,但是国内生产总值对财政收入的回归系响均显著,但是国内生产总值对财政收入的回归系数的符号为负,即经济增长反而会使财政收入减少。数的符号为负,即经济
5、增长反而会使财政收入减少。这显然与理论分析和实践经验不相符。为什么会出这显然与理论分析和实践经验不相符。为什么会出现这样的异常结果?如果现这样的异常结果?如果模型设定和数据真实性没模型设定和数据真实性没问题,问题会出在哪里呢?问题,问题会出在哪里呢?模型估计与检验结果分析模型估计与检验结果分析第四章第四章 多重共线性多重共线性 本章讨论五个问题:本章讨论五个问题: 什么是多重共线性什么是多重共线性 多重共线性的经济背景多重共线性的经济背景 多重共线性产生的后果多重共线性产生的后果 多重共线性的检验多重共线性的检验 多重共线性的补救措施多重共线性的补救措施一、多重共线性的含义一、多重共线性的含义
6、或者说或者说, , 时,表明在数据矩阵时,表明在数据矩阵 中,至少有中,至少有一个列向量可以用其余的列向量线性表示,则说明存在完全的多一个列向量可以用其余的列向量线性表示,则说明存在完全的多重共线性。重共线性。()RankkXX对于解释变量对于解释变量 ,如果存在不全为,如果存在不全为0 0的的数数 ,使得,使得则称解释变量则称解释变量 之间存在着之间存在着完全的多完全的多重共线性重共线性12k, ,.231,kXXX122330 (i1, 2,n)iikkiXXX231,kXXX完全的多重共线性完全的多重共线性不完全的多重共线性不完全的多重共线性若解释变量若解释变量 ,存在不全为存在不全为0
7、 0的数的数,使得使得 231,kXXX12,k12233.01, 2,., iikkiiXXXuin为随机变量为随机变量其中其中,iu具有近似的多重共线性具有近似的多重共线性231,kXXX则称则称 ,解释变量间毫无线性关系,变量间相互正交。这时已不需要作多元回归,每个参数j都可以通过Y 对 Xj 的一元回归来估计。回归模型中解释变量的关系回归模型中解释变量的关系 可能表现为三种情形:可能表现为三种情形:(1) ,解释变量间完全共线性。此时模型参数将无法确定。 ,解释变量间存在一定程度的线性关系。实际中常遇到的情形。(2)(3)0ijx xr1ijx xr01ijx xr 二、产生多重共线性
8、的背景二、产生多重共线性的背景 多重共线性产生的经济背景主要有几种情形:多重共线性产生的经济背景主要有几种情形: 1.经济变量之间具有共同变化趋势。经济变量之间具有共同变化趋势。 时间序列数据时间序列数据:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降横截面数据横截面数据:变量变化与发展规模有关,例如在生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小 2.模型中包含滞后变量。模型中包含滞后变量。 例如,消费=f(当期收入,前期收入) 3.样本数据自身的原因。样本数据自身的原因。抽样取值有限三、三、 多重共线性产生的后果
9、多重共线性产生的后果如果存在如果存在完全共线性完全共线性,则,则(X(XX X) )-1-1不存在,无法得不存在,无法得到唯一的参数估计量。到唯一的参数估计量。 1 1、完全共线性下参数估计量无意义、完全共线性下参数估计量无意义OLS估计量为:YXXX1)(X1和X2前的参数1、2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。1、2已经失去了应有的经济含义,于是经常表现出似乎反常的现象似乎反常的现象:例如1本来应该是正的,结果恰是负的。这时,实际只能确定综合参数1+2的估计值以离差形式的二元回归模型为例如果两个解释变量完全相关,如x2= x1,则121)(xy22
10、11xxy近似共线性下,可以得到OLS参数估计量, 但参数估计量方差方差的表达式为 由于|XX|0,引起(XX) -1主对角线元素较大,使参数估计值的方差增大,OLSOLS参数估计量非有参数估计量非有效,亦会使效,亦会使变量的显著性检验和预测检验失去意变量的显著性检验和预测检验失去意义义12)()(XXCov 2 2、不完全共线性下估计量方差偏大、不完全共线性下估计量方差偏大四、四、多重共线性的检验多重共线性的检验 本节基本内容:本节基本内容: 简单相关系数检验法简单相关系数检验法 方差扩大(膨胀)因子法方差扩大(膨胀)因子法 直观判断法直观判断法 逐步回归法逐步回归法两个问题两个问题(1)(
11、1)是否存在是否存在(2)(2)哪些变量存在?哪些变量存在?1、简单相关系数检验法、简单相关系数检验法判断规则:判断规则:一般而言,如果每两个解释变量的简单一般而言,如果每两个解释变量的简单相关系数相关系数( (零阶相关系数零阶相关系数) )比较高,例如大于比较高,例如大于0.80.8,则可认为存在着较严重的多重共线性。则可认为存在着较严重的多重共线性。计算解释变量之间的相关系数或相关矩阵计算解释变量之间的相关系数或相关矩阵注意注意:较高的简单相关系数只是多重共线性存在的充分条件,:较高的简单相关系数只是多重共线性存在的充分条件,而不是必要条件而不是必要条件 2 2、方差扩大(膨胀)因子法、方
12、差扩大(膨胀)因子法统计上可以证明,统计上可以证明,的方差可表示为的方差可表示为(Variance Inflation Factor),即,即21VIF =1-jjR222221Var() =VIF1-jjjjjxRx其中的其中的是变量是变量的方差扩大因子的方差扩大因子VIFjjXj其中其中 是是Xj关于其余解释变量的辅助回归关于其余解释变量的辅助回归的可决系数的可决系数2jR经验规则经验规则方差膨胀因子越大,表明解释变量之间的多重共方差膨胀因子越大,表明解释变量之间的多重共性越严重。反过来,方差膨胀因子越接近于性越严重。反过来,方差膨胀因子越接近于1,多重共线性越弱。多重共线性越弱。经验表明
13、,方差膨胀因子经验表明,方差膨胀因子10时,说明解释变量时,说明解释变量与其余解释变量之间有严重的多重共线性,且这与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计。种多重共线性可能会过度地影响最小二乘估计。3、直观判断法、直观判断法1 1. . 当增加或剔除一个解释变量,或者改变一个观测值当增加或剔除一个解释变量,或者改变一个观测值时,回归参数的估计值发生较大变化时,回归参数的估计值发生较大变化2 2. . 一些重要的解释变量的回归系数的标准误差较大,一些重要的解释变量的回归系数的标准误差较大,在回归方程中没有通过显著性检验时在回归方程中没有通过显著性检验时3
14、. 3. 有些解释变量的回归系数所带正负号与定性分析结有些解释变量的回归系数所带正负号与定性分析结果违背时果违背时4. 4. 模型的可决系数较高,模型的可决系数较高,F F检验显著,回归系数的方差检验显著,回归系数的方差较大,较大,t t值较小,即在统计上均不显著。值较小,即在统计上均不显著。根据经验,通常以下情况的出现可能是由于存在多重共线性根据经验,通常以下情况的出现可能是由于存在多重共线性4、逐步回归检测法、逐步回归检测法 逐步回归的基本思想逐步回归的基本思想 将变量逐个的引入模型,每引入一个解释变量后,将变量逐个的引入模型,每引入一个解释变量后,都要进行检验,并对已经选入的解释变量逐个
15、进都要进行检验,并对已经选入的解释变量逐个进行行t 检验,当原来引入的解释变量由于后面解释变量检验,当原来引入的解释变量由于后面解释变量的引入而变得不再显著时,则将其剔除。以确保每的引入而变得不再显著时,则将其剔除。以确保每次引入新的变量之前回归方程中只包含显著的变量。次引入新的变量之前回归方程中只包含显著的变量。 在逐步回归中,高度相关的解释变量,在引入时会在逐步回归中,高度相关的解释变量,在引入时会被剔除。因而也是一种检测多重共线性的有效方法。被剔除。因而也是一种检测多重共线性的有效方法。五、五、 多重共线性的补救措多重共线性的补救措施施 本节基本内容本节基本内容: : 修正多重共线性的经
16、验方法修正多重共线性的经验方法 逐步回归法逐步回归法1、修正多重共线性的经验方法、修正多重共线性的经验方法 (1). 剔除变量法剔除变量法把方差扩大因子最大者所对应的自变量首先把方差扩大因子最大者所对应的自变量首先剔除再重新建立回归方程,直至回归方程中剔除再重新建立回归方程,直至回归方程中不再存在严重的多重共线性。不再存在严重的多重共线性。注意注意: 若剔除了重要变量,可能引起模型的设若剔除了重要变量,可能引起模型的设定误差。定误差。 (2). 增大样本容量增大样本容量如果样本容量增加,会减小回归参数的方差,如果样本容量增加,会减小回归参数的方差,标准误差也同样会减小。因此尽可能地收集足标准误
17、差也同样会减小。因此尽可能地收集足够多的样本数据可以改进模型参数的估计。够多的样本数据可以改进模型参数的估计。问题:问题:增加样本数据在实际计量分析中常面临增加样本数据在实际计量分析中常面临许多困难。许多困难。 (3). 变换模型形式变换模型形式(一般适用于时间序列数据一般适用于时间序列数据)一般而言,差分后变量之间的相关性要比差分一般而言,差分后变量之间的相关性要比差分前弱得多,所以差分后的模型可能降低出现共前弱得多,所以差分后的模型可能降低出现共线性的可能性,此时可直接估计差分方程。线性的可能性,此时可直接估计差分方程。问题:问题:差分会丢失一些信息,差分模型的误差差分会丢失一些信息,差分
18、模型的误差项可能存在序列相关,可能会违背经典线性回项可能存在序列相关,可能会违背经典线性回归模型的相关假设,在具体运用时要慎重。归模型的相关假设,在具体运用时要慎重。 (4). 利用非样本先验信息利用非样本先验信息通过经济理论分析能够得到某些参数之间的关通过经济理论分析能够得到某些参数之间的关系,可以将这种关系作为约束条件,将此约束系,可以将这种关系作为约束条件,将此约束条件和样本信息结合起来进行约束最小二乘估计。条件和样本信息结合起来进行约束最小二乘估计。 (5). 横截面数据与时序数据并用横截面数据与时序数据并用首先利用横截面数据估计出部分参数,再利用首先利用横截面数据估计出部分参数,再利
19、用时序数据估计出另外的部分参数,最后得到整时序数据估计出另外的部分参数,最后得到整个方程参数的估计。个方程参数的估计。 注意:注意:这里包含着假设,即参数的横截面估计和这里包含着假设,即参数的横截面估计和从纯粹时间序列分析中得到的估计是一样的。从纯粹时间序列分析中得到的估计是一样的。 (6). 变量变换变量变换变量变换的主要方法:变量变换的主要方法:(1)计算相对指标计算相对指标 (2)将名义数据转换为实际数据将名义数据转换为实际数据 (3)将小类指标合并成大类指标将小类指标合并成大类指标 (4)对数变换对数变换变量数据的变换有时可得到较好的结果,但无变量数据的变换有时可得到较好的结果,但无法
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 经济学 之多 线性
限制150内