多重共线性讲稿.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《多重共线性讲稿.ppt》由会员分享,可在线阅读,更多相关《多重共线性讲稿.ppt(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多重共线性第一页,讲稿共五十二页哦一、多重共线性的概念一、多重共线性的概念第二页,讲稿共五十二页哦1、多重共线性、多重共线性 对于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n (2.6.1)其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了相关性,则称为如果某两个或多个解释变量之间出现了相关性,则称为多重共线性多重共线性。第三页,讲稿共五十二页哦 如果存在 c1X1i+c2X2i+ckXki=0 i=1,2,n (2.6.2)其中:ci不全为0,即某一个解释变量可以用其它解释变量某一个解释变量可以用其它解释变量的线性组合表示,则称为解释变量间存在的线性
2、组合表示,则称为解释变量间存在完全共线性完全共线性。如果存在 c1X1i+c2X2i+ckXki+vi=0 i=1,2,n (2.6.3)其中ci不全为0,为随机误差项,则称为一般共线性一般共线性(近似共线近似共线性性)或或交互相关交互相关(intercorrelated)。第四页,讲稿共五十二页哦 在矩阵表示的线性回归模型 Y=XB+N中,完全共线性指:秩完全共线性指:秩(X)k+1,即矩阵knnnkkXXXXXXXXXX212221212111111中,至少有一列向量可由其他列向量(不包括第一列)线性表出。第五页,讲稿共五十二页哦 例如例如,X2=X1,这时X1与X2的相关系数为1,解释变
3、量X2对因变量的作用完全可由X1代替。注意:注意:完全共线性的情况并不多见,一般出现的是在一定完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性程度上的共线性,即近似共线性。第六页,讲稿共五十二页哦2、实际经济问题中的多重共线性现象、实际经济问题中的多重共线性现象 经济变量的共同变化趋势经济变量的共同变化趋势 时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。第七页,讲稿共五十二页哦 滞后变量的引入滞后变量的引入 在计量经济
4、模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。第八页,讲稿共五十二页哦 一般经验一般经验 对于采用对于采用时间序列数据时间序列数据作样本、以简单线性形式建作样本、以简单线性形式建立的计量经济学模型,往往存在多重共线性。立的计量经济学模型,往往存在多重共线性。以以截面数据截面数据作样本时,问题不那么严重,但多重共作样本时,问题不那么严重,但多重共线性仍然是存在的。线性仍然是存在的。第九页,讲稿共五十二页哦二、多重共线性的后果二、多重共线性的后果第十页,讲稿共五十二页哦 1 1、完全共线性下参数估计量不存在、完全共线性
5、下参数估计量不存在多元线性模型 YX的普通最小二乘参数估计量为:()X XX Y1 (2.6.4)如果存在完全共线性,则如果存在完全共线性,则(XX)-1不存在,无法得到不存在,无法得到参数的估计量。参数的估计量。第十一页,讲稿共五十二页哦例例如如:对一个离差形式的二元回归模型 2211xxy 如果两个解释变量完全相关,如12xx,则有221212212121221221211iiiiiiiiiiixxxxxxxxxxxXX1121iiiiiiyxyxyxYX第十二页,讲稿共五十二页哦该回归模型的正规方程为 YXBX)X(或 iiiiiyxxxx1212211 iiiiiyxxxx222212
6、1解该线性方程组得:002122121212121211221221212222111iiiiiiiiiiiiiiiiiiiiiiixxxxxyxxyxxxxxxxxyxxxyx1为不定式;同理,2也为不定式,其值无法确定。第十三页,讲稿共五十二页哦事实上,当12xx时,原二元回归模型退化为一元回归模型:121)(xy只能确定综合参数21的估计值:21121iiixyx第十四页,讲稿共五十二页哦2 2、近似共线性下普通最小二乘法参数估计、近似共线性下普通最小二乘法参数估计量非有效量非有效 在一般共线性(或称近似共线性)下,虽然可以得到OLS法参数估计量,但是由参数估计量方差的表达式为 12)(
7、)(XXCov 可见,由于此时|XX|0,引起(XX)-1主对角线元素较大,从而使参数估计值的方差增大,OLS参数估计量非有效。第十五页,讲稿共五十二页哦仍以一元模型中1为例,1的方差为2221221212221222122211121)(1/)()()var(iiiiiiiiiixxxxxxxxxxXX 2221221)(iiiixxxx恰为1x与2x的线性相关系数的平方2r,由于2r1,故1112 r。第十六页,讲稿共五十二页哦即:多重共线性使参数估计值的方差增大,多重共线性使参数估计值的方差增大,方差扩方差扩大因子大因子(Variance Inflation Factor)为为1/(1-
8、r2),其增大趋势见下表:当完完全全不不共共线线时,2r=0,2121/)var(ix当不完全共线不完全共线(近似共线)时,102 r,2122212111)var(iixrx相关系数平方00.50.80.90.950.960.970.980.990.999方差扩大因子12510202533501001000当完全共线时,2r=1,)var(1第十七页,讲稿共五十二页哦3 3、参数估计量经济含义不合理、参数估计量经济含义不合理 如果模型中两个解释变量具有线性相关性,例如果模型中两个解释变量具有线性相关性,例如如X1和和X2,那么它们中的一个变量可以由另一个变量,那么它们中的一个变量可以由另一个
9、变量表征。表征。这时,这时,X1和和X2前的参数并不反映各自与被解释变前的参数并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共量之间的结构关系,而是反映它们对被解释变量的共同影响。同影响。所以各自的参数已经失去了应有的经济含义,于是经所以各自的参数已经失去了应有的经济含义,于是经常表现出似乎反常的现象,例如本来应该是正的,结果常表现出似乎反常的现象,例如本来应该是正的,结果恰是负的。恰是负的。第十八页,讲稿共五十二页哦4 4、变量的显著性检验失去意义、变量的显著性检验失去意义存在多重共线性时存在多重共线性时参数估计值的方差与标准差变大参数估计值的方差与标准差变大使使t统计量
10、的拒绝域变小(临界值增大)统计量的拒绝域变小(临界值增大)容易使通过样本计算的容易使通过样本计算的t值小于临界值,值小于临界值,误导作出参数为误导作出参数为0的推断的推断可能将重要的解释变量排除在模型之外可能将重要的解释变量排除在模型之外第十九页,讲稿共五十二页哦5 5、模型的预测功能失效、模型的预测功能失效 变大的方差容易使区间预测的变大的方差容易使区间预测的“区间区间”变大,使预测失变大,使预测失去意义。去意义。能否说:如果存在完全共线性,预测值的置信区间为能否说:如果存在完全共线性,预测值的置信区间为(,+)?)?第二十页,讲稿共五十二页哦三、多重共线性的检验三、多重共线性的检验第二十一
11、页,讲稿共五十二页哦 由于多重共线性表现为解释变量之间具有相关关系,由于多重共线性表现为解释变量之间具有相关关系,所以所以用于多重共线性的检验方法主要是统计方法:用于多重共线性的检验方法主要是统计方法:如如判定系数检验法判定系数检验法、逐步回归检验法逐步回归检验法等等。多重共线性检验的任务多重共线性检验的任务是:是:(1)检验多重共线性是否存在;)检验多重共线性是否存在;(2)估计多重共线性的范围,即判断哪些变量之)估计多重共线性的范围,即判断哪些变量之间存在共线性。间存在共线性。第二十二页,讲稿共五十二页哦1 1、检验多重共线性是否存在、检验多重共线性是否存在 (1)(1)对两个解释变量的模
12、型,采用对两个解释变量的模型,采用简单相关系数法简单相关系数法 求出X1与X2的简单相关系数r,若|r|接近1,则说明两变量存在较强的多重共线性。(2)(2)对多个解释变量的模型,采用对多个解释变量的模型,采用综合统计检验法综合统计检验法 若 在OLS法下,模型的R2与F值较大,但各参数估计值的t检验值较小,说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显著。第二十三页,讲稿共五十二页哦2 2、判明存在多重共线性的范围、判明存在多重共线性的范围(1)判定系数检验法判定系数检验法 使模型中每一个解释变量分别以其余解释变量为解释变量进行回
13、归计算,并计算相应的拟合优度,也称为判定系数。如果在某一种形式 Xji=1X1i+2X2i+LXLi中判定系数较大,则说明在该形式中作为被解释变量的Xj可以用其他X的线性组合代替,即Xj与其他X之间存在共线性。第二十四页,讲稿共五十二页哦 等价的检验是对上述回归方程作等价的检验是对上述回归方程作F F检验检验 式中:Rj2为第j个解释变量对其他解释变量的回归方程的决定系数,若存在较强的共线性,则Rj2较大且接近于1,这时(1-Rj2)较小,从而Fj的值较大。因此,可以在给定的显著性水平下,通过计算F值的方法进行检验。构造如下 F 统计量:)1,2()1/()1()2/(2.2.knkFknRk
14、RFjjj第二十五页,讲稿共五十二页哦 另一等价的检验另一等价的检验:在模型中排除某一个解释变量在模型中排除某一个解释变量Xj,估计模型,如果拟,估计模型,如果拟合优度与包含合优度与包含Xj时十分接近,则说明时十分接近,则说明Xj与其它解释变量与其它解释变量之间存在共线性。之间存在共线性。第二十六页,讲稿共五十二页哦(2)逐步回归法逐步回归法 以以Y为被解释变量,逐个引入解释变量,构成回归为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。模型,进行模型估计。根据拟合优度的变化决定新引入的变量是否可以根据拟合优度的变化决定新引入的变量是否可以用其它变量的线性组合代替,而不作为独立的解释
15、用其它变量的线性组合代替,而不作为独立的解释变量。变量。如果拟合优度变化显著,如果拟合优度变化显著,则说明新引入的变量是一则说明新引入的变量是一个独立解释变量;个独立解释变量;如果拟合优度变化很不显著如果拟合优度变化很不显著,则说明新引入的变量,则说明新引入的变量不是一个独立解释变量,它可以用其它变量的线性组合不是一个独立解释变量,它可以用其它变量的线性组合代替,也就是说它与其它变量之间存在共线性关系。代替,也就是说它与其它变量之间存在共线性关系。第二十七页,讲稿共五十二页哦四、克服多重共线性的方法四、克服多重共线性的方法第二十八页,讲稿共五十二页哦 1 1、第一类方法:排除引起共线性的变量、
16、第一类方法:排除引起共线性的变量 找出引起多重共线性的解释变量,将它排除出去,是最找出引起多重共线性的解释变量,将它排除出去,是最为有效的克服多重共线性问题的方法。以逐步回归法得为有效的克服多重共线性问题的方法。以逐步回归法得到最广泛的应用。到最广泛的应用。注意:注意:剩余解释变量参数的经济含义和数值都发生了变化。剩余解释变量参数的经济含义和数值都发生了变化。第二十九页,讲稿共五十二页哦2 2、第二类方法:差分法、第二类方法:差分法 对于以时间序列数据为样本、以直接线性关系为模型关系形式的计量经济学模型,将原模型变换为差分模型 Yi=1 X1i+2 X2i+k Xki+i可以有效地消除存在于原
17、模型中的多重共线性。一般讲,增量之间的线性关系远比总量之间的线性一般讲,增量之间的线性关系远比总量之间的线性关系弱得多。关系弱得多。第三十页,讲稿共五十二页哦例如例如:在中国消费模型中的:在中国消费模型中的2个变量个变量:收入(Y:GDP)与消费 C 的总量与增量数据YC(-1)C(-1)/YYC(-1)C(-1)/Y1981490129760.60721982548933090.60285883330.56631983607636380.59965873290.56051984716440210.561310883830.35201985879246940.533916286730.4134
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多重 线性 讲稿
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内