《第四章回归假设的二级检验精选文档.ppt》由会员分享,可在线阅读,更多相关《第四章回归假设的二级检验精选文档.ppt(87页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章回归假设的二级检验本讲稿第一页,共八十七页不满足基本假定的情况,主要包括:不满足基本假定的情况,主要包括:(1)随机误差项序列存在)随机误差项序列存在异方差异方差性;性;(2)随机误差项序列存在)随机误差项序列存在序列相关序列相关性;性;(3)解释变量之间存在)解释变量之间存在多重共线多重共线性;性;(4)解释变量是随机变量且与随机误差项相关)解释变量是随机变量且与随机误差项相关 (随机解释变量随机解释变量););计量经济检验:计量经济检验:对模型基本假定的检验对模型基本假定的检验 本讲稿第二页,共八十七页本章学习要点:本章学习要点:v有无不满足假设条件的可能性有无不满足假设条件的可能性
2、v若不满足假设条件,用若不满足假设条件,用OLS得到的估计量得到的估计量会发生什么偏差会发生什么偏差v用什么方法检验假设条件是否成立用什么方法检验假设条件是否成立v补救措施补救措施本讲稿第三页,共八十七页4.1 异方差性异方差性一、异方差的概念一、异方差的概念二、产生异方差的原因二、产生异方差的原因三、异方差的后果三、异方差的后果四、异方差的检验四、异方差的检验五、异方差的修正五、异方差的修正本讲稿第四页,共八十七页对于模型对于模型 同方差:同方差:var(i)=2 i=1,2,n即即对于不同的样本点对于不同的样本点,随机误差项的方差不再是常数随机误差项的方差不再是常数,而互不相同而互不相同,
3、则认为出现了则认为出现了异方差性异方差性。一、异方差一、异方差(方差非齐性方差非齐性)的概念的概念异方差:异方差:常数常数本讲稿第五页,共八十七页 同方差性假定同方差性假定:i2=常数 f(Xi)异方差时异方差时:i2=f(Xi)异方差一般可归结为异方差一般可归结为三种类型三种类型:用矩阵表示:用矩阵表示:同方差:同方差:异方差:异方差:本讲稿第六页,共八十七页本讲稿第七页,共八十七页 二、产生异方差的原因二、产生异方差的原因1、省略自变量、省略自变量 随函数自变量由小到大,因省略自变量随函数自变量由小到大,因省略自变量 而带来的误差也由小变大而带来的误差也由小变大2、样本数据的测量误差、样本
4、数据的测量误差3、模型函数形式的设定误差、模型函数形式的设定误差4、随机因素的影响、随机因素的影响横截面数据更易产生异方差横截面数据更易产生异方差本讲稿第八页,共八十七页 高收入家庭:高收入家庭:储蓄的差异较大储蓄的差异较大 低收入家庭:低收入家庭:储蓄则更有规律性,差异较小储蓄则更有规律性,差异较小 i的方差呈现单调递增型变化的方差呈现单调递增型变化 例例4.1.1:截面资料下研究居民家庭的储蓄行为截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+i Yi:第:第i个家庭的储蓄额个家庭的储蓄额 Xi:第:第i个家庭的可支配收入个家庭的可支配收入本讲稿第九页,共八十七页 三、异方差性的后果三
5、、异方差性的后果 计量经济学模型一旦出现异方差性,如果仍采用计量经济学模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:估计模型参数,会产生下列不良后果:1 1、OLS估计量估计量仍然具有仍然具有无偏性无偏性,但,但不具不具有有效性有有效性 2 2、变量的显著性检验失去意义、变量的显著性检验失去意义不是一个有限数值,随不是一个有限数值,随X的变化而变化的变化而变化 3 3、模型的预测失效、模型的预测失效本讲稿第十页,共八十七页 四、异方差性的检验四、异方差性的检验v检验思路:检验思路:由于异方差性异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:检验
6、异方差性,也就是检验随机误差项的检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关方差与解释变量观测值之间的相关性及其相关的的“形式形式”。本讲稿第十一页,共八十七页 1 1、图示法、图示法 利用利用ols进行估计,作进行估计,作|e|ei i|与与X Xi i或或Y Yi i的散点图。多元的散点图。多元时,可以用时,可以用|ei i|对每个自变量逐个进行检验。对每个自变量逐个进行检验。X X 同方差 递增异方差 递减异方差 复杂型异方差本讲稿第十二页,共八十七页2、spearman级次相关检验(级次相关检验(等级相关系数检验等级相关系数检验)Xi原原Xi的等级,的等
7、级,|e|ei i|原原|ei|的等级的等级注:注:按同规则(升序或降序)排序后所在位置按同规则(升序或降序)排序后所在位置 (或等级)(或等级)检验:检验:H0:总体等级相关系数为零:总体等级相关系数为零 r本讲稿第十三页,共八十七页 3 3、戈德菲尔德、戈德菲尔德-匡特匡特(Goldfeld-Quandt)(Goldfeld-Quandt)检验检验 G-Q检验以检验以F检验为基础,适用条件:检验为基础,适用条件:(1)观察次数比估计的参数个数大两倍以上;)观察次数比估计的参数个数大两倍以上;(2)i服从正态分布,除异方差外,其他假定均满足;服从正态分布,除异方差外,其他假定均满足;(3)异
8、方差递增或递减的情况。)异方差递增或递减的情况。H0:i同方差同方差 H1:i异方差,方差递增(或递减)异方差,方差递增(或递减)本讲稿第十四页,共八十七页 G-QG-Q检验的步骤:检验的步骤:将将n对样本观察值对样本观察值(Xi,Yi)按观察值按观察值Xi的大小排队的大小排队将序列中间的将序列中间的c=n/4个观察值除去,并将剩下的个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为个子样样本容量均为(n-c)/2对每个子样分别进行对每个子样分别进行OLS回归,并计算各自的残回归,并计算各自的残差平方和差平方和本讲
9、稿第十五页,共八十七页 在同方差性假定下,构造如下满足在同方差性假定下,构造如下满足F分布的统计量分布的统计量(把高方差段放在分子把高方差段放在分子)给定显著性水平给定显著性水平,确定临界值,确定临界值F(v1,v2),若若F F(v1,v2),则拒绝同方差性假设,表明则拒绝同方差性假设,表明存在异方存在异方差。差。当然,还可根据两个残差平方和对应的子样的顺当然,还可根据两个残差平方和对应的子样的顺序判断是序判断是递增型异方差递增型异方差还是还是递减异型方差递减异型方差。)12,12()12()12(2122-=kcnkcnFkcnekcneFii本讲稿第十六页,共八十七页4 4、戈里瑟、戈里
10、瑟(Gleiser)检验检验原理:原理:建立误差序列对解释变量的回归模型,判建立误差序列对解释变量的回归模型,判断两者是否存在较强的相关关系。断两者是否存在较强的相关关系。选择关于变量选择关于变量X的不同的函数形式,对方程进行的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一种函数形式,估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。使得方程显著成立,则说明原模型存在异方差性。本讲稿第十七页,共八十七页 5 5、怀特(、怀特(White)检验)检验 怀特检验适合任何形式的异方差,要求大样本。怀特检验适合任何形式的异方差,要求大样本。基本思想
11、与步骤基本思想与步骤(以二元为例)(以二元为例):然后做如下辅助回归然后做如下辅助回归iiiiiiiiXXXXXXeaaaaaa+=215224213221102本讲稿第十八页,共八十七页(2)计算统计量)计算统计量nR2,n为样本容量,为样本容量,R2为判定系数为判定系数 可以证明,在同方差假设下:可以证明,在同方差假设下:R2为为辅助回归辅助回归的可决系数,的可决系数,h为为辅助回归辅助回归解释变量解释变量的个数,的个数,表示渐近服从某分布。表示渐近服从某分布。(3)本讲稿第十九页,共八十七页注意:注意:辅助回归仍是检验与解释变量可能的组合的显著辅助回归仍是检验与解释变量可能的组合的显著性
12、,因此,辅助回归方程中还可引入解释变量的更性,因此,辅助回归方程中还可引入解释变量的更高次方。高次方。如如果果存存在在异异方方差差性性,则则表表明明确确与与解解释释变变量量的的某某种种组组合合有有显显著著的的相相关关性性,这这时时往往往往显显示示出出有有较较高高的的可可决系数以及某一参数的决系数以及某一参数的t检验值较大。检验值较大。当当然然,在在多多元元回回归归中中,由由于于辅辅助助回回归归方方程程中中可可能能有有太太多多解解释释变变量量,从从而而使使自自由由度度减减少少,有有时时可可去去掉掉交叉项。交叉项。本讲稿第二十页,共八十七页五、异方差的修正五、异方差的修正1、加权最小二乘法、加权最
13、小二乘法(WLS)基本思想:基本思想:对原模型加权,使之变成一个新的不存在异对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用方差性的模型,然后采用OLS估计其参数。估计其参数。Y Yi i=0 0+1 1X Xi i+i i var(var(i i)=)=2 2f(Xf(Xi i)变换:变换:本讲稿第二十一页,共八十七页 即满足同方差性即满足同方差性,可用,可用OLS法估计。法估计。如何决定如何决定f(Xf(Xi i)的形式的形式利用利用ols估计估计ei,将,将|ei|对对Xi的不同次幂进行回归(同的不同次幂进行回归(同戈里瑟方法)戈里瑟方法),挑选最优模型作为,挑选最优模型作为
14、f(Xi)的形式。的形式。本讲稿第二十二页,共八十七页例例4.1.2,Yi=1Xi+i var(i)=2Xi2、WLS的另一种形式的另一种形式本讲稿第二十三页,共八十七页软件操作软件操作:(1)利用利用OLS求求ei (2)求求1/|e|ei i|(3)(3)选选WLSWLS(命令:(命令:LSLS(W W),权数为),权数为1/|ei i|本讲稿第二十四页,共八十七页3、广义最小二乘法、广义最小二乘法GLS 对于模型:对于模型:Y=X+若存在若存在异方差:异方差:W是一对称正定矩阵,存在一可逆矩阵是一对称正定矩阵,存在一可逆矩阵D使得使得 W=DD 本讲稿第二十五页,共八十七页 用用D-1左
15、乘左乘Y=X+两边,得到一个新的模型:两边,得到一个新的模型:该模型具有同方差性。因为该模型具有同方差性。因为 本讲稿第二十六页,共八十七页这就是原模型这就是原模型Y=X+的的加权最小二乘估计量加权最小二乘估计量,是无,是无偏、有效的估计量。偏、有效的估计量。本讲稿第二十七页,共八十七页 实际中可取:实际中可取:例例4.1.3 设回归方程为:设回归方程为:问当问当i2满足什么假定时,以下估计量是满足什么假定时,以下估计量是的最优线的最优线性无偏估计量性无偏估计量?本讲稿第二十八页,共八十七页例例4.1.4 现有现有X和和Y的样本观察值如下表:的样本观察值如下表:X 2 5 10 4 10 Y
16、4 7 4 5 9 假设假设Y对对X的回归模型为的回归模型为:试用适当的方法估计此回归模型。试用适当的方法估计此回归模型。解:解:本讲稿第二十九页,共八十七页Y1i 2 1.4 0.4 1.25 0.9X1i 0.5 0.2 0.1 0.25 0.1 本讲稿第三十页,共八十七页注意:注意:在实际操作中在实际操作中通常采用如下的经验方法:通常采用如下的经验方法:不对原模型进行异方差性检验,而是直接选不对原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据作择加权最小二乘法,尤其是采用截面数据作样本时。样本时。如果确实存在异方差,则被有效地消除了;如如果确实存在异方差,则被有效地
17、消除了;如果不存在异方差性,则加权最小二乘法等价于普果不存在异方差性,则加权最小二乘法等价于普通最小二乘法。通最小二乘法。本讲稿第三十一页,共八十七页一、一、序列相关性概念序列相关性概念二、自相关性产生的原因二、自相关性产生的原因 三、序列相关性的后果三、序列相关性的后果四、序列相关性的检验四、序列相关性的检验五、具有序列相关性模型的估计五、具有序列相关性模型的估计 4.2 序列相关性(自相关性)序列相关性(自相关性)本讲稿第三十二页,共八十七页 一、序列相关性概念一、序列相关性概念 如果对于不同的样本点,随机误差项之间不再是不相如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种
18、相关性,则认为出现了关的,而是存在某种相关性,则认为出现了序列相关性序列相关性。Cov(i,j)=E(i.j)0 i j,i,j=1,2,n 1、对于模型对于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n随机项互不相关的基本假设表现为随机项互不相关的基本假设表现为 Cov(i,j)=0 i j,i,j=1,2,n本讲稿第三十三页,共八十七页或或本讲稿第三十四页,共八十七页2、一阶序列相关或一阶自相关、一阶序列相关或一阶自相关 Cov(i,i-1)=E(i.i-1)0,i=1,2,n 总体总体一阶自相关系数为:一阶自相关系数为:本讲稿第三十五页,共八十七页 由于序列相关性经常出
19、现在以时间序列为样本的模型中,由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标因此,本节将用下标t代表代表i。设一阶序列相关设一阶序列相关t=f(t-1)是线性的,称一阶是线性的,称一阶自回归模型。自回归模型。t=a1 t-1+vt 其中其中vt是随机变数,且满足:是随机变数,且满足:本讲稿第三十六页,共八十七页二、自相关性产生的原因二、自相关性产生的原因 大多数经济时间数据都有一个明显的特点大多数经济时间数据都有一个明显的特点:惯性惯性,表现,表现在时间序列不同时间的前后关联上。在时间序列不同时间的前后关联上。1 1、经济变量固有的惯性、经济变量固有的惯性例如,例如,居民
20、总消费函数模型居民总消费函数模型:Ct=0+1Yt+t t=1,2,n由于由于消费习惯消费习惯的影响被包含在随机误差项中,则可能的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关出现序列相关性(往往是正相关 )。)。本讲稿第三十七页,共八十七页 2 2、模型设定的偏误、模型设定的偏误 所谓模型所谓模型设定偏误设定偏误(Specification error)是指所设)是指所设定的模型定的模型“不正确不正确”。主要表现在模型中丢掉了重要。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。的解释变量或模型函数形式有偏误。3 3、数据的、数据的“编造编造”在实际经济问题中,有些数
21、据是通过已知数据生在实际经济问题中,有些数据是通过已知数据生成的成的,因此,新生成的数据与原数据间就有了内在的因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。联系,表现出序列相关性。还有就是两个时间点之间的还有就是两个时间点之间的“内插内插”技术往往导致技术往往导致随机项的序列相关性。随机项的序列相关性。本讲稿第三十八页,共八十七页 三、序列相关性的后果三、序列相关性的后果 1 1、参数估计量无偏非有效、参数估计量无偏非有效 2、变量的显著性检验失去意义、变量的显著性检验失去意义 3、模型的预测失效模型的预测失效本讲稿第三十九页,共八十七页 然然后后,通通过过分分析析这这些些“
22、近近似似估估计计量量”之之间间的的相相关关性性,以判断随机误差项是否具有序列相关性。以判断随机误差项是否具有序列相关性。序列相关性序列相关性检验方法有多种,但基本思路相同:检验方法有多种,但基本思路相同:基本思路基本思路:三、序列相关性的检验三、序列相关性的检验首先首先,采用OLS 法估计模型,以求得随机误差项的“近似估计量近似估计量”,用 ei表示:lsiiiYYe0)(-=本讲稿第四十页,共八十七页 1 1、图示法、图示法本讲稿第四十一页,共八十七页2 2、杜宾、杜宾-瓦森(瓦森(Durbin-WatsonDurbin-Watson)检验法)检验法 该方法的假定条件是该方法的假定条件是:(
23、1)大样本大样本(2)随机误差项)随机误差项 i为为一阶自回归形式一阶自回归形式:i=i-1+i(3)回回归归模模型型中中不不应应含含有有滞滞后后应应变变量量作作为为解解释释变变量量,即即不应出现下列形式:不应出现下列形式:Yi=0+1X1i+kXki+Yi-1+i(4)回归含有截距项)回归含有截距项 (5)解释变量解释变量X非随机非随机本讲稿第四十二页,共八十七页提出假设提出假设 H H0 0:=0 =0 无一阶自相关无一阶自相关 H H1 1:0 0 存在一阶自相关性存在一阶自相关性构造统计量构造统计量本讲稿第四十三页,共八十七页 0DW4本讲稿第四十四页,共八十七页 判断方法判断方法 0
24、DWdL 存在一阶正自相关存在一阶正自相关 4dL DW4 存在一阶负自相关存在一阶负自相关 dU DW4dU 无自相关无自相关 dLDWdU 或或4dU DW 2(p),否定否定H0,可能存可能存在直到在直到p阶的序列相关。阶的序列相关。实际检验中,可从实际检验中,可从1阶、阶、2阶、阶、逐逐次向更高阶检验。次向更高阶检验。本讲稿第四十九页,共八十七页 如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型。最常用的方法是广义最小二乘法广义最小二乘法(GLS:Generalized least squares)和广义差分法广义差分法(Generalized Difference)。四、
25、序列相关的补救四、序列相关的补救 本讲稿第五十页,共八十七页 1 1、广义最小二乘法、广义最小二乘法 对于模型对于模型 Y=X+如果存在序列相关,同时存在异方差,即有如果存在序列相关,同时存在异方差,即有 是一对称正定矩阵,存在一可逆矩阵是一对称正定矩阵,存在一可逆矩阵D,使得,使得 =DD.,22212222111221)()Cov(ssssssssss=nnnnnELLLLLLL本讲稿第五十一页,共八十七页变换原模型:变换原模型:D-1Y=D-1X +D-1 即即 Y*=X*+*(*)(*)式的式的OLS估计:估计:这就是原模型的这就是原模型的广义最小二乘估计量广义最小二乘估计量(GLS
26、estimators),是无偏有效估计量。,是无偏有效估计量。该模型无异方差性和序列相关该模型无异方差性和序列相关的估计:的估计:本讲稿第五十二页,共八十七页 2 2、广义差分法、广义差分法 广广义义差差分分法法是是将将原原模模型型变变换换为为满满足足OLS法法的差分模型,再进行的差分模型,再进行OLS估计。估计。本讲稿第五十三页,共八十七页 该模型为该模型为广义差分模型广义差分模型,不存在序列相关问题,可,不存在序列相关问题,可进行进行OLS估计。估计。则有:则有:本讲稿第五十四页,共八十七页 的估计的估计 大样本大样本小样本小样本本讲稿第五十五页,共八十七页 杜宾杜宾(durbin)两步法
27、两步法 以一元为例:以一元为例:Yt=0+1X Xt+t 第一步第一步,变换差分模型为下列形式变换差分模型为下列形式:第二步,第二步,用用 对原模型进行广义差分。对原模型进行广义差分。本讲稿第五十六页,共八十七页科克伦科克伦-奥科特迭代法奥科特迭代法。以一元线性模型为例:首先首先,采用OLS法估计原模型 Yi=0+1Xi+i得到的的“近似估计值”,并以之作为观测值使用OLS法估计下式 i=1i-1+2i-2+Li-L+i本讲稿第五十七页,共八十七页求出i新的“近似估计值”,并以之作为样本观测值,再次估计 i=1i-1+2i-2+Li-L+i本讲稿第五十八页,共八十七页 类似地,可进行第三次、第
28、四次迭代。类似地,可进行第三次、第四次迭代。关于迭代的次数,可根据具体的问题来定。一般是事先给出一个精度,当相邻两次1,2,L的估计值之差小于这一精度时,迭代终止。实践中,有时只要迭代两次,就可得到较满意的结果。两次迭代过程也被称为科科克克伦伦-奥奥科科特特两两步步法法。本讲稿第五十九页,共八十七页应用软件中的广义差分法应用软件中的广义差分法 在在Eview/TSP软软件件包包下下,广广义义差差分分采采用用了了科科克克伦伦-奥科特(奥科特(Cochrane-Orcutt)迭代法估计)迭代法估计。在在解解释释变变量量中中引引入入AR(1)(1)、AR(2)(2)、,即即可可得得到到参参数和数和1
29、、2、的估计值。的估计值。其其中中AR(m)表表示示随随机机误误差差项项的的m阶阶自自回回归归。在在估估计计过过程中自动完成了程中自动完成了1、2、的迭代。的迭代。本讲稿第六十页,共八十七页例例4.2.1,设模型为,设模型为 Yt=0+1Xt+t t=0.6t-1+vt观察值:观察值:Yt 12 16 19 25 22 28 Xt 6.5 8 10 12 10 15 试用广义差分法估计参数。试用广义差分法估计参数。解:解:=0.6=0.6本讲稿第六十一页,共八十七页Yt*:9.6 8.8 9.4 13.6 7 14.8Xt*:5.2 4.1 5.2 6 2.8 9软件实现:软件实现:LS Y
30、C X AR(1)AR(1)求的是求的是本讲稿第六十二页,共八十七页一、多重共线性的概念一、多重共线性的概念二、产生多重共线性的原因二、产生多重共线性的原因三、多重共线性的后果三、多重共线性的后果四、多重共线性的检验四、多重共线性的检验五、克服多重共线性的方法五、克服多重共线性的方法六、案例六、案例 4.3 多重共线性多重共线性本讲稿第六十三页,共八十七页 一、多重共线性的概念一、多重共线性的概念 对于模型对于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n 如果某两个或多个解释变量之间出现了相关如果某两个或多个解释变量之间出现了相关性,则称为性,则称为多重共线性多重共线性 (
31、Multicollinearity)。本讲稿第六十四页,共八十七页 如果存在不全为如果存在不全为0的的ci,使,使 c1X1i+c2X2i+ckXki=0 i=1,2,n 则称为解释变量间存在则称为解释变量间存在完全共线性完全共线性。如果存在如果存在 c1X1i+c2X2i+ckXki+vi=0 i=1,2,n 其其中中ci不不全全为为0,vi为为随随机机误误差差项项,则则称称为为 近近似似共共线线性性或或交互相关交互相关。本讲稿第六十五页,共八十七页 在矩阵表示的线性回归模型在矩阵表示的线性回归模型 Y=X+中,中,完全共线性完全共线性指:指:秩秩(X)5或或VIF10认为模型存在较严重的多
32、重共线性。认为模型存在较严重的多重共线性。本讲稿第七十三页,共八十七页(3)(3)逐步回归法逐步回归法(FrischFrisch综合分析综合分析)第一步第一步,将因变量将因变量Y分别对分别对k个解释变量个解释变量X1、X2、XK进行简单回归:进行简单回归:Y=f1(X1),Y=f2(X2),Y=fk(Xk)根据经济理论和统计标准,挑选出最优简单回归方程。根据经济理论和统计标准,挑选出最优简单回归方程。第二步第二步,把新的变量加到选出的方程中把新的变量加到选出的方程中 如果新变量能提高如果新变量能提高R2,且符合经济理论,予以,且符合经济理论,予以 接纳;接纳;如新变量不能提高如新变量不能提高R
33、2,且对其他系数没有大的,且对其他系数没有大的 影响,便认为是多余的;影响,便认为是多余的;如新变量严重影响其他变量的系数值或符号时,便认如新变量严重影响其他变量的系数值或符号时,便认为是有害的,可能已产生严重的多重共线性,而且这个新变为是有害的,可能已产生严重的多重共线性,而且这个新变量可能是重要的。量可能是重要的。本讲稿第七十四页,共八十七页找出引起多重共线性的解释变量,将它排除出去。找出引起多重共线性的解释变量,将它排除出去。注意:注意:这时,剩余解释变量参数的经济含义和数值都发生这时,剩余解释变量参数的经济含义和数值都发生了变化。了变化。如果模型被检验证明存在多重共线性,则需要发展如果
34、模型被检验证明存在多重共线性,则需要发展新的方法估计模型,最常用的方法有三类。新的方法估计模型,最常用的方法有三类。五、克服多重共线性的方法五、克服多重共线性的方法 1 1、第一类方法:排除引起共线性的变量、第一类方法:排除引起共线性的变量本讲稿第七十五页,共八十七页 2 2、第二类方法:差分法、第二类方法:差分法 时间序列数据、线性模型:将原模型变时间序列数据、线性模型:将原模型变换为差分模型换为差分模型:Yi=1 X1i+2 X2i+k Xki+i可以有效地消除原模型中的多重共线性。可以有效地消除原模型中的多重共线性。一般讲,增量之间的线性关系远比总量之一般讲,增量之间的线性关系远比总量之
35、间的线性关系弱得多间的线性关系弱得多。本讲稿第七十六页,共八十七页3、第三类方法:减小参数估计量的方差、第三类方法:减小参数估计量的方差 多重共线性多重共线性的主要后果后果是参数估计量具有较大的方差,所以 采取适当方法减小参数估计量的方差采取适当方法减小参数估计量的方差,虽然没有消除模型中的多重共线性,但确能消除多重共线性造成的后果。例如:增加样本容量增加样本容量,可使参数估计量的方可使参数估计量的方差减小差减小。本讲稿第七十七页,共八十七页 岭回归法岭回归法(使用有偏估计使用有偏估计)以引入偏误为代价减小参数估计量的方差以引入偏误为代价减小参数估计量的方差 其中矩阵其中矩阵D一般选择为主对角
36、阵,即一般选择为主对角阵,即 D=aI a为大于为大于0的常数。的常数。(*)显然,与未含显然,与未含D的参数的参数B的估计量相比,的估计量相比,(*)式的估计式的估计量有较小的方差。量有较小的方差。具体方法具体方法是:引入矩阵是:引入矩阵D,使参数估计量为,使参数估计量为本讲稿第七十八页,共八十七页 六、案例六、案例中国粮食生产函数中国粮食生产函数 根据理论和经验分析,影响粮食生产(Y)的主要因素有:农业化肥施用量(X1);粮食播种面积(X2)成灾面积(X3);农业机械总动力(X4);农业劳动力(X5)已知中国粮食生产的相关数据,建立中国粮食生产函数:Y=0+1 X1+2 X2+3 X3+4
37、 X4+4 X5+本讲稿第七十九页,共八十七页本讲稿第八十页,共八十七页 1 1、用、用OLS法估计上述模型法估计上述模型:R2接近于1;给定=5%,得F临界值 F0.05(5,12)=3.11 F=638.4 15.19,故认上述粮食生产的总体线性关系显著成立。但X4、X5 的参数未通过t检验,且符号不正确,故解释解释变量间可能存在多重共线性变量间可能存在多重共线性。(-0.91)(8.39)(3.32)(-2.81)(-1.45)(-0.14)本讲稿第八十一页,共八十七页 2 2、检验简单相关系数、检验简单相关系数v发现:发现:X1与X4间存在高度相关性。列出X1,X2,X3,X4,X5的
38、相关系数矩阵:本讲稿第八十二页,共八十七页 3 3、找出最简单的回归形式、找出最简单的回归形式v可见,应选可见,应选第第1 1个式子个式子为初始的回归模型。为初始的回归模型。分别作Y与X1,X2,X4,X5间的回归:(25.58)(11.49)R2=0.8919 F=132.1 DW=1.56 (-0.49)(1.14)R2=0.075 F=1.30 DW=0.12 (17.45)(6.68)R2=0.7527 F=48.7 DW=1.11 (-1.04)(2.66)R2=0.3064 F=7.07 DW=0.36本讲稿第八十三页,共八十七页 4 4、逐步回归、逐步回归 将其他解释变量分别导入
39、上述初始回归模型,寻找最佳回归方程。本讲稿第八十四页,共八十七页 回归方程以回归方程以Y=f(Y=f(X1,X2,X3)为最优:为最优:5 5、结论、结论本讲稿第八十五页,共八十七页作业:作业:1、有一个参数个数为、有一个参数个数为4的线性回归模型,用的线性回归模型,用一个容量为一个容量为T=20的时序数据样本进行普通的时序数据样本进行普通最小二乘法估计,得到残差的一阶自相关系最小二乘法估计,得到残差的一阶自相关系数为:数为:试根据这些资料计算试根据这些资料计算DW统计量,并在统计量,并在0.05的显著性的显著性水平下进行自相关检验。水平下进行自相关检验。本讲稿第八十六页,共八十七页2、根据某地近、根据某地近18年的时序资料,使用普通最年的时序资料,使用普通最小二乘法,估计得到该地的进口模型为:小二乘法,估计得到该地的进口模型为:式中式中X1为该地的国内生产总值,为该地的国内生产总值,X2为存货形成额,为存货形成额,X3为消费额,括号中的数字为相应参数估计量的标准误。为消费额,括号中的数字为相应参数估计量的标准误。试根据这些资料检验分析该模型是否存在什么问题。试根据这些资料检验分析该模型是否存在什么问题。本讲稿第八十七页,共八十七页
限制150内