第五章 自相关.ppt
第五章自相关1第一节自相关定义及D-W检验一,自相关的定义当误差项不再是相互独立的,即cov(ij)0,就产生了自相关(Auto-correlation),也叫序列相关(serial correlation)。即t、t-1 t-2是相关的。t、t-k被称为k阶自相关t、t-1被称为1阶自相关t、t-2被称2为阶自相关 以此类推。2二自相关的检验:DurbinWatson Test(DW检验)关于自相关的检验就是检验t和t-1之间的相关性,需要计算它们的相关系数。由于是总体的,无法得到,因此通过回归初始模型,利用计算出的 的估计值代替 来进行检验,t和t1 cov(t,t1)hat=_ var(t)var(t1)3计算DurbinWatson 统计量,用d来表示:(t-t1)2d=_ t2 t 2 2(t t1)+t-1 2=_ t24对于大样本来说,t是可以得到的,且t2与t-1 2相差很小,可以认为它们是近似相等的,因此上式可以化简成d 2-2 hat因为 1 1,所以0d4 1时,d=4,完全负相关 =1时,d=0 完全正相关=0时,d=2 完全不相关所以,经验地看,d值在2左右时是不相关的,向0或4靠近则存在正相关或负相关。5根据计算结果,建立DW检验的决策规则如下:0ddL,存在一阶正相关4dLd4,存在一阶负相关dud4-du,不存在自相关dL d du,4-du d 4-dL,无法下结论Durbin Watson根据d的显著水平规定了上限du和下限dL(查表可以得到)。d统计量有一个假设前提:t=t-1+t即误差项服从一阶自相关6DW检验的局限性只能检验一阶自相关;当d值落再dL d du,4-du d 4-dL,无法下结论;无法检验含有滞后因变量的模型,例如:yt=+1 yt-1+2xt+t7例题logy=-3.938+1.451log L+0.384logK (0.237)(0.083)(0.048)R2=0.9946 DW=0.88 hat=0.559已知 k=2,n=40,=0.05,查表 dL=1.39,0.880如果估计的ddu,则在水平 上拒绝H0;即存在统计上显著的正相关。2,H0:=0,H1:0如果估计的4-ddu,则在水平 上拒绝H0;即存在统计上显著的负相关。3,H0:=0,H1:0如果估计的ddu或4-ddu,则在水平2 上拒绝H0;即存在统计上显著的自相关。9例题,已知n=50,k=4(没有包括常数项),d1.43,查表 5dL=1.38,du=1.72,1.43落在1.38和1.72之间,无法下结论,但是根据修订的d检验,1.431.72,所以基本可以拒绝没有一阶自相关的假设,即存在一阶自相关。10 此外,计算机程序SHAZAM会自动计算出一种精确d检验(exact d test),它能算出d值的准确概率。11第二节自相关的结果自相关存在的前提下,使用最小二乘法,估计量是否依旧是最佳线性无偏估计呢?我们来推导一下,看发生何种变化。假设模型yt=xt+t,t=t-1+t,根据最小二乘法,hat=xtyt/xt2 =xt(xt+t)/xt2=(xt2+xtt)/xt2 =+xtt/xt2 E(hat)=E(+xtt/xt2)=,无偏得证12先来求E(tt-S)t=t-1+t,已知误差项满足古典回归的假设E(tt-1)=E(t-1+t)t-1 =E(t-1)2+E(t t-1)2E(tt-2)=E(t-1+t)t-2 =E(t-1 t-2)+E(t t-2)2 2 2以此类推,E(tt-s)=E(t-1+t)t-s =E(t-1 t-s)+E(t t-s)s 213Var(hat)=E(xtt/xt2)2=1/(xt2)2(xt2)E(t2)+2E(tt-1)xt xt-1+2E(tt-2)xt xt-2+2E(tt-3)xt xt-3+=2/(xt2)2(xt2)+2 xt xt-1+2 2 xt xt-2+2 3 xt xt-3+14=2/xt2 1+2 xt xt-1/xt2+2 2 xt xt-2/xt2+2 3 xt xt-3/xt2+如果干扰项之间不相关,0估计值的方差和前面的估计是相同的。现在假设xt=rxt-1+vt对照前面的推导,可知 xt xt-1/xt2 r,xt xt-2/xt2 r2,.15=2/xt2 1+2 r+2 2 r2+2 3 r3+=2/xt2(1+r)/(1-r)如果不考虑自相关,估计值的方差为Var(hatLs)=2/xt2=Var(hat)=2/xt2(1+r)/(1-r)=Var(hatLs)(1+r)/(1-r)Var(hatLs)=Var(hat)(1-r)/(1+r)16如果和 r 是同号,因为它们都在1和1之间,所以,(1-r)/(1+r)就会小于1,也就是说直接使用最小二乘估计的方差小于真实的方差,即方差被低估,这样会导致t检验显著,误导人们接受估计模型。如果和 r 是符号相反,则(1-r)/(1+r)大于1,估计的方差会大于真实的方差,使检验无法通过。17第三节自相关的处理方法一,相关系数已知的情况yt=+xt+t,(1)t=t-1+t,t满足古典回归的假设前提。上述模型可以写成:yt-1=+xt-1+t-1,(2)两边同乘以,变成:yt-1=+xt-1+t-1,(3)18(1)(3)yt yt-1=(1)+(xt xt-1)+t t-1,(4)因为t t-1 t,所以新模型中的误差项是不相关的,满足古典回归的假设。对其进行回归即可以得到最佳无偏估计量。这种方法被称为广义最小二乘法(GLS,General Least Squares)19方程(4)被称为广义的差分模型或者叫准差分模型。特别地,当1时,上述模型变成:yt yt-1=(xt xt-1)+t t-1,就称为标准的一阶差分模型。GLS方法损失了第一组观测值,建议使用下列方法定义第一组观测值:x1*=x1 1-2y1*=y1 1-220我们把初始模型称做水平方程,经过处理的模型称为一阶差分方程(1)差分方程和水平方程的R2不能直接进行比较,因为,一阶差分方程的解释变量和被解释变量均发生了改变。为了能够将水平方程的R2和一阶差分方程的R2进行比较,需要对水平方程的R2进行调整。21调整的方法如下:1对水平方程做回归,计算得到RSS,记做RSSlevel,自由度为n-k-1,2对一阶差分方程回归,计算得到RSS,记做RSS1,自由度为n-k(因为没有常数项)将经过调整的水平方程的R2记做RD2,RD2=1-(1-R12)*(RSSlevel/RSS1)*(n-k-1/n-k)*dlevel22例题logyt=-3.938+1.451log L+0.384logK (0.237)(0.083)(0.048)R2=0.9946 DW=0.858 RSS=0.0434logyt=0.984 logL+0.502logkR12=0.8405 DW=1.177 RSS=0.0278RDlevel2=1-(1-0.8405)(0.0434/0.0278)(36/37)0.858 =0.7921RDlevel2 R1223此外,哈韦(Harvey)给出下面的定义:RDlevel2 1RSS0/RSS1(1-R12)不考虑自由度和方差的调整。同样是上面的例题RDlevel2 1-0.0434/0.0278(1-0.8405)=0.751024二,未知时的处理方法。首先要寻找并确定。有两类方法第一,循环查找法1,科克伦欧卡特方法(Cochran-Orucutt Procedure)第一步,估计模型 yt=+xt+t,得到t和RSS,定义RSSRSS旧25计算 (t t1)hat=_ t2第二步,估计模型 yt yt-1=(1)+(xt xt-1)+t t-1,26得到和的估计值,利用新得到的和的估计值,代入步骤(1)中,即初始模型,计算RSS,将其记做RSS新第三步,判断|(RSS新-RSS旧)/RSS旧|0.05,hat就是所估计的值。否则:将RSS新等同于RSS旧,利用第二步得到的和的估计值计算t,在计算出 hat,重复步骤2以下程序,直到两个残差平方和满足步骤3中的条件,小于0.05为止。一般迭代三到四步就可以满足条件。此时*/(1 hat),hat=hat*、hat*是差分方程中的参数估计值。272,Durbin 方法第一步,估计模型:yt=(1-)+yt-1+xt-x t-1+vt=计算得到RSS,记做RSS旧,yt-1前面的估计值就是hat。第二步,已知了 hat,估计下列模型yt hat yt-1=(1 hat)+(xt hat xt-1)+vt,得到和的估计值,利用得到的和的估计值,代入步骤(1)中,计算RSS,将其记做RSS新第三步,如果|(RSS新-RSS旧)/RSS|0.05,hat就是所估计的值。28此时*/(1 hat),hat=hat*、hat*是差分方程中的参数估计值。否则将步骤2中的和的估计值代入步骤1的模型估计出RSS,重复2、3步骤,直到满足条件为止。由于Durbin的方法中包含了滞后变量yt-1所以该方法并不常用。29第二,灰色查找法具体步骤如下:1,在1 1范围内,每间隔0.1选一个;如-1,-0.9 0.8,0.7,0.9,12,每取一个 值,都做如下回归:yt yt-1=(1 )+(xt xt-1)+vt,计算出所有的RSS;3,选择使RSS最小的作为估计值。30如果出现两个 值计算的RSS相同,并且都是最小的,例如0.8和 0.7,这时就把这个区间再按0.01的间隔划分,例如令 0.71,0.72重复 步骤2,直到找到使RSS最小的。31Cochrane-Orcutt 方法举例根据日本19701994年间,工薪家庭的实际消费支出Y和实际可支配收入X的变化数据为:年份 Y X 年份 Y X1970 239 300 1978 285 3701971 248 311 1979 293 3781972 258 329 1980 291 3741973 272 351 1981 294 3711974 268 354 1982 302 3811975 280 364 1983 304 3841976 279 360 1984 308 3921977 282 366 1985 310 40032年份 Y X1986 312 4031987 314 4111988 324 4281989 326 4341990 332 4411991 334 4491992 336 4511993 334 4491994 330 44933Xt=9700 Yt=7455 XtYt=2921268 Xt2=3808668 Yt2=2241861估计的结果如下:Yt=50.875+0.63744Xt t (6.136)(30.008)R2=0.9751t2=467.71734列表计算DW值年份 t t-t-1 t2 (t-t-1)2 1970-3.1056 -9.6445 -1971-1.1174 1.9882 1.2485 3.95291972-2.5912 -1.4739 6.7145 2.17231973-2.6148 -0.0236 6.8374 0.00061974-8.5272 -5.9123 72.7123 34.95541975-2.9015 5.6256 8.4188 31.64771976-1.3518 1.5497 1.8273 2.40171977-2.1764 -0.8246 4.7367 0.068001978-1.7261 0.4503 2.9796 0.2027 35年份 t t-t-1 t2 (t-t-1)21979 1.1744 2.9005 1.3791 8.41291980 1.7241 0.5497 2.9726 0.3022 1981 6.6364 4.9123 44.0421 24.13081982 8.2621 1.6256 68.2616 2.64271983 8.3497 0.0877 69.7183 0.00771984 7.2503 -1.0995 52.5662 1.20891985 4.1508 -3.0995 17.2288 9.60691986 4.2384 0.0877 17.9644 0.00771987 1.1390 -3.0995 1.2972 9.606936年份 t t-t-1 t2 (t-t-1)21988 0.3025 -0.8364 0.0915 0.69961989-1.5221 -1.8246 2.3168 3.32921990 0.0159 1.5379 0.0003 2.36531991-3.0836 -3.0995 9.5089 9.60691992-2.3585 0.7251 5.5626 0.52581993-3.0836 -0.7251 9.5089 0.52581994-7.0836 -4.0000 50.1780 16.0000合计 467.717 164.9337根据上面的结果就可以计算DW值(t-t1)2d=164.993/467.717 t2=0.352838已知n=25,k=1,0.3581.29(dL),所以拒绝不相关的假设,即存在一阶正相关。下面介绍使用科克伦欧卡特方法估计模型。根据估计模型计算 t t 1 hat=_=355.3091/417.5387 t-12 =0.85096139将相关系数的估计值代入计算:Yt*=Yt-0.850961 Y t-1Xt*=Xt-0.850961 X t-1得到一组新的数据,40就Yt*对Xt*回归得到:Yt*=13.973+0.53513Xt*t (2.918)(7.155)R2=0.6994 DW=2.37841DW有所改善,误差项已经不存在自相关。利用差分方程可以求出初始模型的参数估计值了。=13.973/(1-0.850961)=93.756hat=0.53513Yt=93.756+0.53513Xt42代入最初的模型,求新的残差和残差平方和新的残差=Yt-93.756 -0.535125Xt因为|(RSS新-RSS旧)/RSS旧|0.05的条件不能满足,还要继续迭代下去。利用新的残差可以计算出一个新的相关系数=980.1575/1176.8310=0.83287943将相关系数的估计值代入计算:Yt*=Yt-0.832879 Y t-1Xt*=Xt-0.832879 X t-1又得到一组新的数据Yt*对Xt*回归,得到Yt*=15.387+0.53830 Xt*计算出和的新的估计值为92.073和0.53830代入最初模型计算残差平方和(新),与旧的残差平方和比较满足条件,新的相关系数即为所求,上述的参数即是最后的估计结果。模型最终为:Yt=92.073+0.53830 XtR2=0.9906 DW=2.33044其他估计的方法有时人们根据德宾-沃森d统计量来估计,d2(1-hat)hat 1-d/2 上述公式在大样本的情形下,具有很好 的结果。例如在上面的例题中可以计算hat 1-d/2=1-0.3528/2=0.8236与我们最终迭代的结果0.832879相差不是很大。45对于小样本的情况下,泰尔和纳加(Theil-Nagar)n2(1-d/2)+k2 hat=n2-k2 其中,n=样本容量,d为德宾-沃森d值,k为解释变量的个数加上常数项。当样本容量非常大时,上式可以化为简单的公式(1-d/2)46在实际中有几种估计hat的方法,问题是到底选择那一个?在大样本的前提下,上述方法会给出近似的结果,因此使用哪种方法区别不大。但是在小样本的情况下,会有区别。估计出的hat有时相差很大。哪种方法更为可取并没有最后的定论。实际上经常用的是科克伦-欧卡特方法。47几种方法估计hat的例子 根据美国零工招聘指数(HWI)和失业率(U)的数据(1962年第一季度到1967年第四季度)估计的模型为:lnHWIt=7.3084-1.5375lnUt,R2=0.9550 (0.1110)(0.0711)d=0.9108 查表可知,0.9108N时,拒绝H0,即存在自相关h1.96(或2.576),所以,拒绝不存在自相关的假设,存在自相关。53第五节自相关产生的原因1,惯性。大多数经济时间序列都有一个明显的特点,就是所谓的惯性或粘滞性。这样,相继的观测值很可能是相依赖的,由此产生自相关。2,设定偏误(漏掉变量或不正确的函数形式)也会导致自相关3,蛛网现象。例如许多农产品的供给反映一种所谓的蛛网现象,即供给对价格的反映要滞后一个时期,因为供给需要经过一定时间才能实现,这样也会产生自相关。54滞后效应。例如人们发现当前的消费除了依赖于其他的变量以外,还严重依赖于上一期的消费,因此消费函数模型就可能不仅仅是当前消费对当前收入的回归,而是当前消费对当前收入以及上一期消费的回归。但是如果我们忽视滞后项,也会导致误差项的自相关。数据本身的原因。有时模型中使用的数据是原始数据计算后得来的,并因此导致自相关。55高阶自相关的检验方法布劳殊-戈弗雷(Breusch-Godfrey,BG)检验假设t是 p 阶自相关t=1 t-1+2 t-2+p t-p+tH0:1=2=p=0具体的检验步骤如下:1,估计初始模型,得到残差t。2,就t对t-1、t-2、.t-p回归。通常要实现确定自相关的阶数,在时间序列中我们会介绍如何确定确定自相关的阶数p为多少。他们证明了在大样本的情况下,(n p).R2服从具有p个自由度的2分布,即 (n p).R2 256本章要点基本概念DW检验最小二乘估计的结果CO法57习题一,判断对错1,DW检验当存在异方差时不适用。2,当误差项存在序列相关时,最小二乘估计时有偏无效的。3,如果解释变量中包含了滞后变量,DW检验无效。4,DW检验拒绝自相关假设时,并不完全意味着误差项不存在序列相关,可能还需要运用其他检验以便作出结论。58二,下表是日本1971-1990年的20年间,税收T与国民生产总值Y的数据年份 T Y 年份 T Y 1971 27.9 181.9 1981 50.9 277.41972 31.6 198.3 1982 53.2 287.21973 36.6 207.7 1983 55.9 295.81974 36.0 207.3 1984 58.9 309.11975 32.1 215.6 1985 62.2 324.01976 34.6 224.3 1986 66.2 333.31977 36.4 235.0 1987 73.6 349.81978 42.0 247.1 1988 80.4 370.61979 45.1 260.6 1989 84.9 387.51980 48.5 268.8 1990 90.0 407.259假设模型为Tt=+Yt+t 估计模型并检验是否存在自相关。如果存在CO法估计模型(迭代2步)估计的模型为:Tt=-26.093+0.28073Yt t(-10.793)(33.314)R2=0.9840 DW=0.610 600.6101.20(dL),所以存在一阶正相关CO法第一步 Tt=-31.402+0.29711Yt t(-5.910)(17.629)R2=0.9481 DW=1.878CO法第二步 Tt=-31.536+0.29749Yt t(-5.910)(17.629)R2=0.9481 DW=1.89361