(精品)第6章 序列相关性.ppt
第第6章章 自相关性自相关性本章教学要求:本章教学要求:(1)掌握自相关性的含义,理解其产生)掌握自相关性的含义,理解其产生原因。原因。(2)理解自相关性存在的后果。)理解自相关性存在的后果。(3)掌握检验自相关性的方法。)掌握检验自相关性的方法。(4)掌握处理和消除自相关性的方法。)掌握处理和消除自相关性的方法。如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了自相关性自相关性(Autocorrelation)。对于模型 Yt=b0+b1X1t+b2X2t+bkXkt+ut t=1,2,n随机项互不相关的基本假设表现为:Cov(ut,us)=0 ts,t,s=1,2,n6.1自相关性的含义及产生原因自相关性的含义及产生原因6.1.1自相关性的含义自相关性的含义其方差协方差矩阵在其它假设成立的条件下,自相关意味着:自相关的类型:自相关的类型:1、按滞后阶数滞后阶数分类:一阶自相关高阶自相关2、按相关形式相关形式分类:线性非线性 通常假定误差项的自相关是线性线性的,因计量经济模型中自相关的最常见形式是一阶自相关一阶自相关形式,所以下面重点讨论误差项的一阶线性自相关形式。其中:被称为一一阶阶自自相相关关系系数数(first-order coefficient of autocorrelation),它等于ut和和ut-1的相关系数。一阶线性自相关一阶线性自相关往往可写成如下形式:ut=ut-1+vtvt是满足以下标准的OLS假定的随机干扰项:-11这样,一阶线性自相关条件下ut的方差与协方差的方差与协方差可描述为:可得,随机误差项的方差协方差矩阵方差协方差矩阵:6.1.2 产生自相关性的原因产生自相关性的原因1 1、经济变量固有的惯性、经济变量固有的惯性 2 2、模型设定的偏误、模型设定的偏误 。例如例如,本来应该估计的模型为 Yt=b0+b1X1t+b2X2t+b3X3t+ut但在模型设定中做了下述回归:Yt=b0+b1X1t+b1X2t+vt因此,vt=b3X3t+ut,如果X3确实影响Y,则出现序列相关。但建模时设立了如下模型:Yt=b0+b1Xt+vt 因此,由于vt=b2Xt2+b3Xt3+ut,,包含了产出的平方和三次方项对随机项的系统性影响,随机项也呈现序列相关性。又如:如果真实的总成本回归模型应为:Yt=b0+b1Xt+b2Xt2+b3Xt3+ut其中:Y=总成本,X=产出,例:总成本曲线的拟合 3 3、随机因素的干扰、随机因素的干扰 4 4、观测数据的处理、观测数据的处理 数据的加工过程(如季度数据)或推算过程(根据某种假定获得未调查数据)引起自相关。随机项自身可能存在“真正自相关”性,如偶然性冲击对变量的长期影响。6.2自相关性的后果自相关性的后果6.2.1模型参数估计值不具有最优性模型参数估计值不具有最优性 1、OLS估计量仍然具有仍然具有无偏性。无偏性。2、但OLS估计量不具有不具有有效性。有效性。注意:注意:在经济问题中,Xt和Ut通常存在正自相关正自相关,这意味着,存在自相关性的OLS估计表达式一般会低估参数估低估参数估计值的方差。计值的方差。仍以为例,6.2.2 随机误差项的方差随机误差项的方差 一般会低估一般会低估在此基础上考虑对参数估计量方差参数估计量方差的影响:低估参数估计量的方差,等于夸大了回归参数低估参数估计量的方差,等于夸大了回归参数的抽样精度,过高地估计了的抽样精度,过高地估计了t t统计量的值,夸大了所统计量的值,夸大了所估参数的显著性,导致检验失效。估参数的显著性,导致检验失效。RSS的虚假缩小以及ESS的虚增也会导致F统计量虚增,使F检验失效。6.2.3 模型的统计检验失效模型的统计检验失效 区间预测与参数估计量的方差有关,在方差有区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降偏误的情况下,使得预测估计不准确,预测精度降低。低。所以,所以,当模型出现序列相关性时,它的预测功当模型出现序列相关性时,它的预测功能失效。能失效。6.2.4 区间估计和预测区间的精度降低区间估计和预测区间的精度降低6.3自相关性的检验自相关性的检验 基本思路基本思路:序列相关性序列相关性检验方法有多种,但基本思路相同:检验方法有多种,但基本思路相同:首首先先,采用OLS法估计模型,以求得随机误差项的“近似估计量近似估计量”,用残差et表示。然然后后,通过分析这些“近近似似估估计计量量”之间的相关性,以判断随机误差项是否具有序列相关性。6.3.1图示法图示法 作出 随时间变化的图形,如果 呈有规律的变化,如锯齿形或循环形,则说明干扰项存在自相关。若 随时间变化不断变换符号,说明存在负相关;若连续几个为正,后边几个为负,则可能存在正相关。正自相关的序列图 1、按时间顺序绘制、按时间顺序绘制 图图负自相关的序列图 非自相关的序列图 2、绘制、绘制 的散点图的散点图 首先利用OLS回归后,求出残差 。如果大部分落在第I、第III象限,则随机误差项可能存在正自相关。如果大部分落在第II、第IV象限,则随机误差项可能存在负自相关。3、借助偏相关图判断一阶或高阶自相关、借助偏相关图判断一阶或高阶自相关6.3.2 德宾德宾沃森沃森检验法检验法 DW(Durbin-Watson)检验法的假定条件:)检验法的假定条件:(1)解释变量是非随机的 (2)干扰项的模式为一阶自相关 (3)因变量的滞后值yt-1不能在回归模型中作解释变量,即不应出现下列形式:Yt=b0+b1X1t+bkXkt+Yt-1+ut (4)回归式中有截距项 (5)没有缺落数据DW检验的原理和步骤:检验的原理和步骤:DW检验利用相继残差的差异平方和相继残差的差异平方和与RSS之比构成的统计量推断误差项ut 是否存在一阶自相关。(2)计算)计算DW统计量。统计量。DW检验步骤:检验步骤:(1)给出假设:)给出假设:H0:=0 (ut 不存在一阶自相关)H1:0 (ut 存在一阶自相关)(3)检验自相关性。)检验自相关性。临界值问题临界值问题 若 0DWdL 存在正自相关 dLDWdU 不能确定 dU DW4dU 无自相关 4dU DW4dL 不能确定 4dL DW4 存在负自相关 0 dL dU 2 4-dU 4-dL 4 正相关不能确定无自相关不能确定负相关判定规则判定规则判断下述线性回归模型是否存在自相关 (1)三个解释变量(不包含常变量)样本容量为30 由样本计算的dw值为1.76在0.05的显著性水平下判定其是否具有一阶自相关性。(2)两个解释变量(包含常变量)样本容量为25 由样本计算的dw值为2.85在0.01的显著性水平下判定其是否具有一阶自相关性。注意:注意:1、DW统计量只适用于一阶自相关的检验。2、DW检验有两个无法判定的区域。当DW值落在“不确定”区域时,有两种处理方法:加大样本容量或重新选取样本,重作DW检验。有时DW值会离开不确定区。选用其它检验方法。3、因为DW统计量是以解释变量非随机为条件得出的,所以DW统计量不适用于有滞后的被解释变量作解释变量的模型以及联立方程模型中各方程的序列自相关检验。在这种情况下,可用Durbin-h统计量检验自相关性。6.3.3 回归检验法回归检验法 注意注意:回归检验法的优点优点包括:(1)适合于任何形式的自相关检验;(2)若结论是存在自相关,则同时能提供 出自相关的具体形式与参数的估计值。回归检验法的缺点缺点是计算量大。该检验由布罗斯(Breusch)与戈弗雷(Godfrey)于1978年提出的,也被称为GB检验检验。如果怀疑随机误差项存在p阶自相关阶自相关:6.3.4 拉格朗日乘数检验拉格朗日乘数检验 对于模型 Yt=b0+b1X1t+b2X2t+bkXkt+ut t=1,2,n ut=1ut-1+2ut-2+put-p+vt t=p+1,n 即检验1=2=p=0的约束条件是否成立。假设:H0:1=2=p=0 H1:1、2p 不全为0。3、约束条件H0为真时,布罗斯和戈弗雷证明了:大样本下其中,n为样本容量,R2为辅助回归的可决系数。et=b0+b1X1t+b2X2t+bkXkt+1et-1+2et-2+pet-p+vt检验步骤:检验步骤:1、用OLS法估计模型,得残差序列。2、建立残差序列与原模型中各解释变量及残差滞后值之间的辅助回归模型。GB检验过程如下:注意:注意:拉格朗日乘数检验的优点优点包括:克服了DW检验的缺陷,适合于高阶序列相关以及模型中存在滞后被解释变量的情形,在检验上更具一般性。拉格朗日乘数检验的缺点缺点是:滞后期长度p值难以得到先验的确定。实际检验中,可从1阶、2阶、逐次向更高阶检验。4、给定,查临界值2(p),与LM值比较,做出判断。6.4自相关性的解决方法自相关性的解决方法按照产生自相关的原因不同,有以下几类处理方法:1、错误地设定模型的数学形式所致。、错误地设定模型的数学形式所致。修改模型的数学形式。探查方法:用残差et 对解释变量的较高次幂进行回归。2、省略了重要解释变量所致。、省略了重要解释变量所致。找出略去的解释变量,把它做为重要解释变量列入模型。探查方法:用残差et对那些可能影响因变量但又未列入模型的解释变量回归,并作显著性检验。3、误差项、误差项ut“真正真正”存在自相关。存在自相关。6.4.1 广义差分法广义差分法首先讨论首先讨论 已知已知 的情况:的情况:令:yt*=yt-yt-1,xj t*=xj t-xj t-1,j=1,2,k b0*=b0(1-),上述变换称作广义差分变换广义差分变换。上式中的误差项vt是非自相关非自相关的,满足假定条件,所以可对上式应用最小二乘法估计回归参数。所得估计量具有最佳线性无偏性。作上述变换后,u1*与其他随机误差项的方差相同。注意:注意:(1)上式中的 b1 bk 就是原模型中的 b1 bk,而 b0*与模型中的 b0 有如下关系,b0*=b0(1-),b0=b0*/(1-)(2)这种广义差分变换损失了一个观测值,样本容量变成(n-1)。为避免这种损失,K.R.Kadiyala(1968)提出对yt与xjt的第一个观测值分别作如下变换。x xj1j1*=*=x xj1j1 (j=1,2,k)y y1 1*=*=y y1 1于是对原模型,样本容量仍然为n。(4)当用广义差分变量回归的结果中仍存在自相关时可以对广义差分变量继续进行广义差分直至回归模型中不存在自相关为止。(3)当误差项ut 的自相关具有高阶自回归形式时,仍可用与上述相类似的方法进行广义差分变换。需要注意的是对二阶自回归形式,作广义差分变换后,要损失两个观测值;对k阶自回归形式,作广义差分变换后,将损失k个观测值。6.4.2 自相关系数自相关系数 的估计的估计其次讨论其次讨论 未知未知 的情况:的情况:2、德宾两步法、德宾两步法 3、科克伦科克伦-奥科特迭代法奥科特迭代法 以一元线性模型为例:(1)采用OLS法估计原模型:Yt=b0+b1Xt+ut 得到的u的“近似估计值”残差序列。(2)利用残差计算 的第一轮估计值。(3)利用估计的 实现第一次广义差分变换并估计广义差分模型,得到相应参数估计值。(4)将参数估计值代回原模型,求得新的残差序列。计算 的第二轮估计值。(5)重复(3)、(4)步,直到的估计误差满足精度要求为止。4、搜索估计法搜索估计法 通过“扫描”程序,比较不同相关系数下广义差分模型的残差平方和,选取残差平方和最小的模型作为最佳模型。5.4.3广义最小二乘与广义差分变换的关系广义最小二乘与广义差分变换的关系案例:中国商品进口模型案例:中国商品进口模型 经济理论指出,商品进口商品进口主要由进口国的经经济发展水平济发展水平,以及商品进口价格指数商品进口价格指数与国内价格国内价格指数指数对比因素决定的。由于无法取得中国商品进口价格指数,我们主要研究中国商品进口与国内生产总值的关系。(下表)。1.通过通过OLS法建立如下中国商品进口方程:法建立如下中国商品进口方程:(2.32)(20.12)2.进行序列相关性检验。进行序列相关性检验。DW检验检验 取=5%,由于n=24,k=2(包含常数项),查表得:dl=1.27,du=1.45由于 DW=0.628 20.05(2)故:存在正自相关存在正自相关2 2阶阶滞后:滞后:3 3阶阶滞后:滞后:(0.22)(-0.497)(4.541)(-1.842)(0.087)R2=0.6615 于是,LM=210.6614=13.89取=5%,2分布的临界值20.05(3)=7.815 LM 20.05(3)表明:存在正自相关;但存在正自相关;但 t-3t-3的参数不显著,说明不存的参数不显著,说明不存在在3 3阶序列相关性。阶序列相关性。3、运用广义差分法进行自相关的处理、运用广义差分法进行自相关的处理(1)采用杜宾两步法估计)采用杜宾两步法估计 第一步第一步,估计模型(1.76)(6.64)(-1.76)(5.88)(-5.19)(5.30)第二步第二步,作差分变换:则则M*关于关于GDP*的的OLS估计结果为:估计结果为:(2.76)(16.46)取=5%,DWdu=1.43(样本容量24-2=22)表明:已不存在自相关于是原模型为:(2)采用科克伦)采用科克伦-奥科特迭代法估计奥科特迭代法估计 在在Eviews软包下,软包下,2阶广义差分的结果为:阶广义差分的结果为:取=5%,DWdu=1.66(样本容量:22)表明:广义差分模型已不存在序列相关性。(3.81)(18.45)(6.11)(-3.61)可以验证可以验证:仅采用1阶广义差分,变换后的模型仍存在1阶自相关性;采用3阶广义差分,变换后的模型不再有自相关性,但AR3的系数的t值不显著。