计量经济学-8-序列相关说课讲解.ppt
计量经济学-8-序列相关 一、序列相关的概念一、序列相关的概念 如果对于不同的样本点,随机误差项之间不再如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现是不相关的,而是存在某种相关性,则认为出现了了序列相关性序列相关性。对于模型 Yi=0+1X1i+2X2i+kXki+ui i=1,2,n随机项互不相关的基本假设表现为 Cov(ui,uj)=0 ij,i,j=1,2,n称为一阶序列相关一阶序列相关,或自相关自相关(autocorrelation)其中:被称为自自协协方方差差系系数数(coefficient of autocovariance)或一一阶阶自自相相关关系系数数(first-order coefficient of autocorrelation)i是满足以下标准的OLS假定的随机干扰项:如果仅存在 E(ui ui+1)0 i=1,2,n 自相关自相关往往可写成如下形式:ui=ui-1+i -11 由于序列相关性经常出现在以时间序列为样本的模型中,由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标因此,本节将用下标t代表代表i。二、序列相关性的来源二、序列相关性的来源 大多数经济时间数据都有一个明显的特点:惯性惯性,表现在时间序列不同时间的前后关联上。由于消费习惯消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关)。例,例,绝对收入假设绝对收入假设下居民总消费函数模型居民总消费函数模型:Ct=0+1Yt+ut t=1,2,n 1 1、经济变量固有的惯性、经济变量固有的惯性 2 2、模型设定的偏误、模型设定的偏误 所谓模型设定偏误设定偏误(Specification error)是指所设定的模型“不正确”。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。例如例如,本来应该估计的模型为 Yt=0+1X1t+2X2t+3X3t+ut但在模型设定中做了下述回归:Yt=0+1X1t+1X2t+vt因此,vt=3X3t+ut,如果X3确实影响Y,则出现序列相关。但建模时设立了如下模型:Yt=0+1Xt+vt 因此,由于vt=2Xt2+ut,,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。又如:如果真实的边际成本回归模型应为:Yt=0+1Xt+2Xt2+ut其中:Y=边际成本,X=产出,计量经济学模型一旦出现序列相关性,如果仍采用OLS法估计模型参数,回归系数的OLS估计量仍具有无偏性,但会产生下列不良后果:三、序列相关性的后果三、序列相关性的后果 1 1、参数估计量非有效、参数估计量非有效 因为,在有效性证明中利用了 E(UU)=2I 即同方差性和互相独立性条件。而且,在大样本情况下,参数估计量虽然具有参数估计量虽然具有一致性,但仍然不具有渐近有效性。一致性,但仍然不具有渐近有效性。2、变量的显著性检验失去意义、变量的显著性检验失去意义 在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。其他检验也是如此。3、模型的预测失效模型的预测失效 区间预测与参数估计量的方差有关,在区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准方差有偏误的情况下,使得预测估计不准确,预测精度降低。确,预测精度降低。所以,所以,当模型出现序列相关性时,它的当模型出现序列相关性时,它的预测功能失效。预测功能失效。然然后后,通过分析这些“近近似似估估计计量量”之间的相关性,以判断随机误差项是否具有序列相关性。序列相关性序列相关性检验方法有多种,但基本思路相同:检验方法有多种,但基本思路相同:基本思路基本思路:四、序列相关性的检验四、序列相关性的检验 1 1、图示法、图示法 2 2、回归检验法、回归检验法 如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。回归检验法回归检验法的优点优点是:(1)能够确定序列相关的形式,(2)适用于任何类型序列相关性问题的检验。3 3、杜宾、杜宾-瓦森(瓦森(Durbin-WatsonDurbin-Watson)检验法)检验法 D-W检检 验验 是是 杜杜 宾宾(J.Durbin)和和 瓦瓦 森森(G.S.(G.S.Watson)Watson)于于19511951年年提提出出的的一一种种检检验验序序列列自自相相关关的的方方法法,该方法的假定条件是该方法的假定条件是:(1)解释变量X非随机;(2)随机误差项ui为一阶自回归形式:ui=ui-1+i(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式:Yi=0+1X1i+kXki+Yi-1+ui(4)回归含有截距项 杜宾和瓦森针对原假设:H0:=0,即不存在一阶自回归,构如下造统计量:D.W.统计量统计量:当D.W.值在2左右时,模型不存在一阶自相关。证明:证明:展开D.W.统计量:(*)如果存在如果存在完全一阶正相关完全一阶正相关,即,即=1,则,则 D.W.0 完全一阶负相关完全一阶负相关,即,即=-1,则则 D.W.4 完全不相关完全不相关,即即=0,则,则 D.W.2这里,为一阶自回归模型 i=i-1+i 的参数估计。D.W检验步骤检验步骤:(1)计算DW值(2)给定,由n和k的大小查DW分布表,得临界值dL和dU(3)比较、判断 若 0D.W.dL 存在正自相关 dLD.W.dU 不能确定 dU D.W.4dU 无自相关 4dU D.W.4 dL 不能确定 4dL D.W.4 存在负自相关 0 dL dU 2 4-dU 4-dL 正相关不能确定无自相关不能确定负相关 4、拉格朗日乘数(、拉格朗日乘数(Lagrange multiplier)检验)检验 拉格朗日乘数检验克服了DW检验的缺陷,适合于高阶序列相关以及模型中存在滞后被解释变量的情形。它是由布劳殊(Breusch)与戈弗雷(Godfrey)于1978年提出的,也被称为GB检验检验。对于模型如果怀疑随机扰动项存在p阶序列相关阶序列相关:GB检验可用来检验如下受约束回归方程 约束条件为:H0:1=2=p=0约束条件H0为真时,大样本下其中,n为样本容量,R2为如下辅助回归的可决系数:给定,查临界值2(p),与LM值比较,做出判断,实际检验中,可从1阶、2阶、逐次向更高阶检验。如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型。最常用的方法是广义最小二乘法广义最小二乘法(GLS:Generalized least squares)和广义差分法广义差分法(Generalized Difference)。五、序列相关的修正五、序列相关的修正 1 1、广义最小二乘法、广义最小二乘法 对于模型 Y=X+如果存在序列相关,同时存在异方差,即有 是一对称正定矩阵,存在一可逆矩阵D,使得 =DD变换原模型:D-1Y=D-1X +D-1 即 Y*=X*+*(*)(*)式的OLS估计:这就是原模型的这就是原模型的广义最小二乘估计量广义最小二乘估计量(GLS estimators),是无偏的、有效的估计量。是无偏的、有效的估计量。该模型具有同方差性和随机误差项互相独立性该模型具有同方差性和随机误差项互相独立性:如何得到矩阵如何得到矩阵?对 的形式进行特殊设定后,才可得到其估计值。如设定随机扰动项为一阶序列相关形式 ui=ui-1+i 则 2 2、广义差分法、广义差分法 广广义义差差分分法法是将原模型变换为满足OLS法的差分模型,再进行OLS估计。如果原模型存在可以将原模型变换为:该模型为广义差分模型广义差分模型,不存在序列相关问题。可进行OLS估计。注意:广义差分法广义差分法就是上述广义最小二乘法广义最小二乘法,但是却损失了部分样本观测值。如:如:一阶序列相关的情况下,广义差分是估计这相当于去掉第一行后左乘原模型Y=X+。即运用了GLS法,但第一次观测值被排除了。2.2.随机误差项相关系数的估计(随机误差项相关系数的估计(未知)未知)应用广广义义最最小小二二乘乘法法或广广义义差差分分法法,必须已知随机误差项的相关系数1,2,L。实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。简单的方法有简单的方法有:(1)由)由DW-d统计量中估计统计量中估计(2)从)从OLS残差中估计残差中估计:较为复杂的方法 科克伦科克伦-奥科特奥科特(Cochrane-Orcutt)迭迭代法代法 杜宾杜宾(durbin)两步法两步法 (1)科克伦科克伦-奥科特迭代法奥科特迭代法。以一元线性模型为例:首先首先,采用OLS法估计原模型 Yi=0+1Xi+i得到的的“近似估计值”,并以之作为观测值使用OLS法估计下式 i=1i-1+2i-2+Li-L+i求出i新的“近拟估计值”,并以之作为样本观测值,再次估计 i=1i-1+2i-2+Li-L+i 类似地,可进行第三次、第四次迭代。类似地,可进行第三次、第四次迭代。关于迭代的次数,可根据具体的问题来定。一般是事先给出一个精度,当相邻两次1,2,L的估计值之差小于这一精度时,迭代终止。实践中,有时只要迭代两次,就可得到较满意的结果。两次迭代过程也被称为科科克伦克伦-奥科特两步法奥科特两步法。(2)杜宾)杜宾(durbin)两步法两步法 该方法仍是先估计该方法仍是先估计 1,2,l,再对差,再对差分模型进行估计分模型进行估计 第一步第一步,变换差分模型为下列形式进行OLS估计,得各Yj(j=i-1,i-2,i-l)前的系数1,2,l的估计值Eviews软件中的广义差分法软件中的广义差分法 在在Eviews软软件件包包下下,广广义义差差分分采采用用了了科科克克伦伦-奥奥科特(科特(Cochrane-Orcutt)迭代法估计)迭代法估计。在在解解释释变变量量中中引引入入AR(1)(1)、AR(2)(2)、,即即可可得得到参数和到参数和1、2、的估计值。的估计值。其其中中AR(m)表表示示随随机机误误差差项项的的m阶阶自自回回归归。在在估估计过程中自动完成了计过程中自动完成了1、2、的迭代。的迭代。如果能够找到一种方法,求得如果能够找到一种方法,求得或或各序列相关系各序列相关系数数j的估计量,使得的估计量,使得GLS能够实现,则称为能够实现,则称为可可行的广义最小二乘法行的广义最小二乘法(FGLS,Feasible Generalized Least Squares)。)。FGLS估计量估计量,也称为也称为可行的广义最小二乘估计可行的广义最小二乘估计量量(feasible general least squares estimators)可行的广义最小二乘估计量不再是无偏的,但可行的广义最小二乘估计量不再是无偏的,但却是一致的,而且在科克伦却是一致的,而且在科克伦-奥科特迭代法下,奥科特迭代法下,估计量也具有渐近有效性。估计量也具有渐近有效性。前面提出的方法,就是前面提出的方法,就是FGLS 注意:注意:4 4、虚假序列相关问题、虚假序列相关问题 由于随机项的序列相关往往是在模型设定中遗漏了重要的解释变量或对模型的函数形式设定有误,这种情形可称为虚假序列相关(false autocorrelation),应在模型设定中排除。避免产生虚假序列相关性的措施是在开始时建立一个“一般”的模型,然后逐渐剔除确实不显著的变量。六、案例六、案例 经济理论指出,商品进口商品进口主要由进口国的经经济发展水平济发展水平,以及商品进口价格指数商品进口价格指数与国内价格国内价格指数指数对比因素决定的。由于无法取得中国商品进口价格指数,我们主要研究中国商品进口与国内生产总值的关系。(下表)。案例案例1:中国商品进口模型中国商品进口模型1.通过通过OLS法建立如下中国商品进口方程:法建立如下中国商品进口方程:(2.32)(20.12)2.进行序列相关性检验。进行序列相关性检验。DW检验检验 取=5%,由于n=24,k=2(包含常数项),查表得:dl=1.27,du=1.45由于 DW=0.628 20.05(2)故:存在正自相关存在正自相关2 2阶滞后:阶滞后:3阶滞后:(0.22)(-0.497)(4.541)(-1.842)(0.087)R2=0.6615 于是,LM=210.6614=13.89取=5%,2分布的临界值20.05(3)=7.815 LM 20.05(3)表明:存在正自相关;但存在正自相关;但 t-3t-3的参数不显著,说的参数不显著,说明不存在明不存在3 3阶序列相关性。阶序列相关性。3、运用广义差分法进行自相关的处理、运用广义差分法进行自相关的处理(1)采用杜宾两步法估计)采用杜宾两步法估计 第一步第一步,估计模型(1.76)(6.64)(-1.76)(5.88)(-5.19)(5.30)第二步第二步,作差分变换:则则M*关于关于GDP*的的OLS估计结果为:估计结果为:(2.76)(16.46)取=5%,DWdu=1.43(样本容量24-2=22)表明:已不存在自相关于是原模型为:与与OLS估计结果的差别只在估计结果的差别只在截距项截距项:(2)采用科克伦)采用科克伦-奥科特迭代法估计奥科特迭代法估计 在在Eviews软包下,软包下,2阶广义差分的结果为:阶广义差分的结果为:取=5%,DWdu=1.66(样本容量:22)表明:广义差分模型已不存在序列相关性。(3.81)(18.45)(6.11)(-3.61)可以验证可以验证:仅采用1阶广义差分,变换后的模型仍存在1阶自相关性;采用3阶广义差分,变换后的模型不再有自相关性,但AR3的系数的t值不显著。案例案例2:天津市天津市城镇居民人均消费与人均可支配收入的关系。城镇居民人均消费与人均可支配收入的关系。改革开放以来,天津市改革开放以来,天津市城镇居民人均消费性支出(城镇居民人均消费性支出(CONSUM),人均),人均可支配收入(可支配收入(INCOME)以及消费价格定基指数()以及消费价格定基指数(PRICE)数据)数据(19782000年年)见表见表6.2。现在研究人均消费与人均可支配收入的关系。现在研究人均消费与人均可支配收入的关系。先定义不变价格(先定义不变价格(1978=1)的人均消费性支出()的人均消费性支出(Yt)和人均可支配收入)和人均可支配收入(Xt)。令)。令 Yt=CONSUM/PRICE,Xt=INCOME/PRICE假定所建立的回归模型形式是假定所建立的回归模型形式是Yt=0+1 Xt+ut Yt 和和 Xt 散点图散点图 残差图残差图(1)估计线性回归模型并计算残差。)估计线性回归模型并计算残差。=111.44+0.7118 Xt (6.5)(42.1)R2=0.9883,s.e.=32.8,DW=0.60,T=23(2)分别用)分别用DW、LM统计量检验误差项统计量检验误差项 ut是否存在自相关。是否存在自相关。已知已知DW=0.60,若给定,若给定 =0.05,查附表,查附表4,得,得DW检验临界值检验临界值dL=1.26,dU=1.44。因为因为 DW=0.60 1.26,认为误差项,认为误差项ut存在严重的正自相关。存在严重的正自相关。LM(BG)自相关检验辅助回归式估计结果是)自相关检验辅助回归式估计结果是 et=0.6790 et-1+3.1710 0.0047 Xt+vt (3.9)(0.2)(-0.4)R2=0.43,DW=2.00LM=T R2=23 0.43=9.89。因为因为 20.05(1)=3.84,LM=9.89 3.84,所以,所以LM检验检验结果也说明误差项存在一阶正自相关。结果也说明误差项存在一阶正自相关。EViews的的LM自相关检验操作:点击最小二乘回归窗口中的自相关检验操作:点击最小二乘回归窗口中的View键,选键,选Residual Tests/Serial Correlation LM Test,在随后弹出的滞后期对话框中给出最大滞后期。,在随后弹出的滞后期对话框中给出最大滞后期。点击点击OK键。键。注意:注意:(1)R2值有所下降。不应该不相信估计结果。原因是两个回归式所用变量值有所下降。不应该不相信估计结果。原因是两个回归式所用变量不同,所以不同,所以不可以直接比较确定系数不可以直接比较确定系数R2的值的值。(2)两种估计方法的回归系数有差别。计量经济理论认为回归系数)两种估计方法的回归系数有差别。计量经济理论认为回归系数广义最广义最小二乘估计量优于误差项存在自相关的小二乘估计量优于误差项存在自相关的OLS估计量估计量。所以。所以0.6782应该比应该比0.7118更可信。特别是最近几年,天津市城镇居民人均收入的人均消费边际更可信。特别是最近几年,天津市城镇居民人均收入的人均消费边际系数为系数为0.6782更可信。更可信。(3)用)用EViews生成新变量的方法生成新变量的方法:从工作文件主菜单中点击从工作文件主菜单中点击Quick键,选择键,选择Generate Series 功能。打开功能。打开生成序列(生成序列(Generate Series by Equation)对话框。在对话框中输入如)对话框。在对话框中输入如下命令(每次只能输入一个命令),下命令(每次只能输入一个命令),Y=CONSUM/PRICEX=INCOME/PRICE按按OK键。变量键。变量Y和和X将自动显示在工作文件中。将自动显示在工作文件中。案例案例3 3:天津市保费收入和人口的回归关系天津市保费收入和人口的回归关系 本案例主要用来展示当模型误差项存在本案例主要用来展示当模型误差项存在2阶自回归形式的自相关时,怎阶自回归形式的自相关时,怎样用广义差分法估计模型参数。样用广义差分法估计模型参数。19671998年天津市的保险费收入(年天津市的保险费收入(Yt,万元)和人口(,万元)和人口(Xt,万人)数,万人)数据散点图见图。据散点图见图。Yt与与Xt的变化呈指数关系。对的变化呈指数关系。对Yt取自然对数。取自然对数。LnYt与与Xt的散的散点图见图。点图见图。可以在可以在LnYt与与Xt之间建立线性回归模型。之间建立线性回归模型。LnYt=0+1 Xt+ut Yt和和Xt散点图散点图 LnYt和和Xt散点图散点图(第(第2版版181页)页)(第(第3版版155页)页)对残差序列的拟合发现,对残差序列的拟合发现,ut存在二阶自相关。回归式如下。存在二阶自相关。回归式如下。et=1.186 et-1-0.467 et-2+vt (6.9)(-2.5)R2=0.71,s.e.=0.19,DW=1.97 (1969-1998)误差项具有二阶自回归形式的自相关。误差项具有二阶自回归形式的自相关。(3)用广义差分法消除自相关。)用广义差分法消除自相关。首先推导二阶自相关首先推导二阶自相关ut=1ut 1+2ut 2+vt条件下的广义差分变换式。设模型为条件下的广义差分变换式。设模型为 LnYt=0+1 Xt+ut 写出上式的滞后写出上式的滞后1期、期、2期表达式并分别乘以期表达式并分别乘以 1、2,1 LnYt-1=1 0+1 1 Xt-1+1ut-1 2 LnYt-2=2 0+2 1Xt-2+2ut-2 用以上用以上3式做如下运算,式做如下运算,LnYt-1 LnYt-1-2 LnYt-2=0-1 0-2 0+1 Xt-1 1 Xt-1-2 1 Xt-2+ut-1ut-1-2ut-2将将2阶自相关关系式,阶自相关关系式,ut=1ut 1+2ut 2+vt,代入上式并整理,得,代入上式并整理,得 (LnYt-1 LnYt-1-2LnYt-2)=0(1-1-2)+1(Xt-1 Xt-1-2Xt-2)+vt 二阶广义差分变换应该是二阶广义差分变换应该是 GDLnYt=LnYt-1 LnYt-1-2LnYt-2 GDXt=Xt-1 Xt-1-2Xt-2 LnYt和和Xt的广义差分变换应该是的广义差分变换应该是 GDLnYt=LnYt-1.186 LnYt-1+0.467 LnYt-2 GDXt=Xt-1.186 Xt-1+0.467 Xt-2广义最小二乘回归结果是广义最小二乘回归结果是 =-3.246+0.0259 GDXt (-10.0)(17.9)R2=0.92,DW=1.99,(1969-1998)0=-3.246/(1-1-2)=-3.246/(1-1.186+0.467)=-11.55原模型的广义最小二乘估计结果是原模型的广义最小二乘估计结果是 LnYt=-11.55+0.0259 Xt 广义最小二乘估计值广义最小二乘估计值0.0259比最小二乘估计值比最小二乘估计值0.0254值可信。值可信。经济含义是每增加经济含义是每增加1万人,万人,LnYt增加增加0.0259,即保费增加,即保费增加1.0262万元。万元。小结一、序列相关的概念二、序列相关的来源 三、序列相关的后果四、序列相关的检验五、序列相关的修正六、案例此课件下载可自行编辑修改,仅供参考!此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢感谢您的支持,我们努力做得更好!谢谢