第6章 自相关.ppt
计量经济学基础计量经济学基础第六章第六章 自相关自相关12/27/20221经济贸易学院经济贸易学院 熊维勤熊维勤主要内容主要内容n第一节、非自第一节、非自相关假定相关假定n第二节、第二节、自相关的来源与自相关的来源与后果后果n第三节、自相关的检验第三节、自相关的检验n第四节、自相关的解决办法第四节、自相关的解决办法n第五节、自相关系数的估计第五节、自相关系数的估计n第六节、案例第六节、案例12/27/20222经济贸易学院经济贸易学院 熊维勤熊维勤 如果对于不同的样本点,随机误差项之间存在如果对于不同的样本点,随机误差项之间存在着某种相关性,则认为出现了着某种相关性,则认为出现了序列相关性,序列相关性,也就也就是存在着是存在着自相关自相关。即,。即,一、自相关的概念:一、自相关的概念:对于总体线性回归模型:对于总体线性回归模型:Yi=0+1X1i+2X2i+kXki+ui i=1,2,T随机误差项互不相关的基本假设表现为随机误差项互不相关的基本假设表现为 Cov(ui,uj)=0 i j,i,j=1,2,TCov(ui,uj)0 i j,i,j=1,2,T第一节第一节 非自相关假定非自相关假定12/27/20223经济贸易学院经济贸易学院 熊维勤熊维勤即因变量即因变量Yi的取值会对的取值会对Yj的取值产生影响。的取值产生影响。由于由于因此随机误差项存在序列相关性意味着:因此随机误差项存在序列相关性意味着:第一节第一节 非自相关假定非自相关假定12/27/20224经济贸易学院经济贸易学院 熊维勤熊维勤 (1 1)如果误差项只与其滞后一期的值相关,则称误差)如果误差项只与其滞后一期的值相关,则称误差项存在着项存在着一阶自相关一阶自相关。即:。即:二、自相关的分类二、自相关的分类n1、按自相关表现形式分类、按自相关表现形式分类(2 2)如果误差项与其滞后若干期(大于)如果误差项与其滞后若干期(大于1 1期)的值相关,期)的值相关,则误差项存在着则误差项存在着高阶自相关高阶自相关。即。即 :12/27/20225经济贸易学院经济贸易学院 熊维勤熊维勤计计量量经经济济学学中中最最常常见见的的自自相相关关形形式式为为一一阶阶线线性性自自回回归形式,归形式,即:即:ut=1 ut-1+vt其其中中,1称称为为自自回回归归系系数数;vt是是满满足足标标准准的的OLS假假定定的随机误差项:的随机误差项:二、自相关的分类二、自相关的分类12/27/20226经济贸易学院经济贸易学院 熊维勤熊维勤根据最小二乘原理和相关系数的定义根据最小二乘原理和相关系数的定义,可以得到可以得到:ut=ut-1+vt -11 即在大样本条件下,一阶自回归系数等于该二个变量的相关即在大样本条件下,一阶自回归系数等于该二个变量的相关系数。系数。由此,误差项的一阶线性自回归形式可写为,由此,误差项的一阶线性自回归形式可写为,二、自相关的分类二、自相关的分类12/27/20227经济贸易学院经济贸易学院 熊维勤熊维勤如如相关系数相关系数大于大于0,则称误差项存在着,则称误差项存在着正自相关正自相关;如如相关系数相关系数小于小于0,则称误差项存在着,则称误差项存在着负自相关负自相关。注意:注意:自相关自相关不是不是指两个或两个以上的变量之间指两个或两个以上的变量之间的相关关系,而是的相关关系,而是指一个变量前后期数值之间存指一个变量前后期数值之间存在的相关关系在的相关关系。二、自相关的分类二、自相关的分类n2、按相关系数大小分类、按相关系数大小分类12/27/20228经济贸易学院经济贸易学院 熊维勤熊维勤 第二节第二节 自相关的来源与后果自相关的来源与后果 大多数经济时间序列数据都有一个明显的特点大多数经济时间序列数据都有一个明显的特点惯性惯性,表现为滞后值对本期值具有影响。,表现为滞后值对本期值具有影响。例例如如:GDP、价价格格指指数数、生生产产、就就业业与与失失业业等等时时间间序序列列都都呈呈周周期期性性,如如周周期期中中的的复复苏苏阶阶段段,大大多多数数经经济济序序列列均均呈呈上上升升势势,序序列列在在每每一一时时刻刻的的值值都都高高于于前前一一时时刻刻的的值值,似似乎乎有有一一种种内内在在的的动动力力驱驱使使这这一一势势头头继继续续下下去去,直直至至某某些些情情况况(如利率或课税的升高)出现才把它拖慢下来。(如利率或课税的升高)出现才把它拖慢下来。1、经济变量固有的惯性、经济变量固有的惯性n一、自相关的来源一、自相关的来源12/27/20229经济贸易学院经济贸易学院 熊维勤熊维勤2、模型设定的偏误、模型设定的偏误 所谓模型所谓模型设定偏误设定偏误(Specification error)是指所设是指所设定的模型定的模型“不正确不正确”。主要表现在模型中丢掉了重主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误要的解释变量或模型函数形式有偏误。例如例如,本来应该估计的模型为,本来应该估计的模型为 Yt=0+1X1t+2X2t+3X3t+ut 但在模型设定中做了下述回归:但在模型设定中做了下述回归:Yt=0+1X1t+1X2t+vt因此,因此,vt=3X3t+ut,如果如果X3确实影响确实影响Y,则则随机误差项随机误差项中有一个重要的系统性影响因素,使其呈序列相关性。中有一个重要的系统性影响因素,使其呈序列相关性。12/27/202210经济贸易学院经济贸易学院 熊维勤熊维勤3、数据的、数据的“加工整理加工整理”例如:例如:季度数据来自月度数据的简单平均,这种平均季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动而引进了数据中的的计算减弱了每月数据的波动而引进了数据中的平滑性平滑性平滑性平滑性,这种平滑性本身就能使干扰项中出现系统性的因素,从这种平滑性本身就能使干扰项中出现系统性的因素,从而出现序列相关。而出现序列相关。还有就是两个时间点之间的还有就是两个时间点之间的“内插内插”技术技术往往导致随往往导致随机项的序列相关性。机项的序列相关性。在实际经济问题中,有些数据是通过已知数据生在实际经济问题中,有些数据是通过已知数据生成的。因此,新生成的数据与原数据间就有了内成的。因此,新生成的数据与原数据间就有了内在的联系,从而表现出序列相关性。在的联系,从而表现出序列相关性。12/27/202211经济贸易学院经济贸易学院 熊维勤熊维勤4、蛛网现象、蛛网现象 例例如如,农农产产品品供供给给对对价价格格的的反反映映本本身身存存在在一一个个滞后期:滞后期:St=0+1Pt-1+ut意意味味着着,农农民民由由于于在在年年度度t的的过过量量生生产产(使使该该期期价价格格下下降降)很很可可能能导导致致在在年年度度t+1时时削削减减产产量量,因因此此不不能能期期望望随随机机干干扰扰项项是是随随机机的的,往往往往产产生生一一种种蛛网模式。蛛网模式。12/27/202212经济贸易学院经济贸易学院 熊维勤熊维勤一般经验一般经验一般经验告诉我们,对于采用时间序列数据的计量一般经验告诉我们,对于采用时间序列数据的计量经济模型,由于不同样本点上随机误差项在经济模型,由于不同样本点上随机误差项在时间上时间上时间上时间上是连续的是连续的是连续的是连续的,因此它们对被解释变量的影响也存在连,因此它们对被解释变量的影响也存在连续性,所以往往会存在序列相关性。续性,所以往往会存在序列相关性。需要注意的是:在截面数据中也可能产生序列相关需要注意的是:在截面数据中也可能产生序列相关性(截面数据中的序列相关常称为性(截面数据中的序列相关常称为空间相关空间相关)。例)。例如在研究家庭收入与消费的关系中,家庭之间的消如在研究家庭收入与消费的关系中,家庭之间的消费攀比就可能产生空间相关现象。费攀比就可能产生空间相关现象。12/27/202213经济贸易学院经济贸易学院 熊维勤熊维勤n二、自相关存在的后果二、自相关存在的后果1、参数的、参数的OLS估计量仍然具有无偏性和线性性估计量仍然具有无偏性和线性性2、参数的、参数的OLS估计量不再具有最小方差性。估计量不再具有最小方差性。当存在正自当存在正自相关性时,相关性时,OLS估计会低估参数估计估计会低估参数估计量的真实方差量的真实方差;这就意味着这就意味着在变量的显著性检验中,当存在正序列相关在变量的显著性检验中,当存在正序列相关时,由时,由OLS估计得到的参数方差可能低于真实方差,从而估计得到的参数方差可能低于真实方差,从而导致导致t统计量值变大,拒绝原假设统计量值变大,拒绝原假设 i=0的可能性增加,因此的可能性增加,因此t检验失去意义;同时,参数的区间估计也不再准确。检验失去意义;同时,参数的区间估计也不再准确。3、可能低估随机误差项、可能低估随机误差项ui的方差,从而导致模型预测失的方差,从而导致模型预测失效效 第二节第二节 自相关的来源与后果自相关的来源与后果 12/27/202214经济贸易学院经济贸易学院 熊维勤熊维勤n基本思路基本思路序列相关性检验方法有多种,但基本思路和步序列相关性检验方法有多种,但基本思路和步骤是相同的。骤是相同的。首先采用普通最小二乘法估计模型,以求得随首先采用普通最小二乘法估计模型,以求得随机误差项机误差项ui的的“近似估计量近似估计量”:然后,通过分析这些然后,通过分析这些“近似估计量近似估计量”之间的相之间的相关性,以达到判断随机误差项是否具有序列相关性,以达到判断随机误差项是否具有序列相关性的目的。关性的目的。第三节第三节 自相关的检验自相关的检验 12/27/202215经济贸易学院经济贸易学院 熊维勤熊维勤1、图示法、图示法由于残差项由于残差项ei可以作为随机误差项可以作为随机误差项ui的近的近似估计,因此如果似估计,因此如果ui存在序列相关,必存在序列相关,必然由残差项然由残差项ei反映出来。因此可利用反映出来。因此可利用ei的的变化图来判断随机误差项变化图来判断随机误差项ui的序列相关的序列相关性。性。第三节第三节 自相关的检验自相关的检验 12/27/202216经济贸易学院经济贸易学院 熊维勤熊维勤12/27/202217经济贸易学院经济贸易学院 熊维勤熊维勤2、德宾、德宾-沃森(沃森(Durbin-Watson)检验法检验法n D-W检检验验是是德德宾宾(J.Durbin)和和沃沃森森(G.S.Watson)于于19511951年年提提出出的的一一种种检检验验序序列列自自相相关关的的方方法法。(使使使使用用用用范范范范围围围围:一一一一阶阶阶阶自自自自相关相关相关相关)(1)解释变量)解释变量 X非随机,或者在重复抽样中被固定;非随机,或者在重复抽样中被固定;(2)随机误差项)随机误差项ui为一阶自回归形式:为一阶自回归形式:ui=ui-1+i(3)回回归归模模型型中中不不不不应应应应含含含含有有有有滞滞滞滞后后后后被被被被解解解解释释释释变变变变量量量量作作为为解解释释变变量量,即即不不应出现下列形式:应出现下列形式:Yi=0+1X1i+kXki+Y Yi-1i-1+ui(4)回归含有截距项;回归含有截距项;(5)没有缺失数据。)没有缺失数据。该方法的适用条件是该方法的适用条件是:12/27/202218经济贸易学院经济贸易学院 熊维勤熊维勤2、德宾、德宾-沃森(沃森(Durbin-Watson)检验法检验法1 1、确定检验假设、确定检验假设2 2、构造统计量、构造统计量n该统计量该统计量的分布与出现在给定样本中的的分布与出现在给定样本中的X值有复杂的关值有复杂的关系,因此其系,因此其精确的分布很难得到精确的分布很难得到。n但是但是,Durbin和和Watson成功地导出了临界值的下限成功地导出了临界值的下限dL和上限和上限dU,且这些上下限只与样本的容量且这些上下限只与样本的容量n和解释变量和解释变量的个数的个数k有关,而与解释变量有关,而与解释变量X的取值无关。的取值无关。12/27/202219经济贸易学院经济贸易学院 熊维勤熊维勤计算计算D.W.统计量的值,统计量的值,根据样本容量根据样本容量n和解释变量数目和解释变量数目k查查D.W.分布表,分布表,得到临界值得到临界值dL和和dU,按照下列准则考察计算得到的按照下列准则考察计算得到的D.W.值,以判断随值,以判断随机误差项是否存在一阶自相关。机误差项是否存在一阶自相关。2、德宾、德宾-沃森(沃森(Durbin-Watson)检验法检验法3 3、进行、进行DWDW检验检验12/27/202220经济贸易学院经济贸易学院 熊维勤熊维勤DW检验决策规则检验决策规则误差项误差项 间存在间存在负相关负相关不能判定是否有自相关不能判定是否有自相关误差项误差项 间间无自相关无自相关不能判定是否有自相关不能判定是否有自相关误差项误差项 间存在间存在正相关正相关 12/27/202221经济贸易学院经济贸易学院 熊维勤熊维勤用坐标图更直观表示用坐标图更直观表示DW检验规则检验规则:不不能能确确定定正正自自相相关关无无自自相相关关不不能能确确定定负负自自相相关关4212/27/202222经济贸易学院经济贸易学院 熊维勤熊维勤容易证明,容易证明,当当D.W.D.W.值在值在值在值在2 2左右左右左右左右时,模型不存在一时,模型不存在一阶自相关。阶自相关。2、德宾、德宾-沃森(沃森(Durbin-Watson)检验法检验法12/27/202223经济贸易学院经济贸易学院 熊维勤熊维勤如果存在完全一阶正相关,即如果存在完全一阶正相关,即 =1,则则 D.W.0 如果存在完全一阶负相关,即如果存在完全一阶负相关,即 =-1,则则 D.W.4如果完全不相关,即如果完全不相关,即 =0,则则 D.W.22、德宾、德宾-沃森(沃森(Durbin-Watson)检验法检验法12/27/202224经济贸易学院经济贸易学院 熊维勤熊维勤注意:注意:(1)从从判判断断准准则则看看到到,存存在在一一个个不不能能确确定定的的D.W.值值区区域域,这是这种检验方法的一大缺陷。这是这种检验方法的一大缺陷。(2)D.W.检检验验虽虽然然只只能能检检验验一一阶阶自自相相关关,但但在在实实际际计计量量经济学问题中,一阶自相关是出现最多的一类序列相关;经济学问题中,一阶自相关是出现最多的一类序列相关;(3)经经验验表表明明,如如果果不不存存在在一一阶阶自自相相关关,一一般般也也不不存存在在高阶序列相关。高阶序列相关。所所以以在在实实际际应应用用中中,对对于于序序列列相相关关问问题题一一般般只只进进行行D.W.检检验。验。2、德宾、德宾-沃森(沃森(Durbin-Watson)检验法检验法12/27/202225经济贸易学院经济贸易学院 熊维勤熊维勤3、LM检验(或检验(或BG检验)检验)n此方法不仅适用于一阶自相关检验,也适用于高阶自相关此方法不仅适用于一阶自相关检验,也适用于高阶自相关的检验。的检验。n检验步骤:检验步骤:1、用、用OLS对回归模型进行,得到残差序列对回归模型进行,得到残差序列et;2、运用残差序列和样本观测值中的解释变量,建立如下、运用残差序列和样本观测值中的解释变量,建立如下辅助回归模型并进行辅助回归模型并进行OLS估计,得到样本可决系数估计,得到样本可决系数R2;LM检验的检验假设为:检验的检验假设为:12/27/202226经济贸易学院经济贸易学院 熊维勤熊维勤3、构造、构造LM统计量:统计量:4、查分布表,求得临界值:、查分布表,求得临界值:3、LM检验(或检验(或BG检验)检验)12/27/202227经济贸易学院经济贸易学院 熊维勤熊维勤 4、回归检验法、回归检验法 1、用原始样本数据进行、用原始样本数据进行OLS回归,得到残差序列回归,得到残差序列et2、以、以et为被解释变量,以各种可能的相关量,如为被解释变量,以各种可能的相关量,如et1、et2、(et1)2等为解释变量,进行多种形式的辅助回等为解释变量,进行多种形式的辅助回归:归:12/27/202228经济贸易学院经济贸易学院 熊维勤熊维勤 4、回归检验法、回归检验法 如果存在某一种函数形式,使得估计参数具有显如果存在某一种函数形式,使得估计参数具有显著性,则说明随机误差项存在该种形式的序列相著性,则说明随机误差项存在该种形式的序列相关性。关性。回归检验法的回归检验法的优点优点是:是:(1)能够确定序列相关能够确定序列相关的形式,(的形式,(2)适用于任何类型序列相关性问题)适用于任何类型序列相关性问题的检验。的检验。缺点缺点是计算量大。是计算量大。12/27/202229经济贸易学院经济贸易学院 熊维勤熊维勤 如果随机误差项被检验证明存在序列相关性,首如果随机误差项被检验证明存在序列相关性,首先应分析产生自相关的原因,如果是由于模型设定先应分析产生自相关的原因,如果是由于模型设定偏误,则应修改模型的数学形式。偏误,则应修改模型的数学形式。怎样查明自相关是由模型设定偏误引起的?一种怎样查明自相关是由模型设定偏误引起的?一种方法是用残差方法是用残差et对解释变量进行较高次幂回归,然后对解释变量进行较高次幂回归,然后对新残差作对新残差作DW检验,如果此时自相关消失,则说检验,如果此时自相关消失,则说明模型设定存在偏误。明模型设定存在偏误。第四节自相关的解决方法第四节自相关的解决方法 12/27/202230经济贸易学院经济贸易学院 熊维勤熊维勤 如果模型产生自相关的原因是模型中省略了重如果模型产生自相关的原因是模型中省略了重要解释变量,则解决方法就是找出被省略了的解释要解释变量,则解决方法就是找出被省略了的解释变量,将其作为解释变量列入模型。变量,将其作为解释变量列入模型。怎样查明此种自相关?一种方法是用残差怎样查明此种自相关?一种方法是用残差et对那对那些可能影响被解释变量而未被列入模型的解释变量些可能影响被解释变量而未被列入模型的解释变量进行回归,并作显著性检验,从而确定该解释变量进行回归,并作显著性检验,从而确定该解释变量的重要性。的重要性。第四节自相关的解决方法第四节自相关的解决方法 12/27/202231经济贸易学院经济贸易学院 熊维勤熊维勤 只有当上两种引起自相关的原因都消除以后,才能认为只有当上两种引起自相关的原因都消除以后,才能认为随机误差项随机误差项“真正真正”存在自相关,此时需要对原模型进行存在自相关,此时需要对原模型进行变换,使变换以后的模型的的随机误差项自相关得以消除,变换,使变换以后的模型的的随机误差项自相关得以消除,进而利用普通最小二乘法估计回归参数进而利用普通最小二乘法估计回归参数 最常用的方法是最常用的方法是广义最小二乘法广义最小二乘法(GLS:Generalized least squares),这种方法是对原模型进行适当变换以消除误差项),这种方法是对原模型进行适当变换以消除误差项的自相关,进而利用的自相关,进而利用OLS来估计回归参数,相应的回归参数来估计回归参数,相应的回归参数估计结果称为估计结果称为广义最小二乘估计量。广义最小二乘估计量。第四节自相关的解决方法第四节自相关的解决方法 12/27/202232经济贸易学院经济贸易学院 熊维勤熊维勤对于多元线性回归模型,如果随机误差项存在一阶自相关,对于多元线性回归模型,如果随机误差项存在一阶自相关,则可以按照如下思路来矫正自相关对模型估计结果的影响。则可以按照如下思路来矫正自相关对模型估计结果的影响。GLSGLS的基本原理:的基本原理:上述过程中的变量变换称为上述过程中的变量变换称为广义差分变换广义差分变换,对变换后的模,对变换后的模型即可进行型即可进行OLS估计,相应的回归参数估计估计量称为估计,相应的回归参数估计估计量称为广广义最小二乘估计量义最小二乘估计量。12/27/202233经济贸易学院经济贸易学院 熊维勤熊维勤 注意:注意:上述广义差分变换使得样本观测值由上述广义差分变换使得样本观测值由T个减少为个减少为T个,为个,为了弥补这一缺陷,通常在变换后的模型估计过程中,加入下了弥补这一缺陷,通常在变换后的模型估计过程中,加入下述观测值。述观测值。当误差项存在高阶自相关时,可以按照同样的方法进当误差项存在高阶自相关时,可以按照同样的方法进行广义差分变换,然后运用行广义差分变换,然后运用OLS估计各个回归参数值。估计各个回归参数值。如果广义差分变量回归结果中仍然存在自相关,则可如果广义差分变量回归结果中仍然存在自相关,则可以对广义差分变量再进行广义差分,直到消除误差项的自以对广义差分变量再进行广义差分,直到消除误差项的自相关为止。相关为止。12/27/202234经济贸易学院经济贸易学院 熊维勤熊维勤 第五节随机误差项相关系数的估计第五节随机误差项相关系数的估计 应应用用广广义义最最小小二二乘乘法法或或广广义义差差分分法法,必必须须已已知知随随机机误误差差项项的相关系数的相关系数 1,2,n。实实际际上上,人人们们并并不不知知道道它它们们的的具具体体数数值值,所所以以必必须须首首先先对对它们进行估计。它们进行估计。常用的估计方法有:常用的估计方法有:根据根据DW值计算和根据德宾两步法计算值计算和根据德宾两步法计算12/27/202235经济贸易学院经济贸易学院 熊维勤熊维勤一、根据一、根据DW值来计算值来计算二、德宾两步法(以一阶自相关为例)二、德宾两步法(以一阶自相关为例)第一步第一步,变换差分模型为下列形式,变换差分模型为下列形式进行进行OLS估计,得到估计,得到Yt-1前的系数前的系数 的估计值的估计值第二步第二步,将得到的自相关系数的估计值代入原广义,将得到的自相关系数的估计值代入原广义差模型,即可运用差模型,即可运用OLS估计得到各个估计得到各个GLS估计量。估计量。12/27/202236经济贸易学院经济贸易学院 熊维勤熊维勤附:应用软件中的广义差分法附:应用软件中的广义差分法n注意,上面两种方法给出的都只是注意,上面两种方法给出的都只是的近似估计,的近似估计,精确的估计要使用精确的估计要使用科克伦科克伦-奥科特(奥科特(Cochrane-Orcutt)迭代法。)迭代法。nEview提供了科提供了科-奥迭代法进行自相关修正的软件实奥迭代法进行自相关修正的软件实现。具体方法是:在解释变量中引入现。具体方法是:在解释变量中引入AR(1)、AR(2)、,即可得到参数和即可得到参数和1、2、的估计值。其中的估计值。其中AR(m)表示随机误差项的表示随机误差项的m阶自回归。在估计过程阶自回归。在估计过程中自动完成了中自动完成了1、2、的迭代。的迭代。12/27/202237经济贸易学院经济贸易学院 熊维勤熊维勤