《序列相关性自相关讲稿.ppt》由会员分享,可在线阅读,更多相关《序列相关性自相关讲稿.ppt(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、序列相关性自相关第一页,讲稿共五十四页哦一、序列相关的概念n序列相关的含义序列相关的含义n在古典线性回归模型中,我们假定随机误差项序列的各项之间独立,即Cov(i,j)=E(ij)=0。n任一次观测的干扰项都不受任何其他观测的任一次观测的干扰项都不受任何其他观测的干扰项影响干扰项影响n例:上月某个特殊事件对家庭消费支出产生例:上月某个特殊事件对家庭消费支出产生的影响不会波及到本月的消费支出。的影响不会波及到本月的消费支出。n如果上述假定不满足,则称之为序列相关,即:Cov(i,j)=E(ij)0第二页,讲稿共五十四页哦称称 为为一 阶 序 列 相 关,或或 自 相 关(autocorrelat
2、ion)其 中:被 称 为自自 协协 方方 差差 系系 数数(coefficient of autocovariance)或一一 阶阶 自自 相相 关关 系系 数数(first-order coefficient of autocorrelation)i是满足以下标准的OLS假定的随机干扰项:如果仅存在 E(i i-1)0 i=1,2,n 自相关自相关往往可写成如下形式:i=i-1+i -11 由于序列相关性经常出现在以时间序列为样本的模型中,因由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标此,本节将用下标t代表代表i。第三页,讲稿共五十四页哦二、序列相关产生的原因n惯性
3、:如GNP、价格指数、生产、失业等时间序列都呈现商业循环,相继的观测值很可能是相依赖的。n设定偏误:不正确的函数形式或应含而未含变量都会使干扰中观察到序列相关性。第四页,讲稿共五十四页哦序列相关产生的原因(续)n蛛网现象:许多农产品的供给表现出一种所谓的蛛网现象n例如供给对价格的反应要滞后一个时期,即今年例如供给对价格的反应要滞后一个时期,即今年作物的种植量是受去年流行的价格影响的,因此,作物的种植量是受去年流行的价格影响的,因此,相关的函数形式是:相关的函数形式是:这种现象就不能期望扰动项是随机的第五页,讲稿共五十四页哦 计量经济学模型一旦出现序列相关性,如果仍采用OLS法估计模型参数,则O
4、LS估计量仍然是现性无偏估计量,但是会产生下列不良后果:三、序列相关性的后果三、序列相关性的后果 1 1、参数估计量非有效、参数估计量非有效 因为,在有效性证明中利用了 E(NN)=2I 即同方差性和无序列相关假设。第六页,讲稿共五十四页哦 2、变量的显著性检验失去意义、变量的显著性检验失去意义 在变量的显著性检验中,统计量是建立在参数方差正在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性确估计基础之上的,这只有当随机误差项具有同方差性和无序列相关时才能成立。和无序列相关时才能成立。如果存在序列相关,参数估计量的方差出现偏误(偏大或偏小),t检验就
5、失去意义。其他检验也是如此。第七页,讲稿共五十四页哦 3、模型的预测失效模型的预测失效 区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。所以,当模型出现序列相关性时,它的预测功能失效。第八页,讲稿共五十四页哦 然后,通通过过分分析析这这些些“近似估计量”之之间间的的相相关关性性,以判断随机误差项是否具有序列相关性。以判断随机误差项是否具有序列相关性。序列相关性序列相关性检验方法有多种,但基本思路相同:检验方法有多种,但基本思路相同:基本思路基本思路:四、序列相关性的检验四、序列相关性的检验首先首先,采用OLS法估计模型,得到残差作为随机误差项的估计。第九
6、页,讲稿共五十四页哦1。图解法:n时间序列图(时间序列图(Time Sequence plot):将残差对时间描点。如将残差对时间描点。如图(图(a)所示,扰动项的估计值呈循环形,并不频繁地改)所示,扰动项的估计值呈循环形,并不频繁地改变符号,而是相继若干个正的以后跟着几个负的,表明变符号,而是相继若干个正的以后跟着几个负的,表明存在正自相关。存在正自相关。n将将et对对et-1描点图,如图(描点图,如图(b)所示。)所示。t(a)etetet-1(b)第十页,讲稿共五十四页哦(c)如(如(c)图所示,扰动项的估计值呈锯齿状,随时间)图所示,扰动项的估计值呈锯齿状,随时间逐次改变符号,表明存在
7、负相关。逐次改变符号,表明存在负相关。t第十一页,讲稿共五十四页哦2 2、杜宾、杜宾-瓦森(瓦森(Durbin-WatsonDurbin-Watson)检验法)检验法 D-W检验是杜宾(J.Durbin)和瓦森(G.S.Watson)于1951年提出的一种检验序列自相关的方法,该方法的假定条件是:(1)解释变量X非随机;(2)随机误差项t为一阶自回归形式:t=t-1+t(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式:Yt=0+1X1t+kXkt+Yt-1+t(4)回归含有截距项第十二页,讲稿共五十四页哦 该统计量该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精确
8、的分布很难得到精确的分布很难得到。但是但是,他们成功地导出了临界值的下限dL和上限dU,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。杜宾和瓦森针对原假设:H0:=0,即不存在一阶自回归,构如下造统计量:D.W.统计量统计量:第十三页,讲稿共五十四页哦dL244-dL0dU4-dU正相关无自相关负相关d不确定不确定 D.W检验步骤检验步骤:(1)计算DW值(2)给定,由n和k的大小查DW分布表,得临界值dL和dU(3)比较、判断 若 0D.W.dL 存在正自相关 dLD.W.dU 不能确定 dU D.W.4dU 无自相关 4dU D.W.4 dL 不能确定 4d
9、L D.W.4 存在负自相关 第十四页,讲稿共五十四页哦 当D.W.值在2左右时,模型不存在一阶自相关。证明:证明:展开D.W.统计量:(*)第十五页,讲稿共五十四页哦如果存在如果存在完全一阶正相关完全一阶正相关,即,即=1,则,则 D.W.0 完全一阶负相关完全一阶负相关,即,即=-1,则则 D.W.4 完全不相关完全不相关,即即=0,则,则 D.W.2这里,为一阶自回归模型 i=i-1+i 的参数估计。第十六页,讲稿共五十四页哦 3 3、回归检验法、回归检验法 如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。回归检验法回归检验法的优点优点是:(1)能够确定序列相关的形
10、式,(2)适用于任何类型序列相关性问题的检验。第十七页,讲稿共五十四页哦 4、高阶自相关的BG检验 拉格朗日乘数检验克服了DW检验的缺陷,适合于高阶序列相关以及模型中存在滞后被解释变量的情形。它是由布劳殊(Breusch)与戈弗雷(Godfrey)于1978年提出的,也被称为BG检验检验。对于模型如果怀疑随机扰动项存在p阶序列相关阶序列相关:第十八页,讲稿共五十四页哦则可按如下步骤最检验:OLS估计原模型并得到残差et 做et对模型中全部回归元和附加回归元et-1,et-2,et-p的回归,得到R2。原假设H0:1=2=p=0H0为真时,大样本下给定,查临界值2(p),与LM值比较,做出判断,
11、实际检验中,可从1阶、2阶、逐次向更高阶检验。第十九页,讲稿共五十四页哦五、序列相关的修正n自相关结构已知时的修正自相关结构已知时的修正广义差分法广义差分法 广义差分法是是将将原原模模型型变变换换为为满满足足OLS法法的的差差分分模模型,再进行型,再进行OLS估计。估计。第二十页,讲稿共五十四页哦t遵循0均值、同方差、无序列相关的各条OLS假定广义差分方程,失去一次观测第二十一页,讲稿共五十四页哦更一般地,如果原模型存在则可以将原模型变换为:该模型为广义差分模型广义差分模型,不存在序列相关问题。可进行OLS估计。第二十二页,讲稿共五十四页哦未知时序列相关的修正应用广义差分法,必须已知随机误差项
12、的相关系数1,2,p。实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。n(1)用)用DW统计量估计统计量估计 第二十三页,讲稿共五十四页哦(2)科克伦-奥克特两步法n做原模型的做原模型的OLS估计,得到残差估计,得到残差etn做回归:做回归:估计估计 n用用 作广义差分方程的回归,求回归系作广义差分方程的回归,求回归系数。数。第二十四页,讲稿共五十四页哦(3)德宾两步法n将广义差分方程写为:n将上式看作一复回归模型,求将上式看作一复回归模型,求Yt对对Xt,Xt-1和和Yt-1的回的回归,并把对归,并把对Yt-1的回归系数的估计值(的回归系数的估计值()看作对)看作对 的的一个
13、估计。虽然这个估计值有偏误,它却是一个估计。虽然这个估计值有偏误,它却是 的一个一的一个一致性估计。致性估计。n求得求得 后,把变量换为后,把变量换为 对转换变量形成的广义差分方程做对转换变量形成的广义差分方程做OLS估计。估计。第二十五页,讲稿共五十四页哦虚假序列相关问题虚假序列相关问题 由于随机项的序列相关往往是在模型设定中遗漏了重要的解释变量或对模型的函数形式设定有误,这种情形可称为虚假序列相关(false autocorrelation),应在模型设定中排除。避免产生虚假序列相关性的措施是在开始时建立一个“一般”的模型,然后逐渐剔除确实不显著的变量。第二十六页,讲稿共五十四页哦例1 美
14、国零工招聘指数与失业率n数据如表。回归模型设为:数据如表。回归模型设为:n其中:其中:HWI:零工招聘指数,零工招聘指数,U:失业率失业率先验符号?查表,N=24,一个解释变量,5%的DW临界值:dL=1.27,dU=1.45,0d=0.911 dL,正序列相关第二十七页,讲稿共五十四页哦第二十八页,讲稿共五十四页哦例1 美国零工招聘指数与失业率n序列相关修正,估计序列相关修正,估计 n用DW统计量估计n科克伦-奥克特两步法n德宾两步法n科科-奥两步法结果:奥两步法结果:一般对大样本来说,用哪种方法区别不大。但是对小样本则不同。而且没有一种方法总是优于其他方法。科-奥两步法较常用。最终最终最终
15、最终结果结果结果结果比较比较比较比较第二十九页,讲稿共五十四页哦例2我国1980-2001年发电量与GDP对数模型lnqi=0+1lnxi+i存在序列相关存在序列相关第三十页,讲稿共五十四页哦BG检验:检验:LM第三十一页,讲稿共五十四页哦序列相关修正序列相关修正系数均显著,存在序列相关第三十二页,讲稿共五十四页哦第三十三页,讲稿共五十四页哦六、案例:中国商品进口模型六、案例:中国商品进口模型 经济理论指出,商品进口商品进口主要由进口国的经济发经济发展水平展水平,以及商品进口价格指数商品进口价格指数与国内价格指数国内价格指数对比因素决定的。由于无法取得中国商品进口价格指数,我们主要研究中国商品
16、进口与国内生产总值的关系。(下表)。第三十四页,讲稿共五十四页哦第三十五页,讲稿共五十四页哦1.通过通过OLS法建立如下中国商品进口方程:法建立如下中国商品进口方程:t (3.32)(20.12)第三十六页,讲稿共五十四页哦 2.进行序列相关性检验。DW检验检验 取=5%,由于n=24,k=2(包含常数项),查表得:dl=1.27,du=1.45由于 DW=0.628 20.05(2)故:存在正自相关存在正自相关2 2阶滞后:阶滞后:BG检验检验第三十九页,讲稿共五十四页哦3阶滞后:于是,LM=210.68=14.28取=5%,2分布的临界值20.05(3)=7.815 LM 20.05(3)
17、表明:存在正自相关;但存在正自相关;但 t-3t-3的参数不显著,说明的参数不显著,说明不存在不存在3 3阶序列相关性。阶序列相关性。第四十页,讲稿共五十四页哦 3、运用广义差分法进行自相关的处理、运用广义差分法进行自相关的处理(1)采用杜宾两步法估计)采用杜宾两步法估计 第一步第一步,估计模型 t(1.76)(6.64)(-1.76)(5.88)(-5.19)(5.30)第二步第二步,作差分变换:D.W.=2.307 R2=0.991第四十一页,讲稿共五十四页哦则则M*关于关于GDP*的的OLS估计结果为:估计结果为:(2.76)(16.46)取=5%,DWdu=1.43(样本容量24-2=
18、22)表明:已不存在自相关于是原模型为:与与OLS估计结果的差别只在估计结果的差别只在截距项截距项:第四十二页,讲稿共五十四页哦(2)采用科克伦)采用科克伦-奥科特迭代法估计奥科特迭代法估计 取=5%,DWdu=1.66(样本容量:22)表明:广义差分模型已不存在序列相关性。可以验证可以验证:仅采用1阶广义差分,变换后的模型仍存在1阶自相关性;采用3阶广义差分,变换后的模型不再有自相关性,但AR3的系数的t值不显著。第四十三页,讲稿共五十四页哦单方程小结 多元回归模型n多元回归模型描述了被解释变量与诸解释变多元回归模型描述了被解释变量与诸解释变量的依赖关系量的依赖关系n偏回归系数偏回归系数 i
19、表示其它解释变量不变的条件表示其它解释变量不变的条件下,第下,第i个解释变量变化对被解释变量的个解释变量变化对被解释变量的“净净”影响。影响。n偏回归系数的估计方法:最小二乘估计偏回归系数的估计方法:最小二乘估计n当经典假设满足时,OLS估计量为最优线性无偏估计量第四十四页,讲稿共五十四页哦多元回归模型的建模过程n明确所研究的问题,确定因变量明确所研究的问题,确定因变量n通过定性分析,找到导致因变量变化的通过定性分析,找到导致因变量变化的主要影响因素,作为解释变量主要影响因素,作为解释变量n收集数据,整理数据,数据的初步分析收集数据,整理数据,数据的初步分析n分析因变量与各解释变量间关系的性质
20、,确定模型的函数形式n建立计量模型,确定各偏回归系数的先建立计量模型,确定各偏回归系数的先验符号验符号第四十五页,讲稿共五十四页哦多元回归模型的建模过程(续)n用用OLS估计模型的参数,并作各种检验估计模型的参数,并作各种检验n经济意义检验:各偏回归系数的符号是否与预期一致n经典假设检验:多重共线、异方差、序列相关n如果存在异方差如果存在异方差/序列相关,统计检验无效序列相关,统计检验无效n统计检验:t检验,F检验,判定系数n筛选完善模型:设定偏误问题筛选完善模型:设定偏误问题n模型的应用:预测、结构分析、政策建议模型的应用:预测、结构分析、政策建议n注意:不同形式模型偏回归系数的经济含义第四
21、十六页,讲稿共五十四页哦回归建模示例1:粮食生产模型n根据理论和经验分析,影响粮食生产根据理论和经验分析,影响粮食生产(Y)的主要因素有:)的主要因素有:n农业化肥施用量(X1),粮食播种面积(X2),成灾面积(X3),农业机械总动力(X4),农业劳动力(X5)n已知中国粮食生产的相关数据,建立中国粮食生产函数:Y=0+1 X1+2 X2+3 X3+4 X4+4 X5+第四十七页,讲稿共五十四页哦模型估计结果模型估计结果无异方差,无序列相关,无异方差,无序列相关,不显著,剔除?第四十八页,讲稿共五十四页哦辅助回归多重共线多重共线多重共线多重共线如何修正?如何修正?第四十九页,讲稿共五十四页哦差分消除共线差分消除共线经检验,无异方差,无经检验,无异方差,无序列相关,无多重共线,序列相关,无多重共线,可剔除两个不显著变量可剔除两个不显著变量第五十页,讲稿共五十四页哦剔除两个不显著变量剔除两个不显著变量第五十一页,讲稿共五十四页哦剔除变量法:先剔除哪个变量?先剔除先剔除x5“劳动力劳动力”第五十二页,讲稿共五十四页哦剔除x5“劳动力”和x4“机械总动力”可检验无序列相关,无异方差第五十三页,讲稿共五十四页哦去除常数项过原点回归作业:本题作业:本题作每公顷粮作每公顷粮食产量的影食产量的影响因素分析响因素分析模型模型第五十四页,讲稿共五十四页哦
限制150内