eviews分布滞后模型和自回归模型.ppt
第六章 滞后变量模型科克分布滞后模型 v科克模型:v在估计的过程中存在以下问题:v(1)由于作为解释变量 ,因此模型中包含随机解释变量;v(2)即使原模型中的 不存在序列相关,然而 是序列相关的;v(3)解释变量 和误差项 存在序列相关。v因此,使用OLS估计将导致估计量不仅是有偏的而且非一致的。可以采用工具变量法来估计,有学者建议用 作为 的工具变量。例1v工作文件中,给出的是1978-2006年北京市城镇家庭平均每人全年消费性支出(PPCE,单位元)和城镇家庭平均每人可支配收入(PPDI,单位元)。由于人们消费习惯等原因,使得收入对消费支出的影响存在时间滞后,因此建立消费函数的分布滞后模型。v本实验打算建立如下模型:v这里以 做为滞后解释变量 的工具变量。v虽然工具变量法可以消除科克模型中解释变量的随机性以及解释变量与误差项之间的序列相关等问题,但由于引入的工具变量是 ,其与 存在高度相关性,因此模型估计存在多重共线性问题。这样,虽然工具变量方法给出了方程的一致性估计,但是这些估计量很可能是低效的。有限分布滞后模型 v一般模型为:v对于滞后长度的确定,可以根据实际经济问题的需要和经验进行判定,也可以利用一些判定方法和准则,如赤池(Akaike)AIC准则与施瓦兹(Schwarz)SC准则等。v对于滞后长度为已知的分布滞后模型,修正的估计方法有经验加权法、阿尔蒙(Almon)多项式滞后法等。v各种方法的基本思想大致相同,都是通过对各滞后变量加权,组成线性组合变量(即滞后变量的线性组合)作为新解释变量引入方程,有目的地减少滞后变量的数目,缓解多重共线性,保证自由度。1经验加权估计法v所谓经验加权法,是根据实际经济问题的特点及经验判断,对滞后变量赋予一定的权数,利用这些权数构成各滞后变量的线性组合,以形成新的变量,再应用最小二乘法进行估计。v由于随机误差项与解释变量不相关,从而也与滞后解释变量的线性组合变量不相关,因此可直接应用最小二乘法对该模型进行估计。v经验加权法具有简单易行、不损失自由度、避免多重共线性干扰及参数估计具有一致性等优点。缺陷是设置权数的主观随意性较大,要求分析者对实际问题的特征有比较透彻的了解。v通常的做法是,多选几组权数,分别估计多个模型,通常的做法是,多选几组权数,分别估计多个模型,然后根据样本决定系数、然后根据样本决定系数、F检验值、检验值、t检验值、估计检验值、估计标准误差以及标准误差以及DW值,从中选出最佳估计方程。值,从中选出最佳估计方程。v例:已知某地区制造业部门19551974年期间的资本存量Y和销售额X的统计资料如下表(金额单位:百万元)。设定有限分布滞后模型为:v运用经验加权法,选择下列三组权数:v(1)1、1/2、1/4、1/8v(2)1/4、1/2、2/3、1/4v(3)1/4、1/4、1/4、1/4、v分别估计上述模型,并从中选择最佳的方程。v数据见case25.v记新的线性组合变量分别为:v分别估计如下经验加权模型:vYT=-66.52294932+1.071395456*Z1v ()()vR-squared0.994257 DW1.439440 FvYT=-133.1722303+1.366668187*Z2v ()()vR-squared0.989373 DW1.042713 FvYT=-121.7394467+2.237930494*Z3v ()()vR-squared0.990077 DW1.158530 Fv从上述回归分析结果可以看出,模型一的扰动项无一阶自相关,模型二和模型三扰动项存在一阶正相关;在综合判断可决系数、F检验值,t检验值,可以认为:最佳的方程式模型一,即权数为1、1/2、1/4、1/8的分布滞后模型。2.阿尔蒙法阿尔蒙法v主要思想:针对有限滞后期模型,通过阿尔蒙变换,定义新变量,以减少解释变量个数,然后用OLS法估计参数。v 主要步骤为:v 第一步,阿尔蒙变换 v 对于分布滞后模型v 假定其回归系数i可用一个关于滞后期i的适当阶数的多项式来表示,即:v i=0,1,s v其中,ms-1。阿尔蒙变换要求先验地确定适当阶数k,例如取m=2,得 v (*)v将(*)代入分布滞后模型 v定义新变量v将原模型转换为:v第二步,模型的第二步,模型的OLS估计估计 v对变换后的模型进行OLS估计,得v再计算出:v求出滞后分布模型参数的估计值:v由于m+1s,可以认为原模型存在的自由度不足和多重共线性问题已得到改善。v需注意的是需注意的是,在实际估计中,阿尔蒙多项式的阶数m一般取2或3,不超过4,否则达不到减少变量个数的目的。例vcase26是某水库1998年至2000年各旬的流量、降水量数据。分别建立水库流量与降水量序列,命名为vol和ra。试对其建立多项式分布滞后模型。Eviews操作v在主窗口命令行键入如下命令建立PDL模型:vLs y x1 x2 pdl(series name,lags,order,options)v其中,lags代表滞后期s,order表示多项式次数m,options指定约束类型,有下面三个选项:v1 近端约束;使x对y的一期前导作用为0v2 远端约束;使大于滞后期p后x对y的作用为0v 3 同时采用近端和远端两种约束v如果模型中没有约束条件,则options缺省。v本例,假定降水量对水库流量滞后3月的影响仍然显著,即滞后期p=9。v若采用4阶多项式(m=4)且不施加端点限制条件,则输入命令vLs vol c pdl(ra,9,4)v模型输出窗口的上半部分给出了各参数估计值及检验的t统计量:下半部分模型检验所需的各个统计量。这里用PDL01、PDL02、PDL03等代表式中的w1t、w2t等变量。本例m=4,所以除常数项外共有5个参数估计值。该命令还同时绘制出估计值的分布图.v表中最后一行的Sum of Lags是系数估计值的总和,在序列平稳的假设下,它反映了分布滞后变量(本例即降水量ra)对因变量的长期作用大小。v表中系数即为 v若认为降水量对水库流量的作用在3月之后几乎消失,则可利用远端限制条件,即输入命令Ls vol c pdl(ra,9,4,2)v比较发现,远端约束模型的调整后的决定系数略高于无约束模型、AIC和SC信息量略低于无约束模型,因此认为加入远端约束条件后的多项式分布滞后模型较优,但二者差异不大。v系数估计值差异也不大,说明滞后期为3月时降水量对水库流量的作用本身已衰减接近0v根据需要,可以为模型增加ARMA项,比如对某商品销售额(sale)、价格(price)和顾客流量(customer)建立分布滞后模型的同时,加入AR和MA项。v在主窗口命令行输入,Ls sale c price pdl(customer,10,3)ar(1)ma(1)v这里,变量customer的系数取决于无端点约束的次数为3的多项式。vPDL模型也可以用两阶段最小二乘法估计参数,命令基本格式为vtsls y x1 x2 pdl(series name.lags.orde,options)zl Z2格兰杰因果检验 v先估计当前的y值被其自身滞后期取值所能解释的程度,然后验证通过引入序列 x的滞后值是否可以提高y的被解释程度。如果是,则称序列 x是y的格兰杰成因,此时x的滞后期系数具有统计显著性。一般地,还应该考虑问题的另一方面,即y是否是x的格兰杰成因。vEviews计算如下的双变量回归:v其中k是最大滞后阶数,通常可以取稍大一些。检验的原假设是序列x(y)不是序列y(x)的格兰杰成因,即v1999年1月4日至2001年10月15日深圳成指和上海综指序列数据见case9.