向量自回归过程的时间序列分析.doc
【精品文档】如有侵权,请联系网站删除,仅供学习与交流向量自回归过程的时间序列分析.精品文档.第四章 向量自回归过程的时间序列分析§1 向量自回归模型有时我们需要考虑多个时间序列过程的组合。例如,宏观经济系统中,它们之间是一个相互联系的整体(ISLM)。多变量的时间序列将会产生一些单变量不存在的问题。本章主要讨论平稳的自回归形式的多变量随机过程VAR。给一般的向量平稳过程,。这里的协差矩阵定义为:仅依赖于。设,于是得到矩阵序列。又,。设,那么,。 称为的长期协差阵。且的谱定义为:用作为的估计,又M是一个截断,满足且。再用作为的一致估计。相应于单变量平稳过程,我们同样定义向量的白噪声过程WN和向量的鞅差分过程MDS。 并进一步给出由它们的线性过程组成的其他的向量过程:过程,。这里是一个的矩阵,是向量WN。平稳性要求的特征值的绝对值小于1。过程,。这里是一个的矩阵,是向量WN。可逆性要求的特征值的绝对值小于1。又,过程总是平稳的。过程,这里和都是的矩阵。又平稳性要求的复根的模大于1,可逆性要求的复根的模大于1。过程,。简单计算可得的协差矩阵。显然,过程是平稳的。类似于单变量的AR过程,平稳的过程可以表示成一个过程,即,。更一般的有,平稳的过程:。改写成向量算子多项式形式,。那么,。设,则由可推得,。且。VAR过程与VMA过程在一定条件下可以互换。由于VMA过程估计涉及到复杂的非线性运算,在可逆性条件成立下,数值估计我们常把它转化成VAR过程处理。但在理论分析上,用VMA过程讨论冲击响应则更方便些,我们又将VAR过程转换成VMA过程处理。一般不同时讨论过程。太麻烦。注:向量随机过程的沃尔德分解定理仍成立。 一个2维的VAR Matlab 程序。(暂略)§2 格兰杰因果性和冲击响应多变量时间序列之间能否构成向量过程首先应当检查它们之间是否存在因果关系。设。定义,为的格兰杰原因,指的是,如果已知的过去值,有助于预测。反之,如果不是的格兰杰原因,则意味着当已知的过去值,对预测没有帮助。所以,将和写成它们过去的线性表达式:不是的格兰杰原因意味着;不是的格兰杰原因意味着。所以,当且,和就没有必要放在一起作为向量过程。做法是同时做两个F检验。如果二个检验都不能拒绝,则作为向量过程意义不大。注:格兰杰因果关系不是习惯上认识的因果关系。如学历与工资、吸烟与癌症、施肥与产量,等等。格兰杰因果关系指的是多变量时间过程中时间前后的可预测关系,典型例子是,天气预报是天气的格兰杰原因。多变量之间的相互联系带来的第一个问题是冲击响应的不唯一性。考虑一个VMA过程,。当是单变量过程时,冲击响应指的是。含义是在时刻一个单位的增加,再经过个时间单位后对过程的影响。但当是一个向量过程时,冲击响应是一个的矩阵。它的内涵就多了。矩阵中的元素表面上看就是的第个分量的单位冲击对的第个分量的影响。然而,元素不能像单变量那样表达得那么准确。因为的表达可以有多种不同的外在形式,任给可逆矩阵P,有:所以,如果不是对角矩阵,那么矩阵就不能反映向量在时刻一个单位的冲击在经过个时间单位后对过程的影响。因为与不能区别。 因此,我们应当限制的表述方式。比如,使是对角阵。特别限制使是单位阵。由矩阵的Choleski分解定理,知,存在下三角矩阵使得。 于是,做变换,则,。我们把的满足的表述称为它的垂直冲击响应形式。又当是一个过程, 。那么,先做变换,则:。因为,变换后不是一个标准的过程。但这是一个结构式的VAR,由于P是下三角的,也是下三角的,故这是一个递归形式的VAR。于是,可把转化为的表达:,且。给定冲击,那么,就是的第列,(就是的第行)它表示的是每个变量对第个分量在期前一个单位冲击产生的响应。所以,系统有个这样的冲击函数。下面考虑一个垂直响应形式的VAR过程的方差分解。它有助于分析产生波动的原因主要是由变量的哪些分量因素决定。对,设t后h步的预测为,t后h步的预测误差为,预测步后误差的方差矩阵为,。有意义的是这个总方差成分的分解。现在考虑每一个分量的预测误差,对第i个分量而言,有:,这里是矩阵中的第个元素。所以,第i个分量的预测误差要受到其他分量的影响。又由于,所以,。和式表示第k个分量的冲击对第i个分量在h步后造成的预测误差的方差,和式则表示第i个分量h步后预测误差的总方差。因此,比例值表示第k个分量的冲击占对第个分量预测误差的总方差的比例。此分析方法称为方差分解。直观的讲就是,把的第行的平方和做分母,每个分量的平方做分子。方差分解解释了系统中每个分量的随机性冲击造成对其他分量的误差占整体波动的相对重要性,在宏观经济的政策分析中非常有用。 举例(暂略)。§3 的极大似然估计3.1 不受限制下的极大似然估计前述的方差分解等的应用是建立在估计的基础上的,本节讨论的估计。给,。如果平稳,如何估计和?这里我们介绍常用的条件极大似然估计方法。设,且有T个观测。我们希望利用这些观测来估计和。设,那么,。用联立的OLS方法,得:, ,且。由于假定具有正态性,我们证明,估计就是极大似然估计。首先,给定之下,对数极大似然函数为:其中,如果用代,那么,。所以,给定条件下,对数极大似然函数是一个关于的矩阵连续可微函数。引理:A,B正定,且B给定。则矩阵函数在时取得最大值。证明:当时,因为A正定,存在正交阵Q使,且。所以,。得FOC:。又因为矩阵。例如,m=2,是加性可和的,且,;,。故时取得极大值。 当时,由B正定,且正交变换不改变迹和行列式的值,故可设B为对角阵。重复上述过程,仍可得时取最大值。由引理,当时,取得极大值。且有:。再最大化,求。等价于求最小化。因为,这是OLS方法。故得。所以用OLS方法所求的和的估计就是它的条件极大似然估计。注:条件极大似然估计的做法是,欲故和,先任意固定,求得在固定条件下的最大值。然后,又在给定的最大值的条件下,反过来求的最大值。这种方法也可以倒过来做,先任意固定,求得在固定条件下的最大值,然后,又在给定的最大值的条件下,反过来求的最大值。至于谁先谁后,要看和谁受到约束,受到约束参数的先求。这在后面要讲到的结构性VAR时的估计是非常有用的。3.2和的极限分布及检验下面考虑极大似然估计和的的极限分布。记 相应的估计, (注:对按行分块。)那么,第i个方程能被写成:得的OLS: 。由的平稳性,令,且Q与t 无关,是矩阵。由 ,即每一分量有不同的方差,和CLT可得:由向量大数定律,。故得: 其中 对VAR模型可进行类似联立方程模型的关于同方程参数的t检验和F检验。如果要对不同的进行检验,即跨方程的检验。需要知道的联合分布。由可求得和的极限分布, 。如果令 (按列分块)注:Vec称为矩阵按列的拉直算子。那么,向量的联合极限分布就是:是Kronecker 乘积所以,对的线性约束条件,就有相应的Wald统计量:其中,q是的秩(或R的行数)。从而我们可以进行相应的类似多元线性回归的Wald检验,或部分参数为0约束下的Lagrange乘子检验。不再详述。关于方差矩阵的极限分布则要麻烦得多。因为是对称阵,故只需考虑的下三角阵。定义的对称拉直算子为Vech, 例如,。又定义算子D,。意思是将向量恢复到在拉直算子作用下的向量。所以D是一个的矩阵。当 , 那么 ,则 。 所以, 。记 , (故是投影矩阵) 。当m=2,即 ,所以 。注:称为D的广义逆,因为。符号慢慢熟悉,关键是知道定义的意思。 有了上述准备,我们有下面关于的极限定理。定理: 即极大似然估计不仅是一致的,而且是正态的。这个证明很麻烦,但结论需要记住。(证明略,参见Hamilton的时间序列分析)。例如,当m=2时,这个定理的含义是,且,中的元素,和的渐近协方差是 ,或由于正态变量的三阶矩为零,即对成立,所以,还可以进一步证明,极大似然估计和也是渐近独立的。则和有 联合分布:有了这个联合极限分布,我们可以做许多有意义的假设检验。特别是有关误差方面的检验。例如,和是否相关,检验,或者和是否具有同方差,检验等等。具体问题具体分析。注:当不具有正态性时,上述结论不一定成立。特别是的极限分布变得很敏感。但对,只要有4+的有限矩,则仍具有渐近正态性。故对的有关参数检验仍然是有效的。 举例(暂略)3.3存在条件异方差情况下的极限分布VAR模型中,当序列不再是i.i.d.而是鞅差分时,条件异方差问题就会产生。这是一个普遍存在的问题,不能回避,如前述的ARCH过程。在条件异方差情形下,虽然得到的条件似然估计和仍是和的一致估计,但和的精度会降低,且它们的极限分布和联合分布要有相应的改变。这会影响到假设检验。讨论如下:记,因为是一个鞅差分序列(),所以,的极限方差就是的概率极限。如果在条件同方差的假设下,即 ,那么,又因为注意:,其中是一个分量,则上式为:的极限方差阵就是:再用残差代替,可得到一个一致的估计:特别,在条件同方差假定下,由,接下来讨论异方差条件下的的极限。注意:是一个常数矩阵,与t无关。在一般的异方差条件下,由,仍然有:其中,是一个关于t的无穷小量。注意:即使是序列不相关的,如, 也是一个具有条件异方差的相关序列,如ARCH过程。因此,的极限方差为 : 。由前述,这是关于的长期方差。为获得的一致估计,令,再用Newey-West的光滑调整的方法:给定一个充分大的J,得估计是: 且,。知是的一致估计。特别,当是序列不相关时,得,即此时是的短期方差。在给定,是条件正态的情况下,和极限分布仍是独立的。从而可得它们的联合分布为:又当不具有条件正态性的情况下,则和是相关的,从而联合分布中的方差矩阵没有准对角的形式,我们需要求得它们间的协差矩阵C。因为是鞅差分的,故,当s<t。于是和的协方差矩阵:则C的一致估计是。所以,在干扰是鞅差分过程的前提下,估计和的联合分布就得修正为:这是一般情况下的联合分布。利用该联合分布适应进行各种一般假定下的关于和的检验。如格兰杰因果关系检验,如果误差项关于时间不一定是独立不相关的。将分成两部分,相应地,定义则VAR过程可以写成:如果矩阵中,=0,意味着不受的影响,即不是引致的格兰杰原因。由于和的联合分布可求得,我们可适当选择R,使得当且仅当=0。采用Wald统计量进行检验。一个更方便的基于回归方式的极大似然比检验方法是:1对、和回归,得残差和2对、回归,得残差和 3极大似然比统计量为:在之下,其中q是中变量的个数。这要在块约束=0之下,求和的极大似然估计,涉及到麻烦的矩阵代数运算。(略)和的在更一般的约束限制下的极大似然估计参见Hamiltion的书(p373-378)。注:如果=0,则意味着不是引致的格兰杰原因。因此,和是各自不相关的向量自回归过程。没有必要将他们放在一起作为向量过程进行VAR分析。3.4联立式方程模型和结构式SVAR3.4.1联立式方程模型(SEM)经济理论建模中,采用联立式是比较方便的。SEM的形式是:,其中,是的,是可逆的,B是的。称为内生变量,称为先决变量,称为随机干扰,且,其中称为结构式参数,是未知的。这里是系统变量的现时关系的表达,是系统变量过去关系和与外生变量关系的表达,既可以是现时的噪声干扰也可以是现时与过去共同产生的关联干扰。我们知道,SEM存在内生性问题,故OLS方法所得估计不是一致和有效的。另外,还有一个系统可识别的问题。因此,当模型是SEM形式时,我们需要寻求其他有效的估计方法求得模型的结构参数。注:建议读本节时参阅伍德里奇联立方程模型这一章。首先,对SEM,两边乘上任意可逆矩阵F得,改写成:, 则与原SEM有共同的简约式:此意味着,和以及B与不可识别,因为F有个元素,(当然还有可逆条件的限制)故我们必须对模型加上个约束条件模型才能唯一确定。我们知道,在截面数据的回归分析中,一般常采用规范化限制,即规定的主对角线元素 和排除性限制,即依据具体问题,限定和B中的某些元素为零(参见伍德里奇教本P218),并由此可得到在同方程限制下的系统可识别的阶条件和秩条件。跨方程的限制则更复杂。但在时间序列的分析中,通常不采用引入工具变量的办法,限制条件通常采用对协方差矩阵上的约束和加上规范化限制。3.4.2结构式VAR(SVAR)SEM的一个特殊形式就是结构式VAR。即模型中的都是的滞后变量。SVAR的形式是:其中,是的可逆矩阵。不失一般性,由规范化限制,令的主对角线元素为1,且。称为结构性干扰项。这里,SVAR表达的含义是,现时的内生变量,的相互作用(通过来表示),与过去的先决变量的相互作用(用表示)的内在联系。这些联系是建立在经济理论和假设基础之上的,故有直接的经济解释,参数有确定的经济含义。SVAR的简约形式是: 或 这就是VAR的形式。如果令 , ,那么,SVAR能改写成,这就是SEM形式。但SEM与SVAR还是有实质性区别,在SEM中,可以引入外生变量即非系统变量,而在SVAR中,只包含有先决变量(内生变量的滞后)。且每个内生变量是相互联系的。在识别问题上,在SEM中,由于有外生变量可以利用,常采用排除限制,而在SVAR中,没有外生变量可以利用,常采用对结构性干扰的方差矩阵限制和现时变量间的约束限制。另外,SEM关注的是模型参数的一致估计,而SVAR关注的则是结构式干扰方差阵的识别和干扰对系统变量的动态响应。为要讨论干扰对系统的动态影响(冲击响应),需要将SVAR转变成结构式滑动平均(SVMA)形式。做法是,将上述SVAR改写成算子形式: 那么,求逆,可得MA形式: 令,由,可推得:, 且 。再对简约式写成MA式,则有:所以,如果简约式VAR的参数可估,那么可估。又如果可通过限制得到,那么(习题)也是可估的。令结构式干扰的方差为,可以认为是对角的,即每一个结构方程是不相关的,系统中变量现时的关联通过表达,是独立的现时随机性干扰。由于不再是单位阵,故表达的仅是一个标准差的冲击响应,代之以则是单位的冲击响应。又定义和,则前述有关VAR的方差分解分析就可以用到SVAR上。例:汇率问题系统选择国家:德国、日本、英国、法国、意大利、加拿大和美国,定义如下7个与汇率有关的变量:1 R:短期利率;2 M:货币发行;(或)3 CPI:消费价格指数;4 IP:生产价格指数;5 OPW:世界石油价格;6 FFR:美国联邦准备金率;7 :各国与美元的汇率。Kim和Rubini(2000)假定中,有排除性约束(即含0的个数)关系:这里排除性约束关系超过个,故系统会出现过度识别的问题。 下面讨论SVAR的可识别问题。首先,有对角型方差阵,这意味着有个协方差为零的限制。加上 主对角线上元素为1的规范限制,所以只需确定个其它限制,系统就是可识别的。一般这个限制通过排除性限制放在上。因为表述的是系统变量当前的相关关系,所以,如果当某一变量对另一变量的响应是延迟的,那么相应的该变量当前的系数就应当为0,可以分析任意两变量间当前的相关关系。完成这样的分析,可以把它们写成结构式干扰和简约式干扰的相互联系:因为总是一致可估的,所以,对可识别问题而言,我们仍总是可认为是已知的。所以,当的个限制被确定,我们可以通过求得和。特别,当是下三角矩阵时,则实际已给出了的个限制,称为递归的SVAR形式。递归的SVAR系统变量的顺序安排是非常重要的。又当给出的限制多于个时,系统则是过度可识别的。和有多组解。过度识别会降低估计的有效性。(限制越多,估计的方差越大;没有限制,方差最小) 举例:(暂略)3.5 SVAR的完全信息极大似然估计(FIMLE)因为OLS方法对SVAR的参数估计不再具有一致性,本节在OLS方法基础上介绍完全信息似然估计法(FIMLE)。完全信息的含义是希望把限制条件的信息全部用上。3.5.1在协方差限制下的FIMLE给SVAR: 改写成VAR: 再改写成它的简约式: 则欲估,。则对数似然函数是:其中。因为识别的限制不在上,即没有约束,故最优的仍是OLS,不依赖于。故concentrated 似然函数就是:这里。注意:这里不是真正意义上的MLE,它仅是右边表达式的一个缩写记号。只有在不受到限制时,才是MLE。将用代入,得:在恰好可识别的条件下,包含有个自由变化的参数。又由前述引理,时取得极大值,所以,存在唯一解和。又在过度可识别条件下,最大值不满足,记,则在恰好可识别的条件下有。记的对数极大似然值为,那么,可以证明极大似然比统计量:,其中P是过度识别的个数,就是超过个限制的个数。大的统计值导致拒绝,意味着存在有问题的限制设定。当系统过度识别时,我们选择一个标准,寻求和,使得=与的“距离”是最近的。称为最小距离估计。的极限分布显然依赖于权矩阵W的选取。如何选?考虑其中, 自然,用,代替,选择,即得到和为加权的OLS。可以证明,的极大似然估计是更有效的估计。进一步有,。其中p是超过限制的个数。注:该结论即使对视非正态和条件异方差时仍成立,但LR统计量在非正态条件下就不再具有卡方分布的性质,但在有限样本时,MLE仍然具有优势。3.5.2无协方差限制下的FIMLE虽然SVAR在识别问题上几乎不考虑有关参数矩阵的限制。但是如果系统可以从引入足够多的外生变量影响的动态行为,那么就可以讨论有关的限制问题。这就是传统的FIMLE。考虑:,这里除了有的滞后项外,还包含有外生变量,如果 和B满足阶条件或秩条件,那么简约式是:同样,对数似然函数是:不过这次约束不是在上,而是在上,于是我们先不考虑(concentrate out),求的极小。由前所述,这就是对带约束回归的,再由,当系统恰好可以识别时,可得唯一的。当系统过度识别,也可将不受限制的和受约束的进行似然比检验。也可以构造最小距离的加权估计。3.5.3一般限制下的FIMLE除了或受限制外SVAR模型依据实际问题不同还存在许多其它类型的限制。如交叉方程限制(不同的方程拥有相同的参数)、单方程同参数限制。和的相关联限制,既可以是线性关联,也可以是非线性关联等等。在这些一般性的限制条件下,识别问题先放置不讨论,我们讨论一般限制下的FIMLE。设是满足一般约束条件下的任意可行的结构参数,且SVR的简约形式的参数是:和,这里由于约束是给定的,故和是的连续函数。于是, ,所以,极大似然函数很容易写成的函数的形式:的最小距离估计。设和是和在不受限制情形下的OLS估计。记,以及,。在服从正态分布的假定下,有:设是的一致估计,那么最小距离估计是:又定义,则真值的最小距离估计之间有极限分布:注:在非正态条件的情形下,最小距离估计比ML更有效。具体的实践一个SVAR模型,对本节的体会会更深。3.6 状态空间表示与卡尔曼滤波一个随机向量过程除了VAR的表述形式外,还可以写成状态空间模型的表达方式。状态空间表示在随机控制问题中应用更为方便。设为状态变量,为可观测变量,模型假定:其中和是非随机的,或是先决的,特别=, =与时间无关,对成立。适当选择和,我们能得到各种有意义的向量过程。例1 把写成状态空间模型:,定义: ;则易验证:,。这里F和H都是已知时间不变的常数矩阵。特别,就是。 及。例2过程,。定义:,那么;于是,。也可令, ,那么,。还可令,则。所以表达不唯一。可以证明任何的和都能表示成状态空间模型的形式。(习题)例3。随机游动加噪声:,; ,且与独立。如果,则就是的期望。对非零相对于较小的,我们可以认为有一个小小波动的期望,如果很大,那么随机游动的成分就占统治地位。把看成是一个有趋势的随机游动过程更合适。该模型的一个特征是,这是一个含有不可观测成分的模型。例4变化均值和变化斜率的模型:,。如果且,那么就是一个常数,且。显见,表示了斜率,表示了截距。 所以,非零但很小,模型就有一个缓慢变化的斜率,写成状态空间表示为: , 且。例5参数随时间变化的回归模型, ,令。立得状态空间模型。例6 动态因子模型考虑有k个潜在因素对有影响: ,, 即是;, 即是。定义, 令, , 。则, 且。注:我们看到状态空间模型表示非常灵活,更为一般的状态空间表示为: , 。其中为个可观测的外生向量。状态空间模型问题的提法是,从状态,且,或干脆从出发,已知观测和,如何给出对未来状态的估计以及评价准则。这就是下面要介绍的卡尔曼滤波。卡尔曼滤波(Kalman filter)假定,关于时间是iid和正态的,且相互独立。又初始状态变量与和独立,因此,它们与,是独立的。定义时刻的信息集: 。则与信息集也是独立的,其中是一个形式的结果,表示初态时已知的先验信息。卡尔曼滤波的实质是,从出发,已知,给出状态的估计。记, , ;称为在已知信息下状态和Y在时刻的预测(Prediction)和预测方差。记, , 。称为在已知信息下状态在时刻的更新(Updating)和更新方差。现在将状态初始化,写成的形式,设为已知,则有如下预测公式:为要使迭代顺利进行,我们需要知道更新和更新方差,和。依据不断输入的信息,如何得到更新和更新方差?(更新就是现时状态的调整。)假设已有预测信息:、,和输入信息。我们选择一矩阵,称为增益矩阵,并构造线性组合:使得最小。我们证明。首先,如果获取已知,那么易得更新方差,为求得,我们用归纳法。无妨假定和是常数矩阵,已知,同理有,。和在已知信息下有联合正态分布:。这是确定的二元正态分布。输入信息,即现有信息。那么依据引理:引理:,则给定下,的最优预测为条件期望。(参见Hamilton时间序列分析)给定,状态的最优预测是,由,所以,所以,。所以,选择增益矩阵为。且,。所以,在时,更新公式被证明。由归纳法,将上述过程0用代,1用代,可以证明对所有更新公式成立。所以,通过卡尔曼滤波,从出发,不断输入信息,我们可以迭代的得出状态的最优预测:进一步可以对状态进行预报(Forcasting),即给出。公式如下:有意思的问题是在有了预测后,如何利用信息重估,?即反过来求和,重估结果称为平滑(smoothing)。因为已充分利用了信息,从出发,反向令,递归得出:,且;。意思是对进行线性调整。 举例(暂略)。