第九章时间序列分析PPT讲稿.ppt
第九章 时间序列分析1第1页,共100页,编辑于2022年,星期二第一节时间序列基础预测知识一 线性最小二乘法(Linear Least Squares Prediction,LLS)假设X和Y是两个散点分布的随机变量,它们具有某种联合分布。它们的期望、方差、协方差分别是:X x E Y =y第2页,共100页,编辑于2022年,星期二 X x X x E Y-y Y-y =R S S Q第3页,共100页,编辑于2022年,星期二其中,X的期望E(X)=x,Y的期望E(Y)=y,X的方差E(X-x)2=R Y的方差E(Y-y)2=Q COV(XY)=E(X-x)(Y-y)=S 第4页,共100页,编辑于2022年,星期二现假设我们可以观测到X的一组值,如何预测Y呢?即如何利用X推知Y,假设只知道它们的期望、方差和协方差。我们可以利用这些已知条件求出Y的线性最小二乘估计值。第5页,共100页,编辑于2022年,星期二假设这一线性形式为:Yhat=a+b(X-x)我们的任务是在使平均平方误差(均方误)最小的情况下求出a和b的值。MSE=EY-Yhat2=EY-a-b(x-x)2=E(Y-y)-(a-y)-b(X-x)2第6页,共100页,编辑于2022年,星期二=E(Y-y)2+E(a-y)2+b 2 E(X-x)2-2E(Y-y)(a-y)+2bE(X-x)(a-y)-2bE(Y-y)(X-x)=Q+(a-y)2+b 2 R-2bS分别对a和b求导,令其为零2(a-y)=0,所以a=y,2bR-2S=0,b=S/R=SR-1所以,Yhat=y+SR-1(X-x)也可以写成:Yhat=y+cov(X,Y)/var(x)*(X-x)(X-x)的系数表明我们所估计Y值受观测值X影响程度的大小,它和X的方差成反比,X、Y的协方差成正比。第7页,共100页,编辑于2022年,星期二二,线性最小二乘估计的特点1,Y的估计值和Y的期望相同。证明:E(Yhat)=Ey+SR-1(X-x)=y 第8页,共100页,编辑于2022年,星期二2,线性转换如C是任一常数,则CY的LLS估计是CYhat.证明:令Z=CYYhat=a+b(X-x)根据定义:Zhat=z+cov(X,Z)/var(X)*(X-x)第9页,共100页,编辑于2022年,星期二z=E(CY)=C y Cov(X,Z)=E(X-x)(Z-z)=E(X-x)(CY-C y)=C E(X-x)(Y-y)=C cov(X,Y)第10页,共100页,编辑于2022年,星期二将结果代入定义:Zhat=z+cov(X,Z)/var(X)*(X-x)=C y+C cov(X,Y)/var(X)*(X-x)=Cy+cov(X,Y)/var(X)*(X-x)=CYhat第11页,共100页,编辑于2022年,星期二3,线性组合Y1、Y2的LLS估计分别是Y1hat Y2hat.则Y1+Y2的LLS估计为Y1hat+Y2hat.证明:已知:Y1hat=y1+S1R-1(X-x)Y2hat=y2+S2R-1(X-x)第12页,共100页,编辑于2022年,星期二根据定义:Zhat=z+cov(XZ)/var(X)(X-x)z=E(Y1+Y2)=y1+y2,cov(XZ)=E(X-x)(Z-z)=E(X-x)(Y1+Y2-y1-y2)=E(X-x)(Y1-y1)+E(X-x)(Y2-y2)=cov(X,Y1)+cov(X,Y2)第13页,共100页,编辑于2022年,星期二Zhat=z+cov(XZ)/var(X)(X-x)=y1+y2+cov(X,Y1)+cov(X,Y2)/var(X)(X-x)=Y1hat+Y2hat第14页,共100页,编辑于2022年,星期二4,MSE(Yhat)=E(Y-Yhat)2=EY-y -SR-1(X-x)2=E(Y-y)2-2 SR-1E(X-x)(Y-y)+S 2 R-2 E(X-x)2=Q-S 2R-1第15页,共100页,编辑于2022年,星期二第二节时间序列基本概念一,平稳性定义 任何一个时间序列都可以被看作是由随机过程产生的结果。如果一个随机过程所产生的时间序列均值和方差在任何时间过程上都是常数,并且任何两个时期之间的协方差仅依赖于这两个时期的距离或滞后,而不依赖于计算这个协方差的实际时间,就称该时间序列是平稳的(Stationary)。第16页,共100页,编辑于2022年,星期二我们可以把上述的描述表达成下式:如果时间序列Yt具有下列性质:1,E(Yt)=,2,var(Yt)=2,3,cov(Yt Y t+k)=E(Yt-)(Yt+k-)=rk,第17页,共100页,编辑于2022年,星期二二,自协方差函数和自相关函数如果Yt的均值为0,那么rk=E(Yt Y t+k)被称为自协方差函数定义:k rk/r0,为自相关函数r0=E(Yt Y t)=var(Y t)=2,第18页,共100页,编辑于2022年,星期二三,滞后算子(Lag operator)为了使计算简单,引入滞后算子的概念。定义L Y t=Y t-1,L2Yt=Y t-2,.LsYt=Y t-s,例如Y t 1.5 Y t-1 0.6 Y t-2=(11.5L+0.6L2)Yt,第19页,共100页,编辑于2022年,星期二第三节自回归模型(AR)一,AR模型的定义 如果时间序列Y t可以表示为它先前的值和一个误差项的线性函数,称此模型为自回归模型(Autoregressive Models,记做AR(p)。一般的表达式是:Y t 1 Y t-1+2 Y t-2+.p Y t-p+t,第20页,共100页,编辑于2022年,星期二 t为白噪声序列,它满足以下条件:1,E(t)=0,2,E(t s)=2 t=s 0 t s3,E(t Y t-i)=0可以进一步假设误差项服从于正态分布,期望是0,方差是固定的常数 2。条件3表明t时刻的误差 t与Y t的过去值无关。同时为简单起见,假设E(Y t)=0,该假设一直存在,除非特别说明。第21页,共100页,编辑于2022年,星期二利用滞后算子,可以把AR(p)表示成:Y t 1 L Y t+2 L2 Y t+.p L p Y t+t,(1-1 L-2 L2-p L p)Y t=t,令(L)(1-1 L-2 L2-p L p)(L)Y t=t,或 Y t=(L)1 t AR(1)模型:Y t 0.5 Y t-1+t,可以写成(1-0.5L)Y t=t,或 Y t=(1-0.5L)1 t Y t 0.6 Y t-1+0.4Y t-2 t,可以写成:(1-0.6 L-0.4 L2)Y t=t,第22页,共100页,编辑于2022年,星期二二,AR(1)平稳的必要条件Y t Y t-1+t对上式两边平方再取期望E(Y t 2)=2 E(Y t-12)+E(t 2)+2 E(Y t-1 t)=2 E(Y t-12)+2 如果Y t序列是平稳的,则在任何时候的方差是相同的,所以 E(Y t 2)=E(Y t-12)y 2 第23页,共100页,编辑于2022年,星期二 y 2=2/(1-2),因为 y 2是非负的,所以 2/1-2 0,从而就有|1,因此|1是AR(1)模型平稳的必要条件。第24页,共100页,编辑于2022年,星期二三,AR模型的自相关函数 1,AR(1)的自相关函数 Y t Y t-1+t 其自协方差函数为:r1 cov(Y t Y t-1)=E(Y t Y t-1)=E(Y t-1+t)Y t-1=E(Y t-12)=r0,r2=cov(Y t Y t-2)=E(Y t Y t-2)=E(Y t-1+t)Y t-2=E(Y t-1 Y t-2)=r1 =2 r0,r3=cov(Y t Y t-3)=E(Y t Y t-3)=E(Y t-1+t)Y t-3=E(Y t-1 Y t-3)=r2 =3r0,第25页,共100页,编辑于2022年,星期二 rk=kr0,所以,根据自协方差函数,可以计算出自相关函数为:k rk/r0 k,如果Y t是平稳的,|0)当k=1,2时1 1+2 1,2 1 1+2,1 1/(1-2),2 1 2/(1-2)+2,第30页,共100页,编辑于2022年,星期二例题求AR(2):Y t 0.6 Y t-1 -0.2Y t-2 t,自相关系数(k=0,1,2)可以按照上面推导的公式,直接计算。1 1/1-2 0.6/1-(-0.2)=0.6/1.2=0.52 1 2/1-2+2=0.36/1.2-0.2=0.1也可以按照定义来计算第31页,共100页,编辑于2022年,星期二r1 cov(Y t Y t-1)=E(Y t Y t-1)E(0.6 Y t-1 -0.2Y t-2 t)Y t-1 =0.6 r0 0.2 r1r2cov(Y t Y t-2)=E(Y t Y t-2)E(0.6 Y t-1 -0.2Y t-2 t)Y t-2 =0.6 r1 0.2 r01 1+2 1,2 1 1+2,所以自相关函数k 1 k-1+2 k-2,(k0)第32页,共100页,编辑于2022年,星期二也可以得到相同的结果。3 0.6 2-0.2 1 0.6*0.1-0.2*0.50.06-0.1-0.044 0.6 3-0.2 2,0.6*(-0.04)-0.2*0.1-0.024-0.02 -0.044第33页,共100页,编辑于2022年,星期二AR(p)自协方差函数和自相关函数Y t 1 Y t-1+2 Y t-2+.p Y t-p+tr1=1 r 0+2 r 1+.p r p-1 r2=1 r 1+2 r 0+.p r p-2.rk=1 r k-1+2 r k-2+.p r k-p 第34页,共100页,编辑于2022年,星期二1 1+2 1+p -1 2 1 1+2+p 2k 1 k-1+k-2+p k-p上述方程组被称为Yule-Walker 方程。p阶的Yule-Walker 方程可以用矩阵形式表达1 1 1 -1 1 2 1 1 2 2.=k -1 2 1 p 第35页,共100页,编辑于2022年,星期二四,AR(p)模型的参数估计Y t 1 Y t-1+2 Y t-2+.p Y t-p+t 根据样本观测值,可以利用最小二乘法估计模型,得到所有参数 1 2.p的估计值。第36页,共100页,编辑于2022年,星期二也可以利用Yule-Walker 方程,以样本自相关函数代替总体自相关函数,也可以估计出所有的参数。rk=E(Yt Y t+k)为总体自协方差函数rk hat=1/n(Yt-Ybar)(Y t+k-Ybar)r0=E(Yt Y t)=var(Y t)r0hat=1/n(Yt-Ybar)2k rk/r0,为总体自相关函数khat=rk hat/r0hat,第37页,共100页,编辑于2022年,星期二我们以AR(1)和AR(2)为例Y t 1 Y t-1+t 1 hat=1 hat=r1hat/r0hat 2=r0hat-1 r1hat=r0hat(1-1 hat2)第38页,共100页,编辑于2022年,星期二Y t 1 Y t-1+2 Y t-2 +t1hat=1 hat+2 hat 1 hat2hat=1 hat 1 hat+2 hat 可以求出:1 hat=(1 hat-1 hat 2hat)/(1-1 hat2)2 hat=(2hat-1 hat2)/(1-1 hat2)2=r0hat(1-1 hat 1 hat-2 hat 2hat)第39页,共100页,编辑于2022年,星期二第四节 移动平均模型一,移动平均模型(Moving Average models,MA(q)定义如果时间序列Y t是现在和过去误差的线性组合,即Y t t 1 t 1 2 t 2 q t-q 则上式为Y t的移动平均模型,记做MA(q)第40页,共100页,编辑于2022年,星期二如果用滞后算子表示:Y t(1 1 L-2 L2-.q Lq)t,=(L)t,t=(L)-1 Y t 第41页,共100页,编辑于2022年,星期二二,MA模型的自协方差函数和自相关函数r0 E(Y t 2)=E(t 1 t 1 2 t 2 q t-q )2,=2(1+1 2+2 2+q 2)rk E(t 1 t 1 2 t 2 q t-q )(t-k 1 t k-1 2 t k-2 q tk-q )=2(k+1 k+1+q-k q)1 k q 0 kq第42页,共100页,编辑于2022年,星期二 k=(k+1 k+1+q-k q)/(1+1 2+2 2 +q 2)1 k q 0 kq从上式可以看出,MA序列自相关函数序列的前q项是非零的,q+1项以后是零,我们称其为截尾。第43页,共100页,编辑于2022年,星期二我们现以MA(1)和MA(2)模型为例1,Y t t t 1 r0 E(Y t 2)E(t t 1)2 =2(1+2)r1 E(Y t Y t-1)=E(t t 1)(t-1 t 2)=-2 r2 E(Y t Y t-2)=E(t t 1)(t-2 t 3)=0第44页,共100页,编辑于2022年,星期二 0=1 1=-/(1+2)k=0 (k=2 3.)所以对于MA(1)模型而言,k1之后自相关系数就是零了。第45页,共100页,编辑于2022年,星期二2 MA(2)模型Y t t 1 t 1 2 t 2r0 E(Y t 2)E(t t 1 2 t 2)2 2(1+1 2+2 2)r1 E(Y t Y t-1)=E(t 1 t 1 2 t 2)(t-1 1 t 2 2 t 3)(-1 1 2)2 第46页,共100页,编辑于2022年,星期二r2 E(Y t Y t-2)=E(t 1 t 1 2 t 2)(t-2 1 t 3 2 t 4)2 2 r3E(Y t Y t-3)=E(t 1 t 1 2 t 2)(t-3 1 t 4 2 t 5)0第47页,共100页,编辑于2022年,星期二 0=1 1=(-1 1 2)/(1+1 2+2 2)2=2/(1+1 2+2 2)k=0 (k=3 4.)MA(2)从k2之后自相关系数就为零了。所以根据前面的推导,MA(q)模型从kq之后自相关系数就是零了。第48页,共100页,编辑于2022年,星期二三 MA模型的可逆性对于MA模型而言,我们关注 的是它是否是可逆的。所谓可逆指的是MA(1)转换成自回归模型第49页,共100页,编辑于2022年,星期二Y t t t 1 或 t Y t+t 1 相应地 t 1 Y t1+t 2 t Y t+t 1 Y t+(Y t1+t 2)Y t+Y t1 2 t 2重复迭代下去,第50页,共100页,编辑于2022年,星期二 t Y t+j Y tj j+1 t-j-1当|1地话,表明时间越滞后,对今天的影响越大,这是不合常理的。第52页,共100页,编辑于2022年,星期二三 MA模型估计问题2,线性迭代法第53页,共100页,编辑于2022年,星期二rk=2(1+1 2+2 2+q 2)k=0 2(k+1 k+1+q-k q)1 k q上式是有q+1个参数的非线性方程组。可以有不同的求解方法。1,直接求解法第54页,共100页,编辑于2022年,星期二当q=1时,即一阶的移动平均模型。我们可以得到:r0hat=2(1+1 2)r1hat=-1 2 1=-r1hat/2 将 1代入r0hat=2(1+1 2)=2 1+(-r1hat/2)2第55页,共100页,编辑于2022年,星期二化简得到:4-r0hat 2+r1hat2=0 2 hat=r0hat +r0hat2-4 r1hat2/2=r0hat1+1-4 1 hat2/2 1 hat=-r1hat/2=-r1hat/r0hat1+1-4 1 hat2/2=-2 1 hat/1+1-4 1 hat2 第56页,共100页,编辑于2022年,星期二上述参数估计有两个解,可以根据可逆性的条件来判断选取。2 hat=r0hat1+1-4 1 hat2/2 1 hat=-2 1 hat/1+1-4 1 hat2 第57页,共100页,编辑于2022年,星期二r0hat=2(1+1 2+2 2)1r1hat=2(-1+1 2)2r2hat=-2 2 3由后两个方程可以得出:2 hat=-r2hat/2 1 hat=-r1hat/(2+r2hat)然后将结果再代入第一个方程,得到:r0hat=2 1+(-r2hat/2)2+-r1hat/(2+r2hat)2可以得到 2的三次方程,可得 2三个根,相应也有 1 hat、2 hat三个解。对于q2时,求解较为复杂,因此,q较大时用线性迭代法。第58页,共100页,编辑于2022年,星期二第五节 自回归移动平均模型一,定义,如果Y t是先前序列值和当前及过去误差的线性组合,即Y t 1 Y t-1+2 Y t-2+p Y t-p+t 1 t 1 2 t 2 q t-q 称上式为Y t的自回归移动平均模型(Autoregressive Moving Average Models,记做ARMA(p,q),p q分别表示自回归和移动平均的阶数第59页,共100页,编辑于2022年,星期二用滞后算子来表示:(1 1 L-2 L2-p Lp)Y t=(1-1 L-2 L2-q Lq)t (L)Y t=(L)t第60页,共100页,编辑于2022年,星期二二ARMA模型的自协方差函数和自相关函数1,ARMA(1,1)Y t Y t-1+t t 1把上式改写成:Y t Y t-1 t t 1第61页,共100页,编辑于2022年,星期二E(Y t t)=2 E(Y t t-1)=E(Y t-1+t t 1)t-1 =2-2,=(-)2 第62页,共100页,编辑于2022年,星期二r0 E(Y t 2)=E(Y t-1+t t 1)2=2 E(Y t-1)2+E(t)2+2 E(t 1)2 +2 E(Y t-1 t)-2 E(Y t-1 t 1)-2 E(t t-1)=2 r0+2+2 2-2 2 r0 2(1+2-2 )/(1-2)第63页,共100页,编辑于2022年,星期二r1=E(Y t Y t-1)=E(Y t-1+t t 1)Y t-1 =r0 -2 =2(1+2-2 )/(1-2)-2,=2(1-)(-)/(1-2)上式是通分化简后得到的最后结果第64页,共100页,编辑于2022年,星期二r2=E(Y t Y t-2)=E(Y t-1+t t 1)Y t-2 =r1 2(1-)(-)/(1-2)第65页,共100页,编辑于2022年,星期二r3=E(Y t Y t-3)=E(Y t-1+t t 1)Y t-3 =r2 2(1-)(-)/(1-2)rk=rk-1,k1(k=2,3.)第66页,共100页,编辑于2022年,星期二所以自相关函数为:1=r1/r0=(1-)(-)/(1+2-2 )对于k1,k=k k-1,第67页,共100页,编辑于2022年,星期二 2=1 (1-)(-)/(1+2-2 )3=2 2(1-)(-)/(1+2-2 )k=k k-1 k-1(1-)(-)/(1+2-2 )由此可以看出ARMA(1,1)是拖尾的第68页,共100页,编辑于2022年,星期二例题Y t 0.6 Y t-1 t 0.4 t 1+0.04 t 2,E(Y t t)=2 E(Y t t-1)=E(0.6Y t-1+t 0.4 t 1 +0.04 t 2)t-1=0.6 2 0.4 2,=0.2 2 第69页,共100页,编辑于2022年,星期二E(Y t t-2)=E(0.6Y t-1+t 0.4 t 1 +0.04 t 2)t-20.6*0.2 2+0.04 2 0.16 2 E(Y t t-1)E(Y t1 t-2)0.2 2,将这一结果代入上式即可第70页,共100页,编辑于2022年,星期二利用上面的结果,计算自协方差和自相关函数首先将初始模型左右同乘以Y t,再取期望(1)r0 0.6 r1 E(Y t t)-0.4 E(Y t t-1)+0.04 E(Y t t-2)=2(1-0.4*0.2+0.04*0.16)=2(1-0.08+0.0064)=0.9264 2 第71页,共100页,编辑于2022年,星期二同乘以Y t-1,再取期望(2)r1 0.6 r0 E(Y t1 t)-0.4 E(Y t1 t-1)+0.04 E(Y t1 t-2)2(-0.4+0.04*0.2)-0.392 2 第72页,共100页,编辑于2022年,星期二同乘以Y t-2,再取期望3,r2 0.6 r1 E(Y t2 t)-0.4 E(Y t2 t-1)+0.04 E(Y t2 t-2)=0.04 2 第73页,共100页,编辑于2022年,星期二解上面的方程组首先(2)*0.6+(1)r0 2 0.6912/0.64=1.08 2 代入(2)式r1 0.6 r0 0.392 2 (0.6*1.08-0.392)2 0.256 2 第74页,共100页,编辑于2022年,星期二代入(3)式r2 0.6 r1 0.04 2 2(0.6*0.256+0.04)0.1936 2 1=r1/r0=0.256/1.08=0.237037 2=r2/r0=0.1936/1.08=0.179259第75页,共100页,编辑于2022年,星期二rk 0.6 rk-1=0 k2所以k 0.6 k-1 0 30.6 2 0.6*0.1792590.10756 40.6 3 0.6*0.107560.06453第76页,共100页,编辑于2022年,星期二二ARMA(1,1)模型的平稳性和可逆性的判断。|1是AR(1)模型平稳的必要条件|2的时间序列比较少见,但是经济异常时也会发生,如恶性通货膨胀时的物价水平就是一个I(3)。第84页,共100页,编辑于2022年,星期二二,虚假回归(spurious regression)经济时间序列时常有一个长期所谓趋势,或近似单位根,即大多数的经济时间序列是非平稳的。如果我们直接对非平稳的时间序列进行回归,可能会出现:1,高R22,很低的标准差(低SE)3,d趋于0(DW值)一般地,当R2d,时,上述回归就可能是虚假回归或谬误回归。(经验上的)第85页,共100页,编辑于2022年,星期二三,为了避免虚假回归,必须事先进行单位根的检验,即首先检验该序列是否是平稳的。常用的单位根检验被称为DF检验(Dickey Fuller Test)第86页,共100页,编辑于2022年,星期二Y t Y t-1+t使用最小二乘法估计上述模型,我们要检验的是:H0:1,Y t 是非平稳的。H1:1)向量自回归模型为:Y t Y t-1+t是nn的常数项矩阵 t 是白噪声。第97页,共100页,编辑于2022年,星期二上式可以写成:Y t(I+)Y t-1+t为了保证没有爆炸根,矩阵(I+)的每一个特征根必须满足|i|1。在这一前提下,会有三种结果:1,0,即所有的i等于1,Y t中的所有元素都是随机游走。可能彼此间存在相关,但是不存在长期均衡关系。第98页,共100页,编辑于2022年,星期二2,rank()=n,(I+)中的每一个特征值都小于1,所以 Y t中的每一个元素都是平稳的。3,rank()r,0rn,|i|1,存在协整关系。第99页,共100页,编辑于2022年,星期二第100页,共100页,编辑于2022年,星期二