第4章时间序列分析课件.ppt
1第四章第四章 时间序列分析时间序列分析2第一节第一节 随机过程与时间序列的概念随机过程与时间序列的概念一、随机过程与时间序列的定义一、随机过程与时间序列的定义 随机过程的定义是:设随机过程的定义是:设T T是某个集合,对固定的是某个集合,对固定的t t T T,都有对应的随机变量,都有对应的随机变量X Xt t,当,当t t在在T T中变动时,所得到中变动时,所得到的随机变量的全体称为随机过程,记为的随机变量的全体称为随机过程,记为X Xt t;t Tt T,或简记为或简记为X Xt t。特征特征(1)随机过程是随机变量的集合)随机过程是随机变量的集合(2)构成随机过程的随机变量是随时间产生的,在)构成随机过程的随机变量是随时间产生的,在任意时刻,总有随机变量与之相对应。任意时刻,总有随机变量与之相对应。3时间序列的定义:时间序列的定义:当当 时,即时刻时,即时刻t只取整数时,随机过程只取整数时,随机过程 可写成可写成此类随机过程此类随机过程 称为随机序列,也成时间序列。称为随机序列,也成时间序列。特点特点(1)随机序列是随机过程的一种,是将连续时间的)随机序列是随机过程的一种,是将连续时间的随机过程等间隔采样后得到的序列;随机过程等间隔采样后得到的序列;(2)随机序列也是随机变量的集合,只是与这些随)随机序列也是随机变量的集合,只是与这些随机变量联系的时间不是连续的、而是离散的。机变量联系的时间不是连续的、而是离散的。45二、随机过程的数字特征二、随机过程的数字特征67810三、平稳随机过程和平稳时间序列11换句话说:时间序列xt是平稳的。如果xt有有穷的二阶中心矩,而且满足:(1)ut=E(xt)=c;(2)r(t,s)=E(xt-c)(xs-c)=r(t-s,0)则称xt是平稳的。含义:a有穷二阶矩意味着期望和自协方差存在;b平稳时间序列任意时刻所对应的随机变量的均值相等;c自协方差函数只与时间间隔有关,而与时间起点无关。1213141516171819第二节、时间序列的随机线性模型 一、平稳自回归模型(AR模型)202122二、可逆滑动平均模型(MA模型)2324三、平稳自回归-可逆滑动平均混合模型252627第三节 线性模型的自相关函数和偏相关函数 一、偏相关函数 2829303132二、自相关函数 自相关函数定义为:三、自相关函数和偏自相关函数的性质 模型 函数 AR(p)MA(q)ARMA(p,q)(p0,q0)拖 尾截尾k=q处拖 尾截尾k=p处拖 尾拖 尾3334例:k12345678910k0.880.760.670.570.480.40.340.280.210.17kk0.880.01-0.010.110.02-0.010.01-0.02-0.060.0535计算结果表明,自相关函数逐渐衰减,但不等于零;偏自相关函数在k=1后,与零接近,是截尾的。结论:自相关函数呈指数衰减,是拖尾的;偏自相关函数在一步后为零,是截尾的。36例:用zt=(1-0.5B)at模拟产生250个观察值,at为白噪声序列,得到序列自相关和偏自相关函数如下:可见,ACF在一步后截尾,PACF是拖尾的。结论:MA(q)的ACF是截尾的,PACF是拖尾的。k12345678910ACF-0.4400.02-0.03-0.01-0.050.04-0.03-0.030.02PACF-0.44-0.24-0.11-0.08-0.07-0.12-0.06-0.07-0.1-0.0837这两节介绍了三类模型的形式、特性及自相关和偏自相关函数的特征,现绘表如下:AR(p)MA(q)ARMA(p,q)模型方程(B)xt=atxt=(B)at(B)xt=(B)at平稳性条件(B)=0的根在单位圆外无(B)=0的根在单位圆外可逆性条件无(B)=0的根在单位圆外(B)=0的根在单位圆外自相关函数拖尾Q步截尾拖尾偏自相关函数P步截尾拖尾拖尾38第四节 模型的识别一、模型识别定义 由平稳序列的一个样本函数确定它的线性模型的类别、阶数,称为模型识别。即判断该时间序列是遵循一纯AR过程、还是遵循一纯MA过程或ARMA过程。所使用的工具所使用的工具主要是时间序列的自相关函数自相关函数(autocorrelation function,ACF)及偏自相关偏自相关函数函数(partial autocorrelation function,PACF)。二、样本自相关函数和样本偏相关函数1样本自相关函数39402样本偏相关函数样本偏相关函数可用下式定义 41三、确定模型的类别和阶数4243 AR(p)、MA(q)、ARMA(p,q)模型的估计方法较多,大大体体上分为上分为3类:类:(1)最小二乘估计;)最小二乘估计;(2)矩估计;)矩估计;(3)利用自相关函数的直接估计)利用自相关函数的直接估计。下面有选择地加以介绍。结构阶数模型识别确定估计参数第五节 模型参数估计44 AR(p)AR(p)模型的模型的Yule WalkerYule Walker方程估计方程估计 在AR(p)模型的识别中,曾得到 利用k=-k,得到如下方程组:此方程组被称为此方程组被称为Yule Walker方程组。方程组。该方程组建该方程组建立了立了AR(p)AR(p)模型的模型参数模型的模型参数 1 1,2 2,p p与自相关函数与自相关函数 1 1,2 2,p p的关系,的关系,(195)45 利利用用实实际际时时间间序序列列提提供供的的信信息息,首首先先求求得得自自相相关关函函数数的的估计值估计值 然后然后利用利用Yule Walker方程组,求解模型参数的估计方程组,求解模型参数的估计值值由于 于是 从而可得 2 2的估计值的估计值 在具体计算时,可用样本自相关函数rk替代。(196)46 MA(q)MA(q)模型的矩估计模型的矩估计 将MA(q)模型的自协方差函数中的各个量用估计量代替,得到:首先首先求得自协方差函数的估计值,(197)是一个包含(q+1)个待估参数(197)的非线性方程组,可以用直接法直接法或迭代法迭代法求解。常常用用的的迭迭代代方方法法有有线线性性迭迭代代法法和和Newton-Raphsan迭代法。迭代法。47 (1 1)MA(1)MA(1)模型的直接算法模型的直接算法 对于MA(1)模型,(197)式相应地写成于是 或有于是有解 由于参数估计有两组解,可根据可逆性条件|1|1的MA(q)模型,一般用迭代算法估计参数:由(197)式得 第一步第一步,给出的一组初值,比如代入(201)式,计算出第一次迭代值(201)49 第二步第二步,将第一次迭代值代入(201)式,计算出第二次迭代值 按此反复迭代下去,直到第m步的迭代值与第m-1步的迭代值相差不大时(满足一定的精度),便停止迭代,并用第m步的迭代结果作为(201)的近似解。50 ARMA(p,q)ARMA(p,q)模型的矩估计模型的矩估计 在ARMA(p,q)中共有(p+q+1)个待估参数1,2,p与1,2,q以及2,其估计量计算步骤及公式如下:第一步第一步,估计1,2,p 是总体自相关函数的估计值,可用样本自相关函数rk代替。(202)51 第二步第二步,改写模型,求1,2,q以及2的估计值 将模型 改写为:令 于是(203)可以写成:(203)构成一个MA模型。按照估计MA模型参数的方法,可以得到1,2,q以及2的估计值。(204)52 AR(p)AR(p)的最小二乘估计的最小二乘估计 假设模型AR(p)的参数估计值已经得到,即有 残差的平方和为:(205)根据最小二乘原理,所要求的参数估计值是下列方程组的解:即 j=1,2,p (206)解该方程组,就可得到待估参数的估计值。53 为了与AR(p)模型的Yule Walker方程估计进行比较,将(206)改写成:j=1,2,p由自协方差函数的定义,并用自协方差函数的估计值 代入,上式表示的方程组即为:或 j=1,2,pj=1,2,p54解该方程组,得到:即为参数的最小二乘估计。Yule Walker方程组的解比较发现,当n足够大时,二者是相似的。2的估计值为:55 需要说明的是,需要说明的是,在上述模型的平稳性、识别与估计的讨在上述模型的平稳性、识别与估计的讨论中,论中,ARMA(p,q)模型中均未包含常数项。模型中均未包含常数项。如果包含常数项,该常数项并不影响模型的原有性质如果包含常数项,该常数项并不影响模型的原有性质,因为通过适当的变形,可将包含常数项的模型转换为不含常数项的模型。下面以一般的ARMA(p,q)模型为例说明。对含有常数项的模型 方程两边同减/(1-1-p),则可得到 其中5657 由于ARMA(p,q)模型的识别与估计是在假设随机扰动项是一白噪声的基础上进行的,因此,如果估计的模如果估计的模型确认正确的话,残差应代表一白噪声序列型确认正确的话,残差应代表一白噪声序列。如果通过所估计的模型计算的样本残差不代表一白噪如果通过所估计的模型计算的样本残差不代表一白噪声,则说明模型的识别与估计有误,需重新识别与估计。声,则说明模型的识别与估计有误,需重新识别与估计。在实际检验时,主要检验残差序列是否存在自相关在实际检验时,主要检验残差序列是否存在自相关。1 1、残差项的白噪声检验、残差项的白噪声检验 可用统计量进行可用统计量进行 2检验检验:在给定显著性水平下,可计算不同延迟期的值,通过与 2分布表中的相应临界值比较,来检验是否拒绝残差序列为白噪声的假设。若大于相应临界值,则应拒绝所估计的模型,需重新识别与估计。第六节第六节 模型的检验模型的检验582 2、AICAIC与与SBCSBC模型选择标准模型选择标准 另外一个遇到的问题是,在实际识别ARMA(p,q)模型时,需多次反复偿试,有可能存在不止一组(p,q)值都能通过识别检验。显然,增加增加p与与q的阶数,可增加拟合优度的阶数,可增加拟合优度,但却同时降低了自由度但却同时降低了自由度。因此,对可能的适当的模型,存在着模型对可能的适当的模型,存在着模型的的“简洁性简洁性”与模型的拟合优度的权衡选择问与模型的拟合优度的权衡选择问题。题。59 其中,n为待估参数个数(p+q+可能存在的常数项),T为可使用的观测值,RSS为残差平方和(Residual sum of squares)。在在选择可能的模型时,选择可能的模型时,AIC与与SBC越小越好越小越好 显显然然,如如果果添添加加的的滞滞后后项项没没有有解解释释能能力力,则则对对RSSRSS值值的的减减小小没没有有多多大大帮帮助助,却却增增加加待待估估参参数数的的个个数数,因因此此使使得得AICAIC或或SBCSBC的值增加。的值增加。需需注注意意的的是是:在不同模型间进行比较时,必须选取相同的时间段。常用的模型选择的判别标准有:赤池信息法常用的模型选择的判别标准有:赤池信息法(Akaike information criterion,简记为简记为AIC)与施瓦兹贝叶斯法施瓦兹贝叶斯法(Schwartz Bayesian criterion,简记为简记为SBC):60第七节 平稳时间序列的预报递推预报法一、自回归模型预报616263二、滑动平均模型的预报 6465三、混合模型预报