《平稳时间序列预测法.ppt》由会员分享,可在线阅读,更多相关《平稳时间序列预测法.ppt(83页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、7 平稳时间序列预测法,7.1 概述 7.2 时间序列的自相关分析 7.3 单位根检验和协整检验 7.4 ARMA模型的建模,7.1 概 述,时间序列 取自某一个随机过程,则称:,一、平稳时间序列,过程是平稳的随机过程的随机特征不随时间变化而变化,过程是非平稳的随机过程的随机特征随时间变化而变化,宽平稳时间序列的定义:,设时间序列,,对于任意的t,k和m,满足:,则称 宽平稳。,严平稳时间序列的定义: 所有的统计特性不随时间的平移而变化,Box-Jenkins基本思想:用数学模型描述时间序列自身的相关性,并假定这种自相关性一直延续,用该模型预测未来的值。,ARMA模型是描述平稳随机序列的最常用
2、的一种模型。,Box-Jenkins方法提供了对时间序列进行分析、预测,以及对ARMA模型识别、估计和诊断的系统方法。,ARMA模型的三种基本形式: 自回归模型(AR:Auto-regressive); 移动平均模型(MA:Moving-Average); 混合模型(ARMA:Auto-regressive Moving-Average)。,如果时间序列 满足 其中 是独立同分布的随机变量序列,且满足: 则称时间序列 服从p阶自回归模型。,二、自回归模型,滞后算子多项式,的根均在单位圆外,即,的根大于1。,自回归模型的平稳条件:,例1 AR(1)模型的平稳性条件。,对1阶自回归模型AR(1),
3、方程两边平方再求数学期望,得到Xt的方差,由于Xt仅与t相关,因此,E(Xt-1t)=0。如果该模型稳定,则有E(Xt2)=E(Xt-12),从而上式可变换为:,在稳定条件下,该方差是一非负的常数,从而有 |1。,而AR(1)的特征方程,的根为 z=1/ AR(1)稳定,即 | 1,意味着特征根大于1。,对高阶自回模型AR(p)来说,多数情况下没有必要直接计算其特征方程的特征根,但有一些有用的规则可用来检验高阶自回归模型的稳定性:,(1)AR(p)模型稳定的必要条件是: 1+2+p1 (2)由于i(i=1,2,p)可正可负,AR(p)模型稳定的充分条件是: |1|+|2|+|p|1,如果时间序
4、列 满足 则称时间序列 服从q阶移动平均模型。 或者记为 。,三、移动平均模型MA(q),,,平稳条件:任何条件下都平稳。,对于移动平均模型MR(q): Xt=t - 1t-1 - 2t-2 - - qt-q 其中t是一个白噪声,于是,MA(q)模型的平稳性,当滞后期大于q时,Xt的自协方差系数为0。 因此:有限阶移动平均模型总是平稳的。,通常希望AR过程与过程能相互表出,即过程可逆。,如移动平均模型MA():,可逆条件: 的根均在单位圆外,可逆条件:,四、ARMA(p,q)模型,如果时间序列,满足,则称时间序列 服从(p,q)阶自回归移动 平均模型。,或者记为:,平稳条件: 的根均在单位圆外
5、 可逆条件: 的根均在单位圆外,将纯AR(p)与纯MA(q)结合,得到一个一般的自回归移动平均(autoregressive moving average)过程ARMA(,该式表明: (1)一个随机时间序列可以通过一个自回归移动平均过程生成,即该序列可以由其自身的过去或滞后值以及随机扰动项来解释。 (2)如果该序列是平稳的,即它的行为并不会随着时间的推移而变化,那么我们就可以通过该序列过去的行为来预测未来。 这也正是随机时间序列分析模型的优势所在。,例题分析,设,,其中A与B,为两个独立的零均值随机变量,方差为1;,为一常数。,试证明:,宽平稳。,证明:,均值为0,,只与ts有关,所以宽平稳。
6、,建立时间序列模型,首先应判断时间序列的特性,判断是否满足建模条件。法建模主要解决两个问题: ()分析时间序列的随机性,平稳性和季节性()找出生成它的合适的随机过程或模型,即判断该时间序列是遵循一纯AR过程、还是遵循一纯MA过程或ARMA过程。 所使用的工具主要是时间序列的自相关函数(autocorrelation function,ACF)及偏自相关函数(partial autocorrelation function, PACF )。,7.2 时间序列的自相关分析,自相关分析法是进行时间序列分析的有效方 法,它简单易行, 较为直观,根据绘制的自 相关分析图和偏自相关分析图,我们可以初 步地
7、识别平稳序列的模型类型和模型阶数。 利用自相关分析法可以测定时间序列的随机性 和平稳性,以及时间序列的季节性。,一、自相关分析,(1)自相关函数的定义,滞后期为k的自协方差函数为:,则自相关函数为:,其中:,当序列平稳时,自相关函数可写为:,(2)样本自相关函数,其中:,样本自相关函数可以说明不同时期的数 据之间的相关程度,其取值范围在1到 1之间,值越接近于1,说明时间序列的 自相关程度越高。,(3)样本的偏自相关函数,在给定了,的条件下,,与滞后k期时间序列之间的条件相关。,换句话说:偏自相关是对之间未被 所解释的相关度量。,从t中去掉t-1的影响,则只剩下随机扰动项t,显然它与t-2无关
8、,因此我们说t与t-2的偏自相关系数为零。,在AR(1)中,,同样地,在AR(p)过程中,对所有的kp,t与t-k间的偏自相关系数为零。,样本的偏自相关函数的计算,其中:,1、时间序列的随机性,是指时间序列各项之间没有相关关系的特征。使用自相关分析图判断时间序列的随机性,一般给出如下准则:,若时间序列的自相关函数基本上都落入 置信区间 ,则该时间序列具有随机性; 若较多自相关函数落在置信区间之外, 则认为该时间序列不具有随机性。,时间序列特性分析,注:在B-J方法中,测定时间序列的随机性,多用于模型残差,以评价模型优劣。,2、判断时间序列是否平稳,是一项很重要的工作。运用自相关分析图判定时间序
9、列平稳性的准则是:,若时间序列的自相关函数在k3时都落入置 信区间 ,且逐渐趋于零,则该时间序列具有平稳性; 若时间序列的自相关函数更多地落在置信区 间外面,则该时间序列不具有平稳性。,注:在B-J方法中,只有平稳的时间序列才能建立ARMA模型,否则必须经过适当的处理使序列满足平稳性要求。例对某种趋势的时间序列进行差分处理。但很多序列不能通过差分达到平稳,而且差分虽然消除了序列的趋势易于建模,但也消除了序列的长期特征,实际的经济序列差分一般不超过两次。,3、时间序列的季节性 判定准则:,月度数据,考察k=12,24,36, 时的自相关系数是否与0有显著差异; 季度数据,考察k=4,8,12,
10、时的自相关系数是否与0有显著差异 。,注1:实际问题中常遇到季节性和趋势性同时存在的情况,应先剔除序列趋势性,在识别季节性。 注2:包含季节性的时间序列也不能直接建模,应先进行季节差分消除,季节差分一般不超过一阶。,三、ARMA模型的自相关分析,AR(p)模型的偏自相关函数是以p步截尾的,自 相关函数拖尾; MA(q)模型的自相关函数具有q步截尾性,偏 自相关函数拖尾; (可用以上两个性质来识别AR和MA模型的阶数) ARMA(p,q)模型的自相关函数和偏相关函数都 是拖尾的。,7.4 ARMA模型的建模,一、模型阶数的确定,(1)基于自相关函数和偏相关函数的定阶方法,对于ARMA(p,q)模
11、型,可以利用其样本的自相关函数和样本偏自相关函数的截尾性判定模型的阶数。,如果样本的偏自相关函数是以p步截尾的,模型为AR(p) ; 如果样本的自相关函数具有q步截尾性,模型为MA(q); 如果样本的自相关函数和偏相关函数都是拖尾的,模型为ARMA(p,q) 。,(1)自相关函数的截尾性统计检验:,对于每一个q,计算,.,(M 取,为 或者 ),,对于MA(q)模型,当kq时,,考察其中满足 的个数是否占M个的68.3%或者95.5%以上。,(2)偏自相关函数的截尾性统计检验:,对于每一个p,计算,(M 取,为 或者 ),,对于AR(p)模型,当kp时,,考察其中满足 的个数是否占M个的68.
12、3%或者95.5%以上。,如果对于序列,和,截尾,即不存在上述的,来说,均不,和,判定平稳时间序列,,则可以,为ARMA模型。,一般地,对ARMA,模型,它们均值为0,可递推得到残量估计,现作假设检验:,是来自白噪声的样本,令,(3)残差项的白噪声检验:(Q统计量检验),其中,取,左右。,则当,成立时,,服从,的,分布。,对给定的显著性水平,,若,,则拒绝,,即模型与原随机序列之间拟合得不好,,,则认为模型与原随机序列之间拟合,需重新考虑,得较好,模型检验被通过。,建模;若,自由度为,注:上机操作时,一般看Q统计检验的相伴概率,(1)用AR(1)拟合时间序列,考察其残差样本的自相关函数 是否q
13、1步截尾,则模型为ARMA(1, q1 ),否则; (2)用AR(2)拟合时间序列,考察其残差样本的自相关函数 是否q2步截尾,则模型为ARMA(1, q2 ),否则; (3)继续增大p,重复上述做法,直至残差序列的样本自相关 函数截尾为止,(4)Tasy和TiaoARMA模型定阶法,1950年-1998年北京城乡居民定期储蓄比例,选择合适的ARMA模型拟合 可以考虑拟合模型为AR(1), ARMA(1,3),连续读取70个化学反应数据,可以尝试使用AR(1),MA(1)和ARMA(1,1)模型拟合该序列,(2)基于F 检验确定阶数 (3)利用信息准则法定阶(AIC准则和BIC准则),此外,常
14、用的方法还有:,1967年,瑞典控制论专家K.J.Astrm教授将F检验准则用于对时间序列模型的定阶。 原理(模型阶数简约原则 parsimony principle): 设yt(1tn)是零均值平稳序列,用模型AR模型拟合 检验统计量: 结论 若FF,则拒绝原假设,认为AR(p)合适; 若FF,则接受原假设,认为AR(p-1)合适。,AR(p)模型定阶的F准则,检验统计量: 结论 若FF ,则拒绝原假设,模型阶数仍有上升的可能; 若FF ,则接受原假设,认为ARMA(p-1,q-1)合适。,ARMA(p,q)模型定阶的F准则,另外一个遇到的问题是,在实际识别ARMA(p,q)模型时,需多次反
15、复偿试,有可能存在不止一组(p,q)值都能通过识别检验。 显然,增加p与q的阶数,可增加拟合优度,但却同时降低了自由度。 因此,对可能的适当的模型,存在着模型的“简洁性”与模型的拟合优度的权衡选择问题。,信息准则法,AIC准则,背景: AIC准则是日本统计学家赤池Akaike于1973年提出的,全称为最小信息量准则,或AIC准则(Akaike information criterion)。该准则既考虑拟合模型对原始数据的接近程度,也考虑模型中所含待定参数的个数,适用于ARMA模型的检验。,AIC准则确定模型的阶数,AIC定阶准则:,是模型的未知参数的总数,是用某种方法得到的方差,的估计,为样本
16、大小,则定义AIC准则函数,用AIC准则定阶是指在,的一定变化范围内,寻求使得,最小的点,作为,的估计。,AR(,)模型 :,ARMA,模型 :,BIC准则,AIC准则是样本容量N的线性函数,在N时不收敛于真实模型,它通常比真实模型所含的未知参数要多,是过相容的。 为了弥补AIC准则的不足,Akaike于1976年提出BIC准则,而Schwartz在1978年根据Bayes理论也得出同样的判别标准,称为SBC准则。理论上已证明,SBC准则是最优模型的真实阶数的相合估计。, AR(p)模型的Yule Walker方程估计,在AR(p)模型的识别中,曾得到,利用k=-k,得到如下方程组:,此方程组
17、被称为Yule Walker方程组。该方程组建立了AR(p)模型的模型参数1,2,p与自相关函数1,2,p的关系,,二、模型的参数估计,AR(p)模型参数的Yule-Walker估计,特例:一阶自回归模型AR(1):,二阶自回归模型AR(2):,MA(q)模型参数估计,特例:,一阶移动平均模型MA(1):,二阶移动平均模型MA(2):,可以用直接法或迭代法求解。,ARMA(p,q)模型的参数估计,由于模型结构的复杂性,参数估计比较困难,有几种方法可以进行。一般利用统计分析软件包完成。,(2)精估计,ARMA(p,q)模型参数的精估计,一般采用极大似然估计,由于模型结构的复杂性,无法直接给出参数
18、的极大似然估计,只能通过迭代方法来完成,这时,迭代初值常常利用初估计得到的值。,用公式表示如下:,三、ARMA(p,q)序列预报,用条件期望进行预测,1.AR(1)模型的条件期望预测 设yt适合如下AR(1)模型:,(1)以t为原点,向前一步预测公式(L=1),(2) 向前二步预测公式(L=2),(3) 向前L步预测公式(L2),2、MA(1)模型的条件期望预测,设,(1) 向前一步预测 (L=1),(2) 向前二步预测 (L=2),(3) 向前l步预测公式(L2),3、ARMA(1,1)模型的条件期望预测,设,(1) 向前一步预测 (L=1),(2) 向前二步预测 (L=2),可见,当L1时
19、,ARMA(1,1)预测值也是由如下差分方程决定的。,(3) 向前L步预测公式(L2),三、预测误差,由于预测只能建立在到t时刻为止的可用信息的基础上, 因此,根据最小均方误预测的第二个准则,以及平稳可 逆序列可以表示成传递函数形式的论断,可以将预测值 表示成能够估计的项t,t-1,的加权和的 形式:,由上得以t为原点,向前L步的预测误差为:,由于t是白噪声,故有:,误差方差为:,注:预测误差的估算是1, p算和1,q估计都为正确的假设,实际中参数通过估计得到的,且估计量是随机变量,有均值和方差,因而实际误差大于理论估计误差。,五、预测误差的置信区间,对于正态过程,预测误差的分布为:,所以:对
20、yt+l预测的95%的置信区间为:,因此:,设,为一AR(2)序列,,其中,求,的自协方差函数,。, 例 1,解答:,Yule-Walker方程为:,且:,联合上面三个方程,解出:, 例 2,考虑如下AR(2) 序列:,若已知观测值,(1)试预报,(2)给出(1)预报的置信度为95%的预报区间。,解答:,(1),(2),预报的置信度为95%的预报区间分别为:,7.3 单位根检验和协整检验,一、平稳性的检验,引言:前面我们讨论的是平稳时间序列的建模和预测方法,即所讨论的时间序列都是宽平稳的。一个宽平稳的时间序列的均值和方差都是常数,并且它的协方差有时间上的不变性。 但是许多经济领域产生的时间序列
21、都是非平稳的。呈现出明显得趋势性和周期性,序列不平稳,导致预测无效,产生谬误回归等问题。,1、通过时间序列的趋势图来判断,这种方法通过观察时间序列的趋势图来判断时间序列是否存在趋势性或周期性。 优点:简便、直观。对于那些明显为非平稳的时间序列,可以采用这种方法。 缺点:对于一般的时间序列是否平稳,不易用这种方法判断出来。,2、通过自相关函数(ACF)判断,平稳时间序列的自相关函数(ACF)要么是截尾的,要么是拖尾的。因此我们可以根据这个特性来判断时间序列是否为平稳序列。 若时间序列具有上升或下降的趋势,那么对于所有短时滞来说,自相关系数大且为正,而且随着时滞k的增加而缓慢地下降。,若序列无趋势
22、,但是具有季节性,那末对于按月采集的数据,时滞12,24,36的自相关系数达到最大(如果数据是按季度采集,则最大自相关系数出现在4,8,12, ),并且随着时滞的增加变得较小。 若序列是有趋势的,且具有季节性,其自相关函数特性类似于有趋势序列,但它们是摆动的,对于按月数据,在时滞12,24,36,等处具有峰态;如果时间序列数据是按季节的,则峰出现在时滞4,8,12, 等处。,3、随机游走的单位根检验(Unit root test),随机游走是一种非平稳过程,其实随机游走一种特殊的齐次非平稳过程。 检验序列是否为随机游走,通常利用David Dickey和Wayne Fuller的单位根检验。
23、单位根的含义和检验原理如下:,(1)单位根的含义,(2)单位根的检验,用Eviews进行单位根检验时给出了上述选项。 如果DF检验统计量比给定显著水平临界值大,不能拒绝原假设,认为序列存在单位根,是非平稳的。,ADF检验 在DF检验中,常常因为序列存在高阶滞后相关,使得随机扰动不符合白噪声假设,ADF检验修正了DF检验中的自相关问题。,此外还有: PP检验:检验具有一般形式的单位根过程 DFGLS检验: DF及ADF检验对含有时间趋势的退势平稳时间序列的检验失效,古典的回归方法:只能对平稳的时间序列进行回归分析,或将非平稳的序列转化为平稳序列再做回归,非平稳时间序列分析,逐期差分后平稳,建立求和自回归移动平均模型,记为ARIMA(p,d,q),非平稳时间序列分析,逐期差分+季节差分后平稳,建立乘积季节模型,即随机季节模型与ARIMA模型结合,记为ARIMA(p,d,q)(P,D,Q),二、协整检验,如果两个或多个非平稳的时间序列,其某个 线性组合后的序列呈平稳性,这样的时间序 列间就被称为有协整关系存在。,协整检验一般用于误差修正模型,用于对回归模型进行修正,针对一元和多元回归,常用的协整检验两种,Engle-Granger两步协整检验法,误差修正模型,多元回归,常用的协整检验为 Johansen协整检验。,
限制150内