2022年随机时间序列 .pdf
《2022年随机时间序列 .pdf》由会员分享,可在线阅读,更多相关《2022年随机时间序列 .pdf(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 5 章随机型时间序列预测方法96 第 5章随机型时间序列预测方法本章将讨论随机型时间序列预测技术。此方法的优点在于它能利用一套相当明确规定的准则来处理复杂的模式,预测精度也比较高。 但同时为了达到高的精确性,其计算过程复杂,计算工作量大,花费也大。随机型时间序列预测技术建立预测模型的过程可以分为四个阶段:第一阶段:根据建模的目的和理论分析,确定模型的基本形式。第二阶段:进行模型识别,即从一大类模型中选择出一类试验模型。第三阶段:将所选择的模型应用于所取得的历史数据,求得模型的参数。第四阶段:检验得到的模型是否合适。若合适,则可以用于预测或控制;若不合适,则返回到第二阶段重新选择模型。建模流
2、程图如下:根据随机型时间序列预测技术建模顺序,本章依次讨论随机型时间序列模型,ARMA 模型的相关分析,模型的识别,ARMA 序列的参数估计以及模型的检验和预报。合适不合适确定基本模型形式模型识别 (选择一个试验性模型) 参数估计 (估计试验性模型参数) 诊断检验利用模型预测图 5.1 时间序列分析建模流程名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法97 5.1 随机型时间序列模型本节讨论时
3、间序列的几种常用模型。从实用观点来看,这些模型能够表征任何模式的时间序列数据。这几类模型是: 1) 自回归 (AR) 模型;2) 移动平均 (MA ) 模型;3) 自回归移动平均(ARMA) 模型; 4) 求和自回归移动平均(ARIMA) 模型。5.1.1 时间序列所谓随机时间序列是指|,1,2,nXnoN,这里对每个n,nX都是一个随机变量。以下我们简称为时间序列。定义 5.1时间序列|0,1,2,nXn称为平稳的,如果它满足:(1)对任一 n ,()nEXC,C是与 n 无关的常数;(2)对任意的n和k,()()nknkEXCXC其中k与 n 无关。k称为时间序列nX的自协方差函数,0/k
4、k称为自相关函数。平稳性定义中的两条也就是说时间序列的均值和自协方差函数不随时间的变化而变化。显然,,0kkk,,0kkk。不失一般性,对一个平稳时间序列,0,1,nXn,可以假设它的均值为零。若不然,运用零均值化方法对序列进行一次平移变换,亦即令nnXXC,0,1,.n,则nX是一个零均值的平稳序列。这样做,便于下面进行统一讨论。我们可把所要研究的对象,比如某商品的月销售量,看作为一个随机时间序列nX。将手中所有的观察值12,nxxx,如为最近5 年这种商品的月销售量统计数据, 看作为这个随机时间序列的一个样本。若要想预测未来某一时期这种商品的月销售量,关键的问题是要掌握随机序列nX的统计特
5、性。但是,我们并不了解nX的统计特性,而手中只有nX的一个样本。所以,需要我们做的工作就是根据手中的样本去估计nX的概率特性,也就是建立时间序列nX的统计模型,用它来近似实际时间序列,从而做出对未来的预测。5.1.2 自回归 (AR)模型自回归模型 (Autoregressive model) 的形式为:1122nnnpnpnXXXX(5.1.1) 式中p,1为模型参数;nX为因变量,12,.,nnnpXXX为“自”变量。这里“自”变量是同一(因此称为“自”)变量,但属于以前各个时期的数值,所谓自回归即是此含义。最后,,1,0,nn是白噪声序列,即koknnnEE2)(,0)(,名师资料总结
6、- - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法98 也就是说随机序列n的均值为零,方差为2,且互不相关,它代表不能用模型说明随机因素。假定()0, ()tnE Xtn,即随机影响与数据值无关。p 为模型的阶数。用)( pAR来简记此模型。引入向后推移算子B:knnkB XX,CCBk,,1,0k(C为常数 ) 并记)1()(221pppBBBB则式 (5.1.1)可重写为()pnnB X(5.1.2) 称多
7、项式方程()0p为)( pAR模型的特征方程,它的p个根p,21称为模型的特征根。特征根可能是实数,也可能是复数。如果这p个特征根都在单位圆外,即1,1, 2,.,iip则称)( pAR模型是稳定的或平稳的。称上式为平稳性条件。这里应引起读者注意的是,平稳时间序列nX是指nX的均值为常数 (我们设其为零 )且自相关函数为齐次的随机时间序列;而平稳的()ARp)则指它满足平稳性条件:()0p的根均在单位圆外。这两种“平稳”是两个不同的概念。如,对于)1(AR模型,其特征方程为011x特征根111,从而)1(AR的平稳性条件是11。在条件11下,有111110NkNnnnnknNkXXX01kkn
8、k(5.1.3)由于k表示第k期的预测误差,因此上式表示对平稳的)1(AR模型,nX可由过去各期的误差线性表示。其实可以证明对任意的平稳)( pAR模型,nX都可由过去各期的误差线性表示。平稳性保证)( Bp的逆算子存在,但一般为无穷阶的,即0()npnnBB,从而0()knknkXB。这里只讨论平稳的)( pAR模型。注:式 (5.1.3)中假定了序列nX是负向无穷的。由式 (5.1.1)知,如果我们:(1) 能够证明式 (5.1.1)的确是恰当的方程;(2) 能够确定p的数值; (3) 能够确定模型参数1p,.,,那么在式 (5.1.1)去掉n项后就得到预测公式11211?.nnnpnpX
9、XXX,由此进行预测就很容易了。可惜的是并非所有时间序列都能用式(5.1.1)的)( pAR模型来表示。 因此,我们还要考虑其它模型。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法99 5.1.3 移动平均( MA )模型式 (5.1.3) 说明在平稳的)( pAR模型中,nX可由过去各期误差的线性组合表示,而当)( pAR模型非平稳时,线性表示就难以成立了。移动平均模型就是当nX可由过去有限
10、期的误差线性表示的情形。其公式为:1122nnnnqnqX(5.1.4) 其中n是白噪声序列。称满足上式的模型为q阶移动平均模型(Moving average model of order q),简记为)(qMA。与)( pAR模型类似,式 (5.1.4) 可写成如下的算子形式:()nqnXBqqqBBBB2211)(5.1.5) 称()0q为)(qMA模型的特征方程;它的q个根称为)(qMA的特征根。如果)(qMA的特征根都在单位圆外,则称此)(qMA模型是可逆的。如,对于)1(MA模型,其特征方程为011x于是特征根为11,从而可逆性条件为11。在此条件下,由1(1)nnXB可推得1111
11、00(1)kkknnnnkkkBXB XX(5.1.6) 这是一个无限阶的自回归过程,当然,其中n与nX所扮演的角色须作对换。其实,对于阶数1q,均可证明对可逆的)( qMA模型,n均可表示为过去各期数据nkX的线性组合。 与)( pAR中一样, 可逆性保证了)(Bq的逆算子存在。 因此)( pAR与)( qMA模型是互相对偶的两个模型。我们总假定)( qMA模型是可逆的。5.1.4 自回归移动平均( ARMA )模型在建立一个实际时间序列模型时,可能既有自回归部分,又有移动平均部分,如:1111.nnpnpnnqnqXXX(5.1.7) 或者写成算子形式:()()pnqnBXB简记此模型为)
12、,(qpARMA,括号中的第一个数据p是自回归阶数,第二个数据q是移动平均的阶数,故称之为),(qp阶的自回归移动平均模型。实际应用中名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法100 p、q的值很少超过3。对),(qpARMA模型,我们总假定)( Bp和)( Bq(作为变量为B的多项式)无公共因子,分别满足平稳性条件和可逆性条件。如果)(Bp满足平稳性条件, 称),(qpARMA是平稳的;
13、 如果)( Bq满足可逆性条件,称),(qpARMA是可逆的。对平稳的),(qpARMA模型,nX可表示为过去各期误差,21nnn的线性组合;对可逆的),(qpARMA模型,n可表示为过去各期数据12,.nnnXXX的线性组合。由于自回归模型不存在其它自变量,不受模型变量 “相互独立” 假定条件的约束。因此, 用AR模型及其原理可以构成多种模型以消除或改进普通回归预测中由于自变量选择、 多重共线性、 序列相关等原因所造成的困难。此外,在AR模型中,各种因素对预测目标的影响是通过它们在时间过程中的综合体现被考虑的,是将序列历史观察值作为诸因素影响与作用的结果用于建立其本身的历史序列线性回归模型的
14、,因此,用普通最小二乘法就可以对模型进行估计和求解。这一点,AR模型比其它类型的时间序列模型都优越,应用得也最广泛。5.1.5 求和自回归移动平均(ARIMA) 模型前面介绍的三类模型仅适用于描述平稳的时间序列,而实际应用中遇到的时间序列往往是非平稳的,尤其是在经济管理中碰到的时间序列。尽管从实际应用的角度看,用适当的自回归模型去近似一个稳定或不稳定的时间序列,在理论和方法上都是可行的,但我们常用差分化的方法将非平稳的序列化成平稳序列来求解。有些时间序列常呈现出一种特殊的非平稳性,称之为齐次非平稳性:只要进行一次或多次差分就可以将其化为平稳序列。差分的次数称为齐次化的阶。这样的时间序列可用求和
15、自回归移动平均模型来描述。定义差分1nnnXXX引入差分算子B1。 n 阶差分可定义为nnB)1(,如二阶差分222(1)(12)nnnXBXBBX=122nnnXXX或者2112()2nnnnnnnXXXXXXX),(qdp阶求和自回归移动平均模型为()()dpnqnBXB(5.1.8)亦即dnX是),(qpARMA序列。其中d为求和阶数,p、q分别为dnnYX序列的自回归和移动平均的阶数。式(5.1.8)所示的求和自回归移动平均模型用记号),(qdpARIMA表示。对这类非平稳的序列,我们假定n从 1 开始nX才有定义, 并且假定nX的前d个随机变量12,.,dXXX是均值为零,方差有限且
16、与dnX不相关,因而也与n不相 关。序 列nX可 用它 的 初 值12,.,dXXX及 平稳序列|,1,2dnnnYYXn表达。事实上,由于差分的逆运算是求和,所以名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法101 111101dndndiinjnidddjijXCXCY111101dnknkiinkjdikdkjijCXCY,dkn(5.1.9)其中)!(!/(!ktktCtk。我们不去推
17、导上述公式,仅仅讨论两种最简单的情况。i)1d,此时112211.nnnnnXXXXXXXX1111njjXY1nkkkjjXY,1kn从而式( 5.1.9)成立。ii)2d,此时由上式知11111nnknjkjkjjXXXXX同理有121jkjkkiikXXX,代入整理知11()()(1)nknkkkkjjXXnkXXnkjY,2kn对于),(qdpARIMA序列,它可以通过d阶差分化成平稳的),(qpARMA序列,从而化成了前面三类模型。但这种将ARMA推广到ARIMA的非平稳序列是非本质性的,所以本章也就不再详细讨论了。5.1.6 季节性模型对于含有季节性周期的时间序列,也可用季节差分的
18、方法将之化成平稳序列。例如,对月度波动,可以用月度差分12121B对nX作运算1212nnnXXX对季度波动,可以用季度差分444(1)nnnnXBXXX消除数据中的季节性影响。鲍克斯詹金斯季节模型为12()()dpnqnBXB(5.1.10)若取1qdp,则上述模型可展开为1211(1)(1)(1)(1)nnBBBXB有时随机干扰项n也是与季节相关的。这时,可以用模型1212()()dpnqnBXB名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 33 页 - - - -
19、 - - - - - 第 5 章随机型时间序列预测方法102 来描述。例如121211(1)(1)(1)(1)(1)nnBBBXBB就描述了一个既有线性发展趋向、又含月度周期变动的随机型时间序列模型。如能预测到nX的长期趋势)( nf时,()nXfn就是零均值了。5.2 ARMA 模型的相关分析本节简要介绍ARMA 序列的自相关函数和偏相关函数及其性质,并讨论它们与模型参数间的关系。AR( p)和 MA( q) 序列是ARMA( p,q)序列的特例,但AR(p)和 MA( q) 序列有它们自己独特的性质,本节就 AR(p),MA( q),ARMA( p,q)三类模型分别进行讨论。首先给出自相关
20、函数的定义。设nX是一个零均值的平稳时间序列,定义nX的自协方差函数为:kknnkE XXk0 由此定义nX的自相关函数为:0/kkkk05.2.1 AR(p)序列的自相关函数设nX满足 AR(p)模型,我们称nX为 AR(p)序列。重写式 (5.1.1),1122nnnpnpnXXXX用nkX乘上式两边,再取均值,可得,对任意的0k有1122knnknnknnkpnpnknnkE XXEXXXXXXX1122kkpkp , k0 (5.2.1) 因此又有 (两边同除以0) 0,2211kpkpkkk(5.2.2) 或者写成算子形式(以下为方便起见,省掉)(Bp的下标p) 0,0)(kBk这就
21、是AR( p)的自相关函数所满足的方程。由于()0的根均在单位圆外,由差分方程的理论可知:若()0的根互不相同,为p,21,则式 (5.2.2)的通解为0,2211kccckppkkk(5.2.3) 其中pccc,21为常系数, 对任意的0k,kk,而10,故由式 (5.2.3)知pccc,21由以下方程组确定:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法103 121112221()()(
22、)0,1,2,.,1pkkkkkkpppcccccckp若()0有重根,比如r21,则式 (5.2.3)前r项应改为krrkckcc1121)(一般地,设()0有根12,s,重数分别为srrr,21, (1siirp) ,则式 (5.2.2)的通解为krrkkckcc11,12,11 ,1)(11krrkckcc21,22,21 ,2)(22ksrrssssskckcc)(1,2,1,不管()0有无重根,总可证明存在正常数21, gg使0,21kegkgk亦即k随k的增加按指数形式衰减,呈“拖尾”状。上面介绍了从模型参数p,21求自相关系数k的方法。但实际上,我们 并 不 知 道 时 间 序
23、列nX, 而 只 知 道 其 一 个 样 本 , 从 而 我 们 并 不 知 道p,21。由统计理论,自相关系数k可从样本估计得到,模型参数k则是未知的,因此需要从k来求得p,21。在式 (5.2.2) 中,取pk,2, 1可得如下线性方程组:pppppppp22112211211211(5.2.4) 将p,1的估计值代入式(5.2.4),则可求得参数p,21的估计值。 称式(5.2.4)为 Yule-Walker 方程,它是模型识别的基本方程。为求白噪声的方差2,由式 (5.1.1) 22211(.)nnnpnpEEXXX21,12ppnjnnjijninjji jE XXXXX=pjiij
24、jipjjj1,102而由式 (5.2.1)可知pjiijjipjjj1,1,代入2的表达式得Pjiijjipjjj1,0102(5.2.5) 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 33 页 - - - - - - - - - 第 5 章随机型时间序列预测方法104 当从样本求得样本自协方差函数k,并进而求得模型参数i的估计值后,代入上式即得白噪声的方差2的估计值。5.2.3 MA( q)序列的自相关函数当nX为 MA( q)序列时,即110qnnnqnqini
25、iX(其中记10) 则由定义可得,对任意的0k,00()qqknnkijninkjijE XXEqkqkkqkqkkq01)(0)1(112222212(5.2.6) qkqkkqqkqkkk01)1/()(0122111(5.2.7) 上述两式说明,当tX与nX的相距步数qnt时,tX与nX不相关,即MA( q)序列的自协方差(或自相关 )函数k(或k)从qk以后全部为零。称这一性质为“截尾” (对应于AR(p)序列中的拖尾 )的。反过来也可以证明,若一个平稳时间序列的自协方差函数截尾,那么它必定是MA( q)序列。式(5.2.7)已经表明了k与 MA( q)的参数221,q的相互关系。根据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年随机时间序列 2022 随机 时间 序列
限制150内