第三章平稳时间序列分析4216.docx
第3章 平稳时间序列分析一个序列经经过预处理理被识别为为平稳非白白噪声序列列,那就说说明该序列列是一个蕴蕴含着相关关信息的平平稳序列。3.1 方方法性工具具3.1.11 差分运运算一、 p阶差分 记为的1阶差差分:记为的2阶阶差分:以此类推:记为的p阶差差分:二、 k步差分记为的k步步差分:3.1.22 延迟算算子一、 定义 延迟算子相相当与一个个时间指针针,当前序序列值乘以以一个延迟迟算子,就就相当于把把当前序列列值的时间间向过去拨拨了一个时时刻。记BB为延迟算算子,有 延延迟算子的的性质: 1. 2.若c为任任一常数,有有 3.对任意俩俩个序列和,有有 4. 5.二、 用延迟算子子表示差分分运算1、p阶差差分2、 k步差分3.2 ARMAA模型的性性质3.2.11 ARR模型定义 具具有如下结结构的模型型称为p阶阶自回归模模型,简记记为AR(p): (3.44)AR(p)模型有三三个限制条条件:条件一:。这这个限制条条件保证了了模型的最最高阶数为为p。条件二:。这这个限制条条件实际上上是要求随随机干扰序序列为零均均值白噪声声序列。条件三:。这这个限制条条件说明当当期的随机机干扰与过过去的序列列值无关。通常把ARR(p)模模型简记为为: (3.5) 当时,自自回归模型型式(3.4)又称称为中心化化AR(pp)模型。非非中心化AAR(p)序列可以以通过下面面变化中心心化AR(p)系列列。令则为的中心心化序列。 AR(pp)模型又又可以记为为:,其中称为为p阶自回回归系数多多项式二、 AR模型平平稳性判断断P45【例例3.1】 考察如下下四个ARR模型的平平稳性:拟合这四个个序列的序序列值,并并会绘制时时序图,发发现(1)(3)模模型平稳,(2)(44)模型非非平稳1、 特征根判别别 任任一个中心心化AR(p)模型型都可以视视为一个非非齐次线性性差分方程程。则其齐次线线性方程的的特征方程程为:设为齐次线线性方程的的p个特征征根。所以以 AAR(p)模型平稳稳的充要条条件是它的的p个特征征根都在单单位圆内。同时等价于于:AR模模型的自回回归系数多多项式的根根,即的根根,都在单单位圆外。 证证明:设为为齐次线性性方程的pp个特征根根,任取,带带入特征方方程:把带入中,有有根据这个性性质,可以以因子分解解成:,于是可以得得到非其次次线性方程程的一个特特解:2、 平稳域判别别 使得特特征方程的的所有特征征根都在单单位圆内的的系数集合合被称为ARR(p)模模型的平稳稳域。(1) AR(1)模型的平平稳域 AR(11)模型为为:,其特特征方程为为:,特征征根为:。则则AR(11)模型平平稳的充要要条件是,则AR(1)模型型的平稳域域是(2) AR(2)模型的平平稳域 AR(2)模型型为:。其其特征方程程为:,特特征根为:。则ARR(2)模模型平稳的的充要条件件是:,从从而有:因此可以导导出:所以 ARR(2)模模型的平稳稳域: 【例3.11续】 分分别用特征征根判别法法和平稳域域判别法检检验如下四四个AR模模型的平稳稳性:其中模型特征根判别别平稳域判别别结论1)平稳2)非平稳3)平稳4)非平稳三、 平稳AR模模型的统计计性质1、 均值 假假如AR(p)满足足了平稳性性条件,于于是 (3.12)由平稳序列列均值为常常数的性质质得:,因因为,所以以 (3.12)等等价于特别对于中中心化ARR(p)模模型有。2、 方差(1) Greenn函数。设设为平稳AAR(p)模型的特特征根,则则平稳ARR(p)模模型可以写写成: (3.13)其中,系数数称为Grreen函函数。 记,则(3.133)简记为为: (3.14)再将(3.14)带带入AR(p)模型型中,得到到 Greeen函数数的递推公公式为:其中(2)平稳稳AR模型型的方差。对对平稳ARR模型两边边就方差,有有由于,这说说明平稳序序列方差有有界,等于于常数【例3.22】求平稳稳AR(11)模型的的方差。 AR(1)模型型:Greenn函数为:,所以平稳AAR(1)模型的方方差为:3、 协方差函数数 在平平稳模型等等号两边同同时乘,再再求期望,得得又由,可可以得到自自协方差函函数的递推推公式: (3.117)【例3.33】求平稳稳AR(11)模型的的自协方差差函数。 平稳ARR(1)模模型的自协协方差函数数的递推公公式是:又由【例33.2】知知,所以以平稳ARR(1)模模型的自协协方差函数数的递推公公式是:【例3.44】求平稳稳AR(22)模型的的自协方差差函数。 求平稳稳AR(22)模型的的自协方差差函数的递递推公式为为:,特别地,当当k=1时时,有,即即利用Greeen函数数可以推出出AR(22)模型的的协方差:所以平稳AAR(2)模型的协协方差函数数的推导公公式为:4、 自相关系数数(1) 平稳AR模模型自相关关系数的推推导公式。由于,式 (3.17)两边同时除以,可以得到自相关系数的推导公式: 平稳ARR(1)模模型的自相相关系数推推导公式: 平稳ARR(2)模模型的自相相关系数推推导公式:(2) 自相关系数数的性质。平稳AR模型自相关系数有连个显著的特性: 一、拖拖尾性 二、呈呈负指数衰衰减5、 偏自相关系系数(1) 偏自相关系系数的定义义。定义 3.3 对于于平稳序列列,所谓滞滞后k偏自自相关系数数就是指在在给定中间间k-1个个随机变量量条件下,或或者在剔除除中间k-1个随机机变量的干干扰后,的的影响的相相关度量。(2) 偏自相关系系数的计算算。 对于于平稳序列列,用过去去的k期序序列值对作k阶自自回归拟合合,即 (3.112)式中,。在在式(3.12)两两边同时乘乘,并求期期望,得,取前k个方方程构成的的方程组:该方程组成成为YulleWalkker方程程。用矩阵阵表达 (3.27)则,其中D为式 (3.277)的行列列式,为把把D中第kk个列向量量换成(33.27)等号右边边的自相关关系数响亮亮后构成的的行列式。(3) 偏自相关系系数的截尾尾性。 平稳稳的AR(p)模型型的偏自相相关系数具具有p步截截尾性。指指,只要当当k>p时时,。AR(1)模型的偏偏自相关系系数为:AR(2)模型的偏偏自相关系系数为:3.2.22 MA模模型一、 定义定义 3.4 具具有如下结结构的模型型称为q阶阶移动平均均(movving averrage)模型,简简记为MAA(q): (33.32)使用MA(q)模型型需要满足足两个限制制条件:条件一:,这这个限制条条件保证了了模型的最最高阶数为为q。条件二:,即即随机干扰扰项为零均均值白噪声声序列通常把MAA(q)模模型简记为为: (3.33)当时,模型型 (3.33)称称为中心化化MA(qq)模型,而而对非中心心化模型只只需做一个个简单的位位移,就可可以转化证证中心化MMA(q)模型。使用延迟算算子,中心心化MA(q)模型型又简记为为:,式中,称为为q阶移动动平均系数数多项式。二、 MA模型的的统计性质质1、 常数均值 当时时,MA(q)模型型具有常数数均值:如果该模型型为中心化化MA(qq)模型,则则该模型均均值为零。2、 常熟方差3、 自协方差函函数只与滞滞后阶数相相关,且qq阶截尾 =4、 自相关系数数q阶截尾尾MA(1)模型的自自相关系数数为 MA(2)模型型的自相关关系数为5、 偏自相关系系数拖尾(1)当时时,MA(q)模型型一定为平平稳模型。(2)MAA(q)模模型的偏自自相关系数数拖尾,自自相关系数数q阶截尾尾。三、 MA模型的的可逆性 为为了保证一一个给定的的自相关函函数能够对对应唯一的的MA模型型,我们就就要给模型型增加约束束条件。这这个约束条条件称为MMA模型的的可逆性条条件。(1) 可逆的定义义 MAA(1)模模型具有如如下结构式式,他们的的自相关系系数正好相相等: 模模型1: 模型2:把这两个MMA(1)模型表示示成两个自自相关模型型形式: 模模型1: 模模型2: 显然,时时,模型11收敛,而而模型2不不收敛;时时,模型11不收敛,而而模型2收收敛。若一一个MA模模型能够表表示成收敛敛的AR模模型形式,那那么该MAA模型则称称为可逆模模型。一个个自相关系系数唯一对对应一个可可逆MA模模型。(2) MA(q)模型的可可逆性条件件。 MA(q)模型型可以表示示为: (3.334)式中,称为为q阶移动动平均系数数多项式。假定是该系系数多项式式的q个根根,则可以以分解成: (3.335)把(3.335)式带带入(3.34),得得 (3.36)式(3.336)收敛敛的充要条条件是:,等等价于MAA(q)模模型的系数数多项式的的根都在单单位圆外,。这个条件称为MA(q)模型的可逆性条件。3、 逆函数的推推导公式 如果一个个MA(qq)模型满满足可逆性性条件,它它就可以写写成如下两两种等价形形式:把(b)式式带入(aa)式,得得 ,由待定系数数法可以得得到逆函数数的推导公公式: 式中,P64【例例3.6续续】考虑【例例3.6】中中的四个MMA模型的的可逆性,并并写出可逆逆MA模型型的逆转形形势。4、 MA模型偏偏自相关系系数拖尾MA(q)模型延迟迟k阶偏自自相关系数数为:,由于不会会恒等于零零,所以MMA(q)模型偏自自相关系数数拖尾。3.2.33 ARMMA模型一、 定义定义3.55 把具有有如下结构构的模型称称为自回归归移动平均均模型,简简记为ARRMA(pp,q): (3.338) 若,该模型型称为中心心化ARMMA(p,q)模型型。 中心化AARMA(p,q)模型可以以简记为: (3.100) 引入延迟迟算子后,中中心化ARRMA(pp,q)模模型又可以以表示为:式中,显然,当二、 平稳条件与与可逆条件件 对于一个个ARMAA(p,qq)模型,容容易推导出出ARMAA(p,qq)模型的的平稳条件件是:的根根都在单位位圆外。AARMA(p,q)模型可逆逆的条件是是:的根都都在单位圆圆外。 即,当的的根都在单单位圆外是是,称ARRMA(pp,q)模模型为平稳稳可逆模型型。三、 传递形式与与逆转形式式 对于一一个平稳可可逆ARMMA(p,q)模型型,它的传传递形式为为:式中,为GGreenn函数。可可以得到AARMA(p,q)模型下的的Greeen函数的的推导公式式为: 可可以得到AARMA(p,q)模型的逆逆转形式为为:式中,为逆逆函数。可可以得到AARMA(p,q)模型下的的逆函数的的推导公式式为:其中,四、 ARMA(p,q)模型的统统计性质1、 均值对于一个非非中心化平平稳可逆的的ARMAA(p,qq)模型:两边同时求求均值:2、 自协方差函函数3、 自相关系数数考察AR(p)、 MA(qq) 、AARMA(p,q)模型的自自相关系数数和偏自相相关系数,可可以总结出出模型自相关系数数偏自相关系系数AR(p)拖尾p阶截尾MA(q) q阶截尾拖尾ARMA(p,q)拖尾拖尾3.3 平平稳时间序序列3.3.11 时间序序列建模的的一般步骤骤Ø 怎样判断平平稳性?ü 什么是平稳稳性?这里指宽平平稳。如果果序列满足足下列条件件,则称为为是平稳的的。性质3的一一个推论是是,对,记记为,称为为延迟为的的自相关系系数平稳性的直直观含义是是“序列的前前二阶矩不不随时间的的推移而改改变”,这使得得我们可以以把不同时时间点的数数据放在一一起作统计计推断. ü 观察时序图图 根根据平稳性性的定义,平平稳序列具具有常数均均值和常数数方差的性性质,因此此其时序图图应该在一一个常数值值附近波动动,且波动动的范围有有界; 具有明显显趋势性和和周期性的的序列通常常不是平稳稳序列;例如:ü 自相关图检检验 平稳序列通通常只具有有短期的自自相关,即即自相关函函数(ACCF) 往往往很快的的衰减到零零。因此衰衰减很慢的的序列很可可能是非平平稳的。例如前面三三个例子里里面对应的的自相关图图分别如下下: üØ 怎样做白噪噪声检验?ü 什么是白噪噪声?如果序列满满足,则称称为白噪声声序列(WWhitee Noiise),记为如果还服从从正态分布布,则称为为高斯白噪噪声。ü 白噪声是纯纯随机序列列,它具有有性质, 因此我们们可以通过过检验下列列假设来检检验序列是是否是白噪噪声 检验统统计量为LLB(Ljjung-Box)统计量在原假设成成立的条件件下,LBB近似服从从自由度为为m的卡方方分布时拒拒绝原假设设。 注:为什什么只需要要检验前66期,122期或者前前18期的的自相关呢呢?这是因因为一个平平稳序列通通常只存在在短期的自自相关,如如果短期之之间都不存存在显著的的自相关,则则更长期的的延迟之间间就更不会会存在自相相关了;相相反的,如如果存在显显著的短期期自相关,则则该序列必必然不是白白噪声;Ø 怎样计算自自相关系数数和偏自相相关系数?ü 样本自相关关系数(SSACF) ü 样本偏自相相关系数(SPACCF)其中,Ø 怎样识别模模型? 所所谓的模型型识别就是是选取是适适当的p,q,也就就是模型定定阶;ü ARMA模模型的理论论ACF和和理论PAACF理论上讲,我我们可以根根据上述特特点确定模模型的阶,但但在实际操操作中具有有下列障碍碍a) SACF,SPACCF不会出出现理论上上的完美截截尾情况;本应截尾尾的SACCF和SPPACF仍仍会出现小小值震荡的的情况;b) 平稳序列通通常只具有有短期相关关性,当kk足够大是是,SACCF和SPPACF总总会衰减到到零值附近近做小值震震荡。Ø 什么时候认认为?由于近似服服从标准正正态分布,因因此当时,于是有因此,当SSACF落落在2倍标标准差的范范围内是,我我们认为;Ø 怎样判断截截尾还是拖拖尾?如果有SAACF在最最初的d阶阶明显大于于2倍标准准差,而后后几乎955%的SAACF都落落在2倍标标准差内,且且这种过程程很突然,则则可以视为为是“截尾”;反之,如果果超过5%的SACCF都落在在2倍标准准差范围之之外,或者者SACFF衰减到零零的过程比比较缓慢连连续,则通通常不是截截尾;例如:【例2.55】19550-19980年北北京那个城城乡居民定定期储蓄的的占比 定期储蓄蓄占比时序序图因此,我们们可以考虑虑用如下的的AR(11)模型来来拟合该数数据【例3.88】 对美美国科罗拉拉多州某一一加油站连连续57天天的OVEERSHOORT序列列建模因此,我们们可以选取取如下的MMA(1)模型来对对该数据建建模【例3.99】 对11880-19855年全球气气表平均温温度改变值值差分序列列(原数据据不平稳,已已经做过平平稳化处理理了)原数据的时时序图差分后的时时序图上面的SAACF和SSPACFF均没有明明显的截尾尾性,因此此我们可以以考虑用AARMA模模型来拟合合,ARMMA(1,1)模型型:3.3.44 怎样估估计未知参参数? 主要有有两种方法法:极大似似然估计喝喝最小二乘乘估计。 对于下下列一般的的ARMAA(p,qq)模型,其中,Ø 的估计由于是序列列的均值,因因此我们用用样本均值值来估计它它, 我们需要要估计下列列参数共计未知参参数;ü 极大似然估估计似然原则:样本来自自使得该样样本出现概概率最大的的总体方法:找出出样本的联联合密度函函数(即似似然函数),找使得得该函数达达到最大的的参数值记假设服从多多元正态分分布MVNN(0,),则似然然函数为然后对上式式求最大值值得;ü 最小二乘估估计最小化下面面的准则ü 条件最小二二乘法实际中用得得最多的是是所谓的条条件最小二二乘法,它它的想法如如下:回顾ARMMA模型的的逆转形式式:,我们们假设,则条件最小小乘法最小小化下列准准则:在SAS软软件里,只只需要在AARIMAA过程里面面添加如下下语句即可可自动得到到未知参数数的估计 Estiimatee p=*,q=*;【例2.55续】19950-11998年年北京市城城乡居民定定期储蓄比比例estimmatepp=1methhod=mml;estimmatepp=1;极大似然估估计的结果果如下 条件最小小二乘估计计的结果如如下因此估计的的模型为【例3.88续】美国国科罗拉多多州某加油油站连续557天的OOVERSSHORTT数据estimmateqq=1methhod=mml;estimmate q=1;极大似然估估计的结果果如下:条件最小二二乘估计的的结果如下下:因此,估计计得到的模模型为【例3.99续】19980-11985年年全球气表表平均温度度改变差分分值序列estimmatepp=1q=1;estimmatepp=1q=1methhod=mml;极大似然估估计的结果果如下:条件最下二二乘估计的的结果如下下:因此,所得得的模型为为Ø 模型的有效效性检验 模模型的有效效性是看模模型是否充充分地从数数据中提取取了信息,因因此在这里里,一个有有效的好的的模型应该该几乎提取取了数据中中所有的信信息,使得得剩下的残残差中不再再蕴含任何何相关信息息,即残差差应该是纯纯随机的序序列,即白白噪声序列列。这样的的模型才是是显著的有有效的模型型。 因此,在在拟合模型型之后我们们要对残差差做白噪声声检验,如如果检验结结果显示残残差非白噪噪声,则说说明模型不不够有效,还还需要选择择其它的模模型; 在SASS里面,eestimmate过过程中会自自动报告残残差的白噪噪声检验结结果;【例3.88续】美国国科罗拉多多州某加油油站连续557天的OOVERSSHORTT数据 结果果说明MAA(1)模模型有效;【例3.99续】19980-11985年年全球气表表平均温度度改变差分分值序列: 结果果显示ARRMA(11,1)模模型有效; 对该该数据,观观察其ACCF图像,如如果认为AACF1阶阶截尾,我我们拟合MMA(1)模型,发发现残差检检验结果如如下:这表明用MMA(1)模型来拟拟合该数据据是不充分分的,是非非有效的。3.3.66 模型的的优化 当一个拟拟合的模型型通过了残残差检验,说说明了在一一定的置信信水平下,该该模型是有有效的,但但是这种有有效的模型型并不一定定唯一,因因此我们需需要通过模模型优化来来从备选的的有效模型型里面选一一个“最好”的模型;例如:【例3.113】取等等时间间隔隔,读取某某次化学反反应的700个过程数数据,构成成一个时间间序列;现现在要对该该序列建模模.SACF的的图像显示示2阶截尾尾,因此我我们可以尝尝试拟合MMA(2)模型结果如下:显示MA(2)模型型有效,且且模型的形形式为:但是,另一一方面,观观察SPAACF图像像,我们发发现PACCF1阶截截尾,因此此我们也可可以选取AAR(1)模型拟合合的结果如如下:这说明ARR(1)模模型也是有有效的,且且模型的形形式为:ü AIC准则则模型的准确确度参数估计的的准确度参数个数越越多,模型型可选的范范围广,模模型越准确确,但是随随着参数的的增加,估估计的难度度越来越大大,估计的的精度越来来越低,一一个好的模模型应该在在上述两方方面达到均均衡。AIC=-2logg(模型的的极大似然然函数值)+2(模模型中的为为参数个数数) 上上述准则达达到最小化化的模型即即为最优模模型;例如前面例例子里面:MA(2) AIIC=5336.45556AR(1) AAIC=5535.77896因此,在AAIC准则则下,ARR(1)相相对模型最最优AIC准则则的缺点:选择出的的模型通常常比真实模模型所含的的未知参数数个数要多多;ü BIC/SSBC准则则BIC/SSBC=-2logg(模型的的极大似然然函数值)+logg(n)*(模型中中的为参数数个数)MA(2) SBCC=5433.2AR(1) SBBC=5440.3因此AR(1)模型型相对最优优;3.4 序序列预测所谓预测就就是要利用用序列以观观测到的样样本值对序序列在未来来某个时候候的取值进进行估计。最最常用的预预测方法是是线性最小小方差预测测。线性是是指预测值值为观察值值序列的线线性函数,最最小方差是是指预测方方差达到最最小。3.4.11 线性预预测函数 根据AARMA(p,q) 模型的的平稳性和和可逆性,可可以用传递递形式和可可逆形式描描述该模型型: (3.449) (3.500)式中,是GGreenn函数值,为逆转函数值。把式(3.50)代入(3.49),有显然是历史史数据的线线性函数。不不妨简记为为: 对于未来来任意时刻刻的序列值值最终可以以表示成已已知历史信信息的线性性函数,并并用该函数数形式估计计的值:也称为序列列的第步预测测值。3.4.22 预测方方差最小原原则