《平稳时间序列模型的建立课件.pptx》由会员分享,可在线阅读,更多相关《平稳时间序列模型的建立课件.pptx(99页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、流程图平稳非白噪声序列计算样本相关系数模型识别参数估计模型检验模型优化序列预测YN第1页/共99页一、平稳性检验二、纯随机性检验三、计算样本自相关函数四、关于非零均值的平稳序列第一节 时间序列的预处理第2页/共99页本章所介绍的是对零均值平稳序列建立ARMA模型,因此,在对实际的序列进行模型识别之前,应首先检验序列是否平稳,若序列非平稳,应先通过适当变换将其化为平稳序列,然后再进行模型识别.第3页/共99页序列的非平稳包括均值非平稳和方差非平稳.均值非平稳序列平稳化的方法:差分变换.方差非平稳序列平稳化的方法:对数变换、平方根变换等.序列平稳性的检验方法和手段主要有序列平稳性的检验方法和手段主
2、要有:序列趋势图、自相关图、单位根检验、序列趋势图、自相关图、单位根检验、非参数检验方法等等非参数检验方法等等.第4页/共99页一、平稳性检验图检验方法(一)时序图检验 根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征.(二)自相关图检验 平稳序列通常具有短期相关性.该性质用自相关函数来描述就是随着延迟期数的增加,平稳序列的自相关函数会很快地衰减向零.第5页/共99页例题例1检验1964年1999年中国纱年产量序列的平稳性例2检验1962年1月1975年12月平均每头奶牛月产奶量序列的平稳性例3检验1
3、9491949年19981998年北京市每年最高气温序列的平稳性第6页/共99页例1 时序图第7页/共99页例1 自相关图第8页/共99页例2 时序图第9页/共99页例2 自相关图第10页/共99页例3 时序图第11页/共99页例3 自相关图第12页/共99页(一)纯随机序列的定义纯随机序列也称为白噪声序列,它满足如下两条性质 二、纯随机性检验 第13页/共99页(二)纯随机性检验 检验原理 假设条件 检验统计量 判别原则应用举例第14页/共99页BarlettBarlett定理 如果一个时间序列是纯随机的,得到一个观察期数为 的观察序列,那么该序列的延迟非零期的样本自相关系数将近似服从均值为
4、零,方差为序列观察期数倒数的正态分布1、检验原理第15页/共99页2 2、假设条件原假设:延迟期数小于或等于 期的序列值之间相互独立备择假设:延迟期数小于或等于 期的序列值之间有相关性 第16页/共99页3、检验统计量Q统计量 LB统计量 第17页/共99页4 4、判别原则拒绝原假设当检验统计量大于 分位点,或该统计量的P值小于 时,则可以以 的置信水平拒绝原假设,认为该序列为非白噪声序列接受原假设当检验统计量小于 分位点,或该统计量的P值大于 时,则认为在 的置信水平下无法拒绝原假设,即不能显著拒绝序列为纯随机序列的假定 第18页/共99页例4 4、标准正态白噪声序列纯随机性检验样本自相关图
5、样本自相关图5 5、应用举例、应用举例第19页/共99页检验结果延迟统计量检验统计量值P值延迟6期2.360.8838延迟12期5.350.9454由于由于P值显著大于显著性水平值显著大于显著性水平 ,所以该序列,所以该序列不能拒绝纯随机的原假设不能拒绝纯随机的原假设.第20页/共99页例5、对1950年1998年北京市城乡居民定期储蓄所占比例序列的平稳性与纯随机性进行检验 第21页/共99页 自相关图第22页/共99页白噪声检验结果延迟阶数LB统计量检验LB检验统计量的值P值675.460.00011282.57p以后截尾,即kp 时,而且它的自相关函数 拖尾,则可判断此序列是AR(p)序列
6、.第29页/共99页若序列xt的自相关函数 在kq以后截尾,即kq 时,而且它的偏自相关函数 拖尾,则可判断此序列是MA(q)序列.若序列xt的自相关函数、偏相关函数都呈拖尾形态,则可断言此序列是ARMA序列.若序列的自相关函数和偏自相关函数不但都不截尾,而且至少有一个下降趋势势缓慢或呈周期性衰减,则可认为它也不是拖尾的,此时序列是非平稳序列,应先将其转化为平稳序列后再进行模型识别.第30页/共99页模型定阶的困难因为由于样本的随机性,样本的相关系数不会呈现出理论截尾的完美情况,本应截尾的 或 仍会呈现出小值振荡的情况由于平稳时间序列通常都具有短期相关性,随着延迟阶数 ,与 都会衰减至零值附近
7、作小值波动?当 或 在延迟若干阶之后衰减为小值波动时,什么情况下该看作为相关系数截尾,什么情况下该看作为相关系数在延迟若干阶之后正常衰减到零值附近作拖尾波动呢?二、模型定阶第31页/共99页样本相关系数的近似分布BarlettQuenouille1 1、经验定阶方法、经验定阶方法第32页/共99页95的置信区间第33页/共99页模型定阶的经验方法如果样本(偏)自相关系数在最初的p阶明显大于两倍标准差范围,而后几乎95的自相关系数都落在2倍标准差的范围以内,而且通常由非零自相关系数衰减为小值波动的过程非常突然.这时,通常视为(偏)自相关系数截尾.截尾阶数为p.第34页/共99页例1上海延中实业股
8、票数据识别(一阶差分后)上海延中实业股票数据识别(一阶差分后)平均每日生产汽车废品数据的识别平均每日生产汽车废品数据的识别(n n=45)=45)美国女性失业月数据识别(差分后)美国女性失业月数据识别(差分后)第35页/共99页上海延中实业股份有限公司是上海首家向社会公开发行股票的企业.1985.1985年1 1月底发行股票500500万元,其中由上海延中复印工业公司出资3030万元.上海延中实业股票收盘价基本反映了沪市股票的大致走向.总观测期n n619619,先作出原序列的样本自相关函数和样本偏相关函数,其结果见表1 1和图1.1.上海延中实业股票数据识别(一阶差分后)上海延中实业股票数据
9、识别(一阶差分后)第36页/共99页表1 延中股票的样本自相关和样本偏自相关函数值第37页/共99页美国1961年1月至1985年12月间女性失业月人数时间序列美国女性失业月数据识别(差分后)美国女性失业月数据识别(差分后)第38页/共99页第39页/共99页第40页/共99页第41页/共99页第42页/共99页第43页/共99页第44页/共99页2 2、残差方差图定阶法(1 1)基本思想如果拟合的模型阶数与真正阶数不符合,则模型的残差平方和SSESSE必然偏大,残差方差将比真正模型的残差方差大。如果是不足拟合,那么逐渐增加模型阶数,模型的残差方差会渐减少,直到残差方差达到最小。如果是过度拟合
10、,此时逐渐少模型阶数,模型残差方差分逐渐下降,直到残差方差达到最小。第45页/共99页(2 2)残差方差的估计公式注:式中注:式中“实际观察值个数实际观察值个数”是指拟合模型时实际使用是指拟合模型时实际使用的观察值项数,即经过的观察值项数,即经过平稳化后的有效样本容量平稳化后的有效样本容量。设原序列有设原序列有n n个样本,若建立的模型中有含有自回归个样本,若建立的模型中有含有自回归ARAR部分部分,且阶数为且阶数为p p,则实际观察值个数为,则实际观察值个数为n-pn-p个。若没有个。若没有ARAR部分,则部分,则实际观察值个数即为实际观察值个数即为n n个。个。模型的参数个数指模型中所含的
11、参数个数,如:若是不模型的参数个数指模型中所含的参数个数,如:若是不带常数项的带常数项的ARMA(p,q)ARMA(p,q)模型,参数个数为模型,参数个数为p+qp+q个,若带有个,若带有常数项,则参数个数为常数项,则参数个数为p+q+1p+q+1个。个。第46页/共99页用EviewsEviews建立ARMAARMA模型后,可直接得到剩余平方和SSE(Sum squared SSE(Sum squared resid)resid)输出结果中也可直接得到残差标准差:S.E.of regression S.E.of regression,此项的平方即为残差方差。因此,对不同的模型残差方差进行比较
12、,直接比较此项既可。第47页/共99页例:以磨轮剖面数据为例,分别建立适应性模型,输出结果见图示,从中选择最佳模型。第48页/共99页第49页/共99页第50页/共99页第51页/共99页三个模型残差方差比较三个模型残差方差比较第52页/共99页3 3、F F检验定阶法基本思想(以一般情形和ARMA(p,q)ARMA(p,q)模型为例)先对数据拟合ARMA(p,q)ARMA(p,q)模型(假设不含常数项),设其残差平方和为Q Q0 0,再对数据拟合 较低阶的模型ARMA(p-m,q-s)ARMA(p-m,q-s),设其残差平方和为Q Q1 1。建立原假:第53页/共99页在原假设成立的条件下有
13、:在原假设成立的条件下有:于是计算统计量于是计算统计量F,在给定的显著性水平下,在给定的显著性水平下。若若FF,则拒绝原假设,说明两模型差异是显著的,则拒绝原假设,说明两模型差异是显著的,此时模型阶数存在升高的可能性。此时模型阶数存在升高的可能性。若若FF,此不能拒绝原假设,说明两模型差异不显著,此不能拒绝原假设,说明两模型差异不显著,此时模型阶数存在降低的可能性。此时模型阶数存在降低的可能性。注:注:F检验定阶法的应用条件:两模型中有一个为合适模型。检验定阶法的应用条件:两模型中有一个为合适模型。第54页/共99页4 4、最佳准则函数定阶法最佳准则函数法,即确定出一个准则函数,该函数既要考虑
14、某一模型拟合时对原始数据的接近程度,同时又要考虑模型中所含待定参数的个数。建模时,使准则函数达到极小的是最佳模型。第55页/共99页4.1 赤池的AIC准则和BIC准则 4.1.1 AIC 准则(Akaike iformationcriterion)AIC准则是1973年由赤池(Akaike)提出,此准则是对FPE准则(用来判别AR模型的阶数是否合适)的推广,用来识别ARMA模型的阶数。第56页/共99页AIC准则函数为:式中,式中,M为模型中参数的个数。为模型中参数的个数。AIC的简化式为的简化式为:式中:式中:是残差方差是残差方差 的极大似然估计值的极大似然估计值。第57页/共99页Evi
15、ews输出的Akaike info criterion与上述形式略有差别(参见Eviews help),其定义为:其中:其中:n是实际观察值的个数。是实际观察值的个数。第58页/共99页4.1.2 BIC准则柴田(Shibata)1976年证明AIC有过分估计自回归参数的倾向,于是Akaike又提出了AIC方法的贝叶斯扩展,即BIC。BIC准则函数为:式中:式中:C为常数。余同前。为常数。余同前。第59页/共99页4.2 施瓦茨(Schwarz)的SC准则此准则1978年由Schwarz提出,被称为SBC(Schwartzs Bayesian criterion)。准则函数:简化式为:简化式为
16、:第60页/共99页同样Eviews输出的结果与上形式略有差别,其定义为:第61页/共99页准则函数使用注意1 1、当样本量趋于无穷时,用AICAIC准则挑选的最佳模型的阶数往往比真实模型阶数高,而用SBCSBC准则确定的最佳模型的阶数往往与真实模型的阶数相一致。2 2、样本量不是很大时,SBCSBC准则的定阶效果不及AICAIC。第62页/共99页一、矩估计二、极大似然估计三、最小二乘估计 第三节 模型参数估计第63页/共99页一、矩估计原理样本自相关系数估计总体自相关系数样本一阶均值估计总体均值,样本方差估计总体方差第64页/共99页例1 求AR(2)模型系数的矩估计AR(2)模型Yule
17、-Walker方程矩估计(Yule-Walker方程的解)第65页/共99页例2 求MA(1)模型系数的矩估计MA(1)模型方程矩估计第66页/共99页例3 求ARMA(1,1)模型系数的矩估计ARMA(1,1)模型方程矩估计第67页/共99页对矩估计的评价优点估计思想简单直观不需要假设总体分布计算量小(低阶模型场合)缺点信息浪费严重只用到了p+qp+q个样本自相关系数信息,其他信息都被忽略估计精度差通常矩估计方法被用作极大似然估计和最小二乘估计迭代计算的初始值 第68页/共99页二、极大似然估计原理在极大似然准则下,认为样本来自使该样本出现概率最大的总体。因此未知参数的极大似然估计就是使得似
18、然函数(即联合密度函数)达到最大的参数值 第69页/共99页似然方程由于 和 都不是 的显式表达式。因而似然方程组实际上是由p+q+1p+q+1个超越方程构成,通常需要经过复杂的迭代算法才能求出未知参数的极大似然估计值 第70页/共99页对极大似然估计的评价优点极大似然估计充分应用了每一个观察值所提供的信息,因而它的估计精度高同时还具有估计的一致性、渐近正态性和渐近有效性等许多优良的统计性质缺点需要假定总体分布第71页/共99页三、最小二乘估计原理使残差平方和达到最小的那组参数值即为最小二乘估计值 第72页/共99页条件最小二乘估计实际中最常用的参数估计方法假设条件残差平方和方程解法迭代法第7
19、3页/共99页对最小二乘估计的评价优点最小二乘估计充分应用了每一个观察值所提供的信息,因而它的估计精度高条件最小二乘估计方法使用率最高缺点需要假定总体分布第74页/共99页例4 确定1950年1998年北京市城乡居民定期储蓄比例序列拟合模型的口径 拟合模型:AR(1)估计方法:极大似然估计模型口径第75页/共99页例5确定美国科罗拉多州某一加油站连续57天的OVERSHORTS序列拟合模型的口径 拟合模型:MA(1)估计方法:条件最小二乘估计模型口径第76页/共99页例6确定1880-19851880-1985全球气表平均温度改变值差分序列拟合模型的口径 拟合模型:ARMA(1,1)估计方法:
20、条件最小二乘估计模型口径第77页/共99页一、模型检验二、模型的优化 第四节 模型检验与优化第78页/共99页一、模型的检验一、模型的检验1 1、模型的平稳可逆性检验Eviews Eviews 估计结果直接输出自回归部分估计结果直接输出自回归部分所对应的差分方程的特征根所对应的差分方程的特征根:inverted:inverted AR root.AR root.移动平均部分所对应的差分方程的特征移动平均部分所对应的差分方程的特征方程的特征根:方程的特征根:inverted MA root.inverted MA root.第79页/共99页目的检验模型的有效性(对信息的提取是否充分)检验对象残
21、差序列判定原则一个好的拟合模型应该能够提取观察值序列中几乎所有的样本相关信息,即残差序列应该为白噪声序列.反之,如果残差序列为非白噪声序列,那就意味着残差序列中还残留着相关信息未被提取,这就说明拟合模型不够有效.2 2、模型的显著性(适应性)检验第80页/共99页假设条件原假设:残差序列为白噪声序列备择假设:残差序列为非白噪声序列第81页/共99页检验统计量LB统计量第82页/共99页例1检验1950年1998年北京市城乡居民定期储蓄比例序列拟合模型的显著性 残差白噪声序列检验结果延迟阶数LB统计量P值检验结论65.830.3229拟合模型显著有效1210.280.50501811.380.8
22、361第83页/共99页3 3、参数显著性检验目的检验每一个未知参数是否显著非零.删除不显著参数使模型结构最精简 假设条件检验统计量第84页/共99页例2检验1950年1998年北京市城乡居民定期储蓄比例序列极大似然估计模型的参数是否显著 参数检验结果检验参数检验参数t统计量统计量P值值结论结论均值均值46.120.0001显著显著6.720.0001显著显著第85页/共99页例3 对OVERSHORTS序列的拟合模型进行检验 残差白噪声检验参数显著性检验检验参数检验参数t统计量统计量P值值结论结论均值均值3.750.0004显著显著10.600.0001显著显著延迟阶数延迟阶数LB统计量统计
23、量P值值结论结论63.150.6772模型显著模型显著有效有效129.050.6171第86页/共99页例4 对1880-19851880-1985全球气表平均温度改变值差分序列拟合模型进行检验 残差白噪声检验参数显著性检验检验参数检验参数t统计量统计量P值值结论结论16.340.0001显著显著3.50.0007显著显著延迟阶数延迟阶数LB统计量统计量P值值结论结论65.280.2595模型显著模型显著有效有效1210.300.4247第87页/共99页二、模型优化问题提出当一个拟合模型通过了检验,说明在一定的置信水平下,该模型能有效地拟合观察值序列的波动,但这种有效模型并不是唯一的.优化的
24、目的选择相对最优模型 第88页/共99页例7 拟合某一化学序列第89页/共99页序列自相关图第90页/共99页序列偏自相关图第91页/共99页拟合模型一根据自相关系数2阶截尾,拟合MA(2)模型参数估计模型检验模型显著有效 三参数均显著 第92页/共99页拟合模型二根据偏自相关系数1阶截尾,拟合AR(1)模型参数估计模型检验模型显著有效 两参数均显著 第93页/共99页例7 用AIC准则和SBC准则评判两个拟合模型的相对优劣 结果AR(1)优于MA(2)模型模型AICSBCMA(2)536.4556543.2011AR(1)535.7896540.2866第94页/共99页第五节 其它建模方法
25、一、Pandit-WuPandit-Wu建模方法的基本思想二、建模步骤三、Pandit-WuPandit-Wu方法建模举例第95页/共99页一、Pandit-WuPandit-Wu建模方法的基本思想Pandit-Wu建模方法以下面认识为依据:即任一平稳序列总可以用一个ARMA(n,n-1)模型来表示,而AR(p),MA(q)以及ARMA(p,q)都可看作是ARMA(n,n-1)模型的特例。Pandit-Wu方法的基本思想为:逐渐增加模型的阶数,拟合较高阶的ARMA(n,n-1)模型,直到再增加模型的阶数而剩余平方和不显著减少为止。第96页/共99页二、建模步骤1 1、将序列平稳化、零均值化(也可将均值作为一个参数估计)。2 2、从p=1p=1开始,逐渐增加模型阶数,拟合ARMA(2n,2n-1)ARMA(2n,2n-1),并进行模型的适性检验。3 3、模型的检验。4 4、选择最优模型。第97页/共99页三、Pandit-WuPandit-Wu方法建模举例见Eviews操作。第98页/共99页感谢您的观看。第99页/共99页
限制150内