时间序列分析 (2)幻灯片.ppt
时间序列分析第1页,共74页,编辑于2022年,星期六时间序列分析时间序列分析 第2页,共74页,编辑于2022年,星期六横截面数据时间序列数据横截面数据时间序列数据人们对统计数据往往可以根据其特点人们对统计数据往往可以根据其特点从两个方面来切入,以简化分析过程。从两个方面来切入,以简化分析过程。一个是研究所谓横截面一个是研究所谓横截面(cross section)数据,也就是对大体上同时,或者和数据,也就是对大体上同时,或者和时间无关的不同对象的观测值组成的时间无关的不同对象的观测值组成的数据。数据。第3页,共74页,编辑于2022年,星期六横截面数据时间序列数据横截面数据时间序列数据另一个称为时间序列另一个称为时间序列(time series),也,也就是由对象在不同时间的观测值形成就是由对象在不同时间的观测值形成的数据。的数据。前面讨论的模型多是和横截面数据有前面讨论的模型多是和横截面数据有关。这里将讨论时间序列的分析。我关。这里将讨论时间序列的分析。我们将不讨论更加复杂的包含这两方面们将不讨论更加复杂的包含这两方面的数据。的数据。第4页,共74页,编辑于2022年,星期六时间序列和回归时间序列和回归时间序列分析也是一种回归。时间序列分析也是一种回归。回回归归分分析析的的目目的的是是建建立立因因变变量量和和自自变变量量之之间间关关系系的的模模型型;并并且且可可以以用用自自变变量量来来对对因因变变量量进进行行预预测测。通通常常线线性性回回归归分分析析因因变变量量的的观观测测值值假假定定是互相独立并且有同样分布。是互相独立并且有同样分布。第5页,共74页,编辑于2022年,星期六时间序列和回归时间序列和回归而而时时间间序序列列的的最最大大特特点点是是观观测测值值并并不不独独立立。时时间间序序列列的的一一个个目目的的是是用用变变量量过过去去的的观观测测值值来来预预测测同同一一变变量量的的未未来来值。值。即即时时间间序序列列的的因因变变量量为为变变量量未未来来的的可可能能值值,而而用用来来预预测测的的自自变变量量中中就就包包含含该变量的一系列历史观测值。该变量的一系列历史观测值。当当然然时时间间序序列列的的自自变变量量也也可可能能包包含含随着时间度量的独立变量。随着时间度量的独立变量。第6页,共74页,编辑于2022年,星期六例例tssales.txt下下面面看看一一个个时时间间序序列列的的数数据据例例子子。这这是是某某企企业业从从1990年年1月月到到2002年年12月月的的销销售售数据数据(tssales.txt)。我我们们希希望望能能够够从从这这个个数数据据找找出出一一些些规规律律,并并且且建建立立可可以以对对未未来来的的销销售售额额进进行行预预测测的的时间序列模型。时间序列模型。第7页,共74页,编辑于2022年,星期六从该表格中的众多的数据只能够看出个大概;即从该表格中的众多的数据只能够看出个大概;即总的趋势是增长,但有起伏。总的趋势是增长,但有起伏。第8页,共74页,编辑于2022年,星期六例例tssales.txt利用点图则可以得到对该数据更加直观的印象:利用点图则可以得到对该数据更加直观的印象:某企业从某企业从1990年年1月到月到2002年年12月的销售数据图(单位:百万元)月的销售数据图(单位:百万元)第9页,共74页,编辑于2022年,星期六例例tssales.txt从从这这个个点点图图可可以以看看出出。总总的的趋趋势势是是增增长长的的,但但增增长长并并不不是是单单调调上上升升的的;有有涨涨有有落落。但但这这种种升升降降不不是是杂杂乱乱无无章章的的,和和季季节节或或月月份份的的周周期期有有关关系系。当当然然,除除了了增增长长的的趋趋势势和和季季节节影影响响之之外外,还还有有些些无无规规律律的的随随机机因因素素的的作用。作用。第10页,共74页,编辑于2022年,星期六SPSS的的实现实现:时间序列数据的产生时间序列数据的产生SPSS并不会自动把某些变量看成带有某些周并不会自动把某些变量看成带有某些周期的时间序列;需要对该变量的观测值附加期的时间序列;需要对该变量的观测值附加上时间因素。上时间因素。例数据例数据tasales.sav原本只有一个变量原本只有一个变量sales。这。这样就需要附加带有周期信息的时间。样就需要附加带有周期信息的时间。方法是通过选项方法是通过选项DataDefine Dates,然后在然后在Cases Are选择选择years,months(年月年月),并指定第一个观测值(并指定第一个观测值(First Case Is)是)是1990年年1月。月。第11页,共74页,编辑于2022年,星期六SPSS的的实现实现:时间序列数据的点图时间序列数据的点图对时间序列点图可以选择对时间序列点图可以选择GraphsSequence,对本,对本例选择例选择sales为变量,为变量,months为时间轴的标记即为时间轴的标记即可。可。第12页,共74页,编辑于2022年,星期六15.1 15.1 时间序列的组成部分时间序列的组成部分 从从该该例例可可以以看看出出,该该时时间间序序列列可可以以有有三三部部分分组组成成:趋趋势势(trend)、季季节节(seasonal)成成分分和和无无法法用用 趋趋 势势 和和 季季 节节 模模 式式 解解 释释 的的 随随 机机 干干 扰扰(disturbance)。)。例例中中数数据据的的销销售售就就就就可可以以用用这这三三个个成成分分叠叠加加而而成成的模型来描述。的模型来描述。一一般般的的时时间间序序列列还还可可能能有有循循环环或或波波动动(Cyclic,or fluctuations)成成分分;循循环环模模式式和和有有规规律律的的季季节节模模式式不不同同,周周期期长长短短不不一一定定固固定定。比比如如经济危机周期,金融危机周期等等。经济危机周期,金融危机周期等等。第13页,共74页,编辑于2022年,星期六时间序列的组成部分时间序列的组成部分 一一个个时时间间序序列列可可能能有有趋趋势势、季季节节、循循环环这这三三个个成成分分中中的的某某些些或或全全部部再再加上随机成分。因此,加上随机成分。因此,如如果果要要想想对对一一个个时时间间序序列列本本身身进进行行较较深深入入的的研研究究,把把序序列列的的这这些些成成分分分分解解出出来来、或或者者把把它它们们过过虑虑掉掉则则会会有有很很大大的帮助。的帮助。第14页,共74页,编辑于2022年,星期六时间序列的组成部分时间序列的组成部分 如如果果要要进进行行预预测测,则则最最好好把把模模型型中中的的与与趋趋势势、季季节节、循循环环等等成成分分有有关关的的参参数估计出来。数估计出来。就就例例中中的的时时间间序序列列的的分分解解,通通过过计计算算机机统统计计软软件件,可可以以很很轻轻而而易易举举地地得得到到该该序序列列的的趋趋势势、季季节节和和误误差差成成分。分。第15页,共74页,编辑于2022年,星期六时间序列的组成部分时间序列的组成部分 下图表示了去掉季节成分,只有趋势和误差成分的序列。下图表示了去掉季节成分,只有趋势和误差成分的序列。第16页,共74页,编辑于2022年,星期六时间序列的组成部分时间序列的组成部分 下图用两条曲线分别描绘了趋势成分和季节成分。下图用两条曲线分别描绘了趋势成分和季节成分。第17页,共74页,编辑于2022年,星期六时间序列的组成部分时间序列的组成部分 下图用两条曲线分别描绘了趋势成分和误差成分。下图用两条曲线分别描绘了趋势成分和误差成分。第18页,共74页,编辑于2022年,星期六SPSS的的实现实现:时间序列的分解时间序列的分解前面前面对例对例tssales.sav数据进行分解利用数据进行分解利用SPSS的选的选项项Analyze-Time Series-Seasonal Decomposition,然后在然后在Variable(s)(变量变量)处选择处选择sales,在在Model选择选择Additive(可加模型,也可以试可乘可加模型,也可以试可乘模型模型Multiplicative),最后得到四个附加变量,它们是:最后得到四个附加变量,它们是:误差(误差(err_1)、)、季节调整后的序列(季节调整后的序列(sas_1)、)、季节因素(季节因素(saf_1)去掉季节后的趋势循环因素(去掉季节后的趋势循环因素(stc_1)。)。前面图都是利用前面图都是利用GraphsSequence选项所做。选项所做。注意附加变量的名字根据前面已经得到过的附加变量数目而调整注意附加变量的名字根据前面已经得到过的附加变量数目而调整(按照性质及顺序按照性质及顺序)第19页,共74页,编辑于2022年,星期六15.2 15.2 指数平滑指数平滑 如如果果不不仅仅满满足足于于分分解解现现有有的的时时间间序序列列,而而想想要要对对未未来来进进行行预预测测,就就需需要要建建立立模模型型。这这 里里 先先 介介 绍绍 比比 较较 简简 单单 的的指指 数数 平平 滑滑(exponential smoothing)。指指数数平平滑滑只只能能用用于于纯纯粹粹时时间间序序列列的的情情况况,而而不不能能用用于于含含有有独独立立变变量量时时间间序序列列的的因因果果关系的研究。关系的研究。第20页,共74页,编辑于2022年,星期六15.2 15.2 指数平滑指数平滑 指指数数平平滑滑的的原原理理为为:当当利利用用过过去去观观测测值值的的加加权权平平均均来来预预测测未未来来的的观观测测值值时时(这这个个过过程程称称为为平平滑滑),离离得得越越近近的的观观测测值值要要给给以以更多的权。更多的权。而而“指指数数”意意味味着着:依依已已有有观观测测值值“老老”的程度,其权数按指数速度递减。的程度,其权数按指数速度递减。以以简简单单的的没没有有趋趋势势和和没没有有季季节节成成分分的的纯纯粹粹时时间间序序列列为为例例,指指数数平平滑滑在在数数学学上上是是一一个个几何级数。几何级数。第21页,共74页,编辑于2022年,星期六指数平滑指数平滑 这这时时,如如果果用用Yt表表示示在在t时时间间的的平平滑滑后后的的数数据据(或或预预测测值值),而而用用X1,X2,Xt表表示示原原始始的的时间序列。那么指数平滑模型为时间序列。那么指数平滑模型为 或者,等价地,或者,等价地,这里的系数为几何级数。因此称之为这里的系数为几何级数。因此称之为“几何平滑几何平滑”比使人不解的比使人不解的“指数平滑指数平滑”似乎更有道理。似乎更有道理。第22页,共74页,编辑于2022年,星期六指数平滑指数平滑 自自然然,这这种种在在简简单单情情况况下下导导出出的的公公式式(如如上上面面的的公公式式)无无法法应应对对具具有有各各种种成分的复杂情况。成分的复杂情况。后后面面将将给给出出各各种种实实用用的的指指数数平平滑滑模模型型的公式。的公式。根根据据数数据据,可可以以得得到到这这些些模模型型参参数数的估计以及对未来的预测。的估计以及对未来的预测。第23页,共74页,编辑于2022年,星期六指数平滑指数平滑 在在和和我我们们例例子子有有关关的的指指数数平平滑滑模模型型中中,需需要要估估计计1212个个季季节节指指标标和和三三个个参参数数(包包含含前前面面公公式式权权重重中中的的a a,和和趋趋势势有有关关的的g g,以以及及和季节指标有关的和季节指标有关的d d)。)。在在简简单单的的选选项项之之后后,SPSSSPSS通通过过指指数数平平滑滑产产生生了了对对20032003年年一一年年的的预预测测。下下图图为为原原始始的的时时间间序序列列和和预预测测的的时时间间序序列列(光光滑滑后后的的),其其中中包包括括对对20032003年年1212个个月月的的预预测测。图图下下面为误差。面为误差。第24页,共74页,编辑于2022年,星期六我们例中时间序列数据的指数平滑和对未来的预测我们例中时间序列数据的指数平滑和对未来的预测 第25页,共74页,编辑于2022年,星期六SPSS的的实现实现:指数平滑指数平滑:tssales.sav数据数据用选项用选项AnalyzeTime SeriesExponential Smoothing,然后,然后在在Variable(s)(变量变量)处选择处选择sales,在,在Model选择选择custom(自选模自选模型型),再点,再点Custom之后再在之后再在Trend Component选选Exponential(这主要是因为看到序列原始点图趋势不象直线这主要是因为看到序列原始点图趋势不象直线,其实选其实选Linear也也差不多差不多;此外还有此外还有Damped(减幅减幅)选项选项)在在Seasonal Component选选Additive(这是可加模型,也可以试选这是可加模型,也可以试选可乘模型:可乘模型:Multiplicative,细节可参看公式,细节可参看公式)Continue之后,再点击之后,再点击Parameters来估计参数,在三个有关来估计参数,在三个有关参数选项上:参数选项上:General(Alpha)、Trend(Gamma)和和Seasonal(Delta)可均选可均选Grid Search(搜寻,这是因为不知道(搜寻,这是因为不知道参数是多少合适,参数意义参见后面公式),然后参数是多少合适,参数意义参见后面公式),然后Continue。最后如果要预测新观测值,在主对话框点击最后如果要预测新观测值,在主对话框点击Save,在,在Predict Cases中选择中选择Predict through下面的截止年月(这里选下面的截止年月(这里选了了2003年年12月)。这样就可以得到各种结果了。月)。这样就可以得到各种结果了。第26页,共74页,编辑于2022年,星期六SPSS的的实现实现:指数平滑指数平滑结果中增加的变量有误差结果中增加的变量有误差(err_1)和拟合(预测)和拟合(预测)值值fit_1。这在前面图中绘。这在前面图中绘出。在出。在SPSS输出文件中还输出文件中还有那些估计的参数值(三有那些估计的参数值(三个参数加上季节因子)。个参数加上季节因子)。第27页,共74页,编辑于2022年,星期六15.3 Box-Jenkins 方法方法:ARIMA模型模型 如如果果要要对对比比较较复复杂杂的的纯纯粹粹时时间间序序列列进进行行细细致致的的分分析析,指指数数平平滑滑往往往往是是无无法法满满足足要求的。要求的。而而若若想想对对有有独独立立变变量量的的时时间间序序列列进进行行预预测测,指数平滑更是无能为力。指数平滑更是无能为力。需需要要更更加加强强有有力力的的模模型型。这这就就是是下下面面要要介绍的介绍的Box-Jenkins ARIMA模型。模型。数数学学上上,指指数数平平滑滑仅仅仅仅是是ARIMA模模型型的的特例。特例。第28页,共74页,编辑于2022年,星期六ARIMA模型模型:AR模型模型比比指指数数平平滑滑要要有有用用和和精精细细得得多多的的模模型型是是Box-Jenkins引引入入的的ARIMA模模型型。或或称称为为整整合合自自回回归归移移动动平平均均模模型型(ARIMA 为为Autoregressive Integrated Moving Average一些关键字母的缩写一些关键字母的缩写)。该该模模型型的的基基础础是是自自回回归归和和移移动动平平均均模模型型或或ARMA(Autoregressive and Moving Average)模型。模型。第29页,共74页,编辑于2022年,星期六ARIMA模型模型:AR模型模型ARMA由由两两个个特特殊殊模模型型发发展展而而成成,一一个个是是自自回回归归模模型型或或AR(Autoregressive)模模型型。假假定定时时间间序序列列用用X1,X2,Xt表表示示,则则一一个个纯纯粹粹的的AR(p)模模型型意意味味着着变变量量的的一一个个观观测测值值由由其其以以前前的的p个个观观测测值值的的线线性性组组合合加加上上随随机机误误差差项项at(该该误误差差为为独独立立无无关的)而得:关的)而得:这看上去象自己对自己回归一样,所以称为自回归模型;这看上去象自己对自己回归一样,所以称为自回归模型;它牵涉到过去它牵涉到过去p个观测值(相关的观测值间隔最多为个观测值(相关的观测值间隔最多为p个个.第30页,共74页,编辑于2022年,星期六ARIMA模型模型:MA模型模型ARMA模模型型的的另另一一个个特特例例为为移移动动平平均均模模型型或或MA(Moving Average)模模型型,一一个个纯纯粹粹的的MA(q)模模型型意意味味着着变变量量的的一一个个观观测测值值由由目目前前的的和和先先前的前的q个随机误差的线性的组合:个随机误差的线性的组合:由于右边系数的和不为由于右边系数的和不为1(q q 甚至不一定是正数),甚至不一定是正数),因此叫做因此叫做“移动平均移动平均”不如叫做不如叫做“移动线性组移动线性组合合”更确切;虽然行家已经习惯于叫更确切;虽然行家已经习惯于叫“平均平均”了,了,但初学者还是因此可能和初等平滑方法中的什么但初学者还是因此可能和初等平滑方法中的什么“三点平均三点平均”之类的术语混淆。之类的术语混淆。第31页,共74页,编辑于2022年,星期六ARIMA模型模型:ARMA模型模型显显然然,ARMA(p,q)模模型型应应该该为为AR(p)模模型型和和MA(q)模型的组合了:模型的组合了:ARMA(p,0)模型就是模型就是AR(p)模型,而模型,而ARMA(0,q)模型就是模型就是MA(q)模型。这个一般模型模型。这个一般模型有有p+q个参数要估计,看起来很繁琐,但利个参数要估计,看起来很繁琐,但利用计算机软件则是常规运算;并不复杂。用计算机软件则是常规运算;并不复杂。第32页,共74页,编辑于2022年,星期六ARIMA模型:平稳性和可逆性模型:平稳性和可逆性但但是是要要想想ARMA(p,q)模模型型有有意意义义则则要要求求时时间间序序列列 满满 足足 平平 稳稳 性性(stationarity)和和 可可 逆逆 性性(invertibility)的条件,的条件,这这意意味味着着序序列列均均值值不不随随着着时时间间增增加加或或减减少少,序序列列的的方方差差不不随随时时间间变变化化,另另外外序序列列本本身身相相关的模式不改变等。关的模式不改变等。一一个个实实际际的的时时间间序序列列是是否否满满足足这这些些条条件件是是无无法法在在数数学学上上验验证证的的,但但模模型型可可以以近近似似地地从从后后面面要要介介绍绍的的时时间间序序列列的的自自相相关关函函数数和和偏偏相相关关函数图来识别。函数图来识别。第33页,共74页,编辑于2022年,星期六ARIMA模型:差分模型:差分一一般般人人们们所所关关注注的的的的有有趋趋势势和和季季节节/循循环环成成分分的的时时间间序序列列都都不不是是平平稳稳的的。这这时时就就需需要要对对时时间间序序列列进进行行差差分分(difference)来来消消除除这这些些使使序序列列不不平平稳稳的的成成分分,而而使使其其变变成成平平稳稳的的时时间间序序列列,并并估计估计ARMA模型,模型,估估计计之之后后再再转转变变该该模模型型,使使之之适适应应于于差差分分之之前前的的序序列列(这这个个过过程程和和差差分分相相反反,所所以以称称为为整整合合的的(integrated)ARMA模模型型),得得到到的的模模型型于于是是称为称为ARIMA模型。模型。第34页,共74页,编辑于2022年,星期六ARIMA模型:差分模型:差分差差分分是是什什么么意意思思呢呢?差差分分可可以以是是每每一一个个观观测测值值减减去去其其前前面面的的一一个个观观测测值值,即即Xt-Xt-1。这样,这样,如如果果时时间间序序列列有有一一个个斜斜率率不不变变的的趋趋势势,经经过过这这样样的的差差分分之之后后,该该趋趋势势就会被消除了。就会被消除了。第35页,共74页,编辑于2022年,星期六ARIMA模型:差分模型:差分当当然然差差分分也也可可以以是是每每一一个个观观测测值值减减去去其其前前面面任任意意间间隔隔的的一一个个观观测测值值;比比如如存存在在周期固定为周期固定为s的季节成分,的季节成分,那那么么相相隔隔s的的差差分分 为为Xt-Xt-s就就可可以以把把这这种种以以s为周期的季节成分消除。为周期的季节成分消除。对对于于复复杂杂情情况况,可可能能要要进进行行多多次次差差分分,才才能够使得变换后的时间序列平稳。能够使得变换后的时间序列平稳。第36页,共74页,编辑于2022年,星期六ARMA模型的识别和估计模型的识别和估计 上面引进了一些必要的术语和概念。下上面引进了一些必要的术语和概念。下面就如何识别模型进行说明。面就如何识别模型进行说明。要想拟合要想拟合ARIMA模型,必须先把它利用模型,必须先把它利用差分变成差分变成ARMA(p,q)模型,并确定是否模型,并确定是否平稳,然后确定参数平稳,然后确定参数p,q。后面将利用一个例子来说明如何识别一后面将利用一个例子来说明如何识别一个个AR(p)模型和参数模型和参数p。由此由此MA(q)及及ARMA(p,q)模型模型可用类模型模型可用类似的方法来识别。似的方法来识别。第37页,共74页,编辑于2022年,星期六ARMA模型的识别和估计模型的识别和估计 根据根据ARMA(p,q)模型的定义模型的定义,它的参数它的参数p,q和自相关函数和自相关函数(acf,autocorrelations function)及偏自相关函数及偏自相关函数(pacf,partial autocorrelations function)有关。有关。自相关函数描述观测值和前面的观测值的自相关函数描述观测值和前面的观测值的相关系数;相关系数;而偏自相关函数为在给定中间观测值的而偏自相关函数为在给定中间观测值的条件下观测值和前面某间隔的观测值的条件下观测值和前面某间隔的观测值的相关系数。相关系数。第38页,共74页,编辑于2022年,星期六ARMA模型的识别和估计模型的识别和估计 这里当然不打算讨论这里当然不打算讨论acf和和pacf这两个这两个概念的细节。概念的细节。引进这两个概念主要是为了能够引进这两个概念主要是为了能够了解了解如何通过研究关于这两个函数的如何通过研究关于这两个函数的acf和和pacf图来识别模型。图来识别模型。第39页,共74页,编辑于2022年,星期六例:数据例:数据AR1.txt 为了直观地理解上面的概念,下面利用一个数据例子来描述。为了直观地理解上面的概念,下面利用一个数据例子来描述。第40页,共74页,编辑于2022年,星期六例:数据例:数据AR1.txt;拖尾和截尾;拖尾和截尾先来看该时间序列的先来看该时间序列的acf(左左)和和pacf图图(右右)左左边边的的acf条条形形图图是是衰衰减减的的正正弦弦型型的的波波动动;这这种种图图形形称称为为拖拖尾尾。而而右右边边的的pacf条条形形图图是是在在第第一一个个条条(p=1)之之后后就就很很小小,而而且且没没有有什什么么模模式式;这这种种图图形形称称为为在在在在p=1后后截截尾尾。这这说说明明该该数数据满足是平稳的据满足是平稳的AR(1)模型。模型。第41页,共74页,编辑于2022年,星期六例:数据例:数据AR1.txt;拖尾和截尾拖尾和截尾注意,所谓拖尾图形模式也可能不是正弦形式,注意,所谓拖尾图形模式也可能不是正弦形式,但以指数率衰减。类似地,如果但以指数率衰减。类似地,如果acf图形是在第图形是在第q=k个条后截尾,而个条后截尾,而pacf图形为拖尾,则数据满图形为拖尾,则数据满足足MA(q)模型。如果两个图形都拖尾则可能满足模型。如果两个图形都拖尾则可能满足ARMA(p,q)模型。具体判别法总结在下面表中:模型。具体判别法总结在下面表中:第42页,共74页,编辑于2022年,星期六acf和和pacf图图如如acf和和pacf图图中中至至少少一一个个不不是是以以指指数数形形式式或或正正弦弦形形式式衰衰减减,那那么么说说明明该该序序列列不不是是平平稳稳序序列列,必必须须进进行行差差分分变变换换来来得得到到一一个个可可以以估估计计参参数数的的满满足足ARMA(p,q)模模型的序列。型的序列。如如一一个个时时间间序序列列的的acf和和pacf图图没没有有任任何何模模式式,而而且且数数值值很很小小,那那么么该该序序列列可可能能就就是是一一些些互互相相独独立立的的无无关关的的随随机机变变量量。一一个个很很好好拟拟合合的的时时间间序序列列模模型型的的残残差差就就应应该该有有这这样的样的acf和和pacf图。图。第43页,共74页,编辑于2022年,星期六例:数据例:数据AR1.txt根据根据acf和和pacf图图的形态,不用进行任的形态,不用进行任何差分就可以直接用何差分就可以直接用AR(1)模型拟合。模型拟合。利用利用SPSS软件,选择软件,选择AR(1)模型模型(等等价地价地ARIMA(1,0,0)(0,0,0)模型模型),),得到得到参数估计为参数估计为 1 1=0.86;=0.86;也就是说该也就是说该AR(1)模型为模型为 第44页,共74页,编辑于2022年,星期六例:数据例:数据AR1.txt下下图图为为ar1.sav数数据据的的原原始始序序列列和和由由模模型型得得到到的的拟拟合合值值以以及及对对未未来来10个观测的预测图;看来拟合得还不错。个观测的预测图;看来拟合得还不错。第45页,共74页,编辑于2022年,星期六例:数据例:数据AR1.txt下下面面再再看看剩剩下下的的残残差差序序列列是是否否还还有有什什么么模模式式。这这还还可可以以由由残残差差的的pacf(左左)和和acf(右右)图图来来判判断断。可可以以看看出出,它它们们没没有有什什么么模模式式;这这说说明明拟拟合合比比较较成成功。功。第46页,共74页,编辑于2022年,星期六例:数据例:数据AR1.txt下下图图为为残残差差对对拟拟合合值值的的散散点点图图。看看不不出出任任何何模模式式。说明残差的确是独立的和随机的。说明残差的确是独立的和随机的。第47页,共74页,编辑于2022年,星期六ARIMA(p,d,q)(P,D,Q)s模型模型在在对对含含有有季季节节和和趋趋势势/循循环环等等成成分分的的时时间间序序列列进进行行ARIMA模模型型的的拟拟合合研研究究和和预预测测时时,就就不不象象对对纯纯粹粹的的满满足足可可解解条条件件的的ARMA模型那么简单了。模型那么简单了。一一般般的的ARIMA模模型型有有多多个个参参数数,没没有有季季节节成成分分的的可可以以记记为为ARIMA(p,d,q),如如果果没没有有必必要要利利用用差差分分来来消消除除趋趋势势或或循循环环成成分分时时,差差分分阶阶数数d=0,模模型型为为ARIMA(p,0,q),即即ARMA(p,q)。第48页,共74页,编辑于2022年,星期六ARIMA(p,d,q)(P,D,Q)s模型模型在在有有已已知知的的固固定定周周期期s时时,模模型型多多了了4个个参参数数,可可记记为为ARIMA(p,d,q)(P,D,Q)s。这这里里增增加加的的除除了了周周期期s已已知知之之外外,还还有有描描述述季季节节本本身身的的ARIMA(P,D,Q)的的模模型型识识别别问问题题。因因此此,实实际际建建模模要要复复杂得多。需要经过反复比较。杂得多。需要经过反复比较。第49页,共74页,编辑于2022年,星期六用用ARIMA模型拟合例模型拟合例tssales.txttssales.txt 对对数数据据tssales.txt序序列列已已进进行行了了分分解解,并并用用指指数数平平滑做了预测滑做了预测,知有季节和趋势成分。知有季节和趋势成分。要对其进行要对其进行ARIMA模型拟合,先对该序列做模型拟合,先对该序列做acf和和pacf条形图。其条形图。其中中acf图显然不是拖尾(不是以指数速率递减),因此需要进行差分。图显然不是拖尾(不是以指数速率递减),因此需要进行差分。第50页,共74页,编辑于2022年,星期六用用ARIMA模型拟合例模型拟合例tssales.txttssales.txt 关关于于于于参参数数,不不要要选选得得过过大大;每每次次拟拟合合之之后后要要检检查查残残差差的的acf和和pacf图图,看看是是否否为为无无关关随随机机序列。序列。在在SPSS软软件件中中还还有有类类似似于于回回归归系系数数的的检检验验以以及及其其他他一一些些判判别别标标准准的的计计算算机机输输出出可可做做参参考考(这这里里不细说)。不细说)。经经过过几几次次对对比比之之后后,对对于于例例16.1数数据据我我们们最最后后选选中中了了ARIMA(0,1,1)(0,1,1)12模模型型来来拟拟合合。拟拟合的结果和对合的结果和对2003年年12个月的预测在下图中。个月的预测在下图中。第51页,共74页,编辑于2022年,星期六例例tssales.txt的原始序列和由模型得到的拟合值及对未来的原始序列和由模型得到的拟合值及对未来12个个月的预测图。月的预测图。第52页,共74页,编辑于2022年,星期六例:数据例:数据tssales.txttssales.txt为为了了核核对对,当当然然要要画画出出残残差差的的acf和和pacf的的条条形形图图来来看看是是否否还还有有什什么么非非随随机机的的因因素素存存在在。下下图图为为这这两两个个点点图图,看看来来我我们们的的模模型型选择还是适当的。选择还是适当的。第53页,共74页,编辑于2022年,星期六用用ARIMA模型拟合带有独立变量的时间序列模型拟合带有独立变量的时间序列 例例:数据:数据tsadds2.txt是一个销售时间序列,以每周七天为一个是一个销售时间序列,以每周七天为一个季节周期,除了销售额序列季节周期,除了销售额序列sales之外,还有一个广告花费的独之外,还有一个广告花费的独立变量立变量adds。先不理睬这个独立变量,把该序列当成纯粹。先不理睬这个独立变量,把该序列当成纯粹时间序列来用时间序列来用ARIMA模型拟合。右图为该序列的点图。模型拟合。右图为该序列的点图。第54页,共74页,编辑于2022年,星期六数据数据tsadds2.txt再首先点出其再首先点出其acfacf和和pacfpacf条形图条形图 acf图显然不是拖尾模式,因此,必须进行差分以消图显然不是拖尾模式,因此,必须进行差分以消除季节影响。试验多次之后,看上去除季节影响。试验多次之后,看上去ARIMA(2,1,2)(0,1,1)7的结果还可以接受。残差的的结果还可以接受。残差的pacfpacf和和acfacf条形图条形图在下一页图中在下一页图中 第55页,共74页,编辑于2022年,星期六用用ARIMA模型拟合带有独立变量的时间序列模型拟合带有独立变量的时间序列 继续改进我们的模型,再把独立变量广告支继续改进我们的模型,再把独立变量广告支出加入模型,最后得到的带有独立变量出加入模型,最后得到的带有独立变量adds的的ARIMA(2,1,2)(0,1,1)7模型。拟合后的残模型。拟合后的残差图在下图中。差图在下图中。第56页,共74页,编辑于2022年,星期六用用ARIMA模型拟合带有独立变量的时间序列模型拟合带有独立变量的时间序列 从各种角度来看拟合带独立变量平方的从各种角度来看拟合带独立变量平方的ARIMA(2,1,2)ARIMA(2,1,2)(0,1,1)(0,1,1)7 7模型给出更好的结果。模型给出更好的结果。虽然从上面的虽然从上面的acfacf和和pacfpacf图看不出(一般图看不出(一般也不应该看出)独立变量对序列的自相关也不应该看出)独立变量对序列的自相关性的影响,但是根据另外的一些判别准则,性的影响,但是根据另外的一些判别准则,独立变量的影响是显著的独立变量的影响是显著的;加入独立变量加入独立变量使得模型更加有效。使得模型更加有效。第57页,共74页,编辑于2022年,星期六用用ARIMA模型拟合带有独立变量的时间序列模型拟合带有独立变量的时间序列 要要注注意意,一一些些独独立立变变量量的的效效果果也也可可能能是是满满足足某某些些时时间间序序列列模模型型的的,也也可可能能会会和和季季节节、趋趋势势等等效效应应混混杂杂起起来来不不易易分辩。分辩。这这时时,模模型型选选择择可可能能就就比比较较困困难难。也也可能不同模型会有类似的效果。可能不同模型会有类似的效果。第58页,共74页,编辑于2022年,星期六用用ARIMA模型拟合带有独立变量的时间序列模型拟合带有独立变量的时间序列 一一个个时时间间序序列列在在各各种种相相关关的的因因素素影影响响下下的的模模型型选选择择并并不不是是一一件件简简单单明明了了的的事情。事情。实实际际上上没没有有任任何何统统计计模模型型是是绝绝对对正正确确的的,它它们们的的区区别别在在于于,在在某某种种意意义义上上,一一些些模模型型的的某某些些性性质质可可能能要要优优于于另另外外一些。一些。第59页,共74页,编辑于2022年,星期六SPSS的的实现实现:ARIMA模型模型 时时间间序序列列的的acf和和pacf图图:可可以以用用选选项项GraphsTime SeriesAutocorrelations,然然后后把把变变量量选选入入Variables中中(对对于于数数据据AR1.sav,把时间序列,把时间序列Z选入选入)。在在 Display中中(默默 认认 地地)有有 选选 项项Autocorrelations和和Partial autocorrelations导致导致acf和和pacf图。图。人们还经常对残差项绘人们还经常对残差项绘acf和和pacf图。图。第60页,共74页,编辑于2022年,星期六SPSS的的实现实现:ARIMA(p,d,q)(P,D,Q)s模型拟合模型拟合 选选择择AnalyzeTime SeriesARIMA,然然后后把把数数据据中中的的时时间间序序列列选选入入Dependent(在在数数据据AR1.sav中中,选选 Z,对对 数数 据据 tssales.sav时时 选选 sales,而而 对对 数数 据据tsadds2.sav时时选选sales),对对于于Independent,仅仅在在使使用用数据数据tsadds2.sav时选了时选了adds。在在Model的的第第一一列列为为ARIMA(p,d,q)(P,D,Q)s模模型型的的 前前 三三 个个 参参 数数(p,d,q),第第 二二 列列(sp,sd,sq)为为ARIMA(p,d,q)(P,D,Q)s模模型型的的后后三三个个参参数数(P,D,Q)。这样只要选定我们所希望尝试的模型参数即可。这样只要选定我们所希望尝试的模型参数即可。周周期期s由由于于在在定定义义序序列列时时已已有有(见见对对话话框框中中注注明明的的Current Periodicity后后面面的的数数字字),不不用用另另外外输输入入了了.在在输输出出的的变变量量中中有有误误差差和和拟拟合合(预预测测)的的序序列列,在在输出中还有各个参数和一些判别准则等。输出中还有各个参数和一些判别准则等。第61页,共74页,编辑于2022年,星期六公式:公式:指数平滑模型指数平滑模型这这些些模模型型中中有有a a,g g,d d,f f为为待待估估计计参参数数,g g0意意味味着着斜斜率率为为常常数数(趋趋势势无无变变化化),而而d d0意意味味着着没没有有季季节节成成分分,f f和和减减幅幅趋趋势势有有关关;对对于于时时间间序序列列Xt,趋趋势势、光光滑滑后后的的序序列列、季季节节因因子子和和预预测测的的序序列列分分别别用用Tt、St、It 和和 表表示示;另另外外,p表示周期,表示周期,et为残差为残差 第62页,共74页,编辑于2022年,星期六指数平滑模型指数平滑模型:线性趋势可加季节模型线性趋势可加季节模型(Linear trend,additive seasona