时间序列分析 (2)精.ppt
《时间序列分析 (2)精.ppt》由会员分享,可在线阅读,更多相关《时间序列分析 (2)精.ppt(74页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、时间序列分析第1页,本讲稿共74页时间序列分析时间序列分析 第2页,本讲稿共74页横截面数据时间序列数据横截面数据时间序列数据人们对统计数据往往可以根据其特人们对统计数据往往可以根据其特点从两个方面来切入,以简化分析点从两个方面来切入,以简化分析过程。过程。一个是研究所谓横截面一个是研究所谓横截面(cross section)数据,也就是对大体上同时,或者和数据,也就是对大体上同时,或者和时间无关的不同对象的观测值组成的时间无关的不同对象的观测值组成的数据。数据。第3页,本讲稿共74页横截面数据时间序列数据横截面数据时间序列数据另一个称为时间序列另一个称为时间序列(time series),也
2、就是由对象在不同时间的观测值形也就是由对象在不同时间的观测值形成的数据。成的数据。前面讨论的模型多是和横截面数据前面讨论的模型多是和横截面数据有关。这里将讨论时间序列的分析。有关。这里将讨论时间序列的分析。我们将不讨论更加复杂的包含这两我们将不讨论更加复杂的包含这两方面的数据。方面的数据。第4页,本讲稿共74页时间序列和回归时间序列和回归时间序列分析也是一种回归。时间序列分析也是一种回归。回回归归分分析析的的目目的的是是建建立立因因变变量量和和自自变变量量之之间间关关系系的的模模型型;并并且且可可以以用用自自变变量量来来对对因因变变量量进进行行预预测测。通通常常线线性性回回归归分分析析因因变变
3、量量的的观观测测值值假假定定是是互互相相独独立并且有同样分布。立并且有同样分布。第5页,本讲稿共74页时间序列和回归时间序列和回归而而时时间间序序列列的的最最大大特特点点是是观观测测值值并并不不独独立立。时时间间序序列列的的一一个个目目的的是是用用变变量量过过去去的的观观测测值值来来预预测测同同一一变变量量的的未未来来值。值。即即时时间间序序列列的的因因变变量量为为变变量量未未来来的的可可能能值值,而而用用来来预预测测的的自自变变量量中中就就包包含含该变量的一系列历史观测值。该变量的一系列历史观测值。当当然然时时间间序序列列的的自自变变量量也也可可能能包包含含随随着时间度量的独立变量。着时间度
4、量的独立变量。第6页,本讲稿共74页例例tssales.txt下下面面看看一一个个时时间间序序列列的的数数据据例例子子。这这是是某某企企业业从从1990年年1月月到到2002年年12月月的的销销售售数据数据(tssales.txt)。我我们们希希望望能能够够从从这这个个数数据据找找出出一一些些规规律律,并并且且建建立立可可以以对对未未来来的的销销售售额额进进行行预预测测的的时间序列模型。时间序列模型。第7页,本讲稿共74页从该表格中的众多的数据只能够看出个大概;从该表格中的众多的数据只能够看出个大概;即总的趋势是增长,但有起伏。即总的趋势是增长,但有起伏。第8页,本讲稿共74页例例tssale
5、s.txt利用点图则可以得到对该数据更加直观的印象:利用点图则可以得到对该数据更加直观的印象:某企业从某企业从1990年年1月到月到2002年年12月的销售数据图(单位:百万元)月的销售数据图(单位:百万元)第9页,本讲稿共74页例例tssales.txt从从这这个个点点图图可可以以看看出出。总总的的趋趋势势是是增增长长的的,但但增增长长并并不不是是单单调调上上升升的的;有有涨涨有有落落。但但这这种种升升降降不不是是杂杂乱乱无无章章的的,和和季季节节或或月月份份的的周周期期有有关关系系。当当然然,除除了了增增长长的的趋趋势势和和季季节节影影响响之之外外,还还有有些些无无规规律律的的随机因素的作
6、用。随机因素的作用。第10页,本讲稿共74页SPSS的的实现实现:时间序列数据的产生时间序列数据的产生SPSS并不会自动把某些变量看成带有某些周并不会自动把某些变量看成带有某些周期的时间序列;需要对该变量的观测值附加期的时间序列;需要对该变量的观测值附加上时间因素。上时间因素。例数据例数据tasales.sav原本只有一个变量原本只有一个变量sales。这。这样就需要附加带有周期信息的时间。样就需要附加带有周期信息的时间。方法是通过选项方法是通过选项DataDefine Dates,然后在然后在Cases Are选择选择years,months(年月年月),并指定第一个观测值(并指定第一个观测
7、值(First Case Is)是)是1990年年1月。月。第11页,本讲稿共74页SPSS的的实现实现:时间序列数据的点图时间序列数据的点图对时间序列点图可以选择对时间序列点图可以选择GraphsSequence,对本,对本例选择例选择sales为变量,为变量,months为时间轴的标记即为时间轴的标记即可。可。第12页,本讲稿共74页15.1 15.1 时间序列的组成部分时间序列的组成部分 从从该该例例可可以以看看出出,该该时时间间序序列列可可以以有有三三部部分分组组成成:趋趋势势(trend)、季季节节(seasonal)成成分分和和无无法法 用用 趋趋 势势 和和 季季 节节 模模 式
8、式 解解 释释 的的 随随 机机 干干 扰扰(disturbance)。)。例例中中数数据据的的销销售售就就就就可可以以用用这这三三个个成成分分叠叠加加而成的模型来描述。而成的模型来描述。一一般般的的时时间间序序列列还还可可能能有有循循环环或或波波动动(Cyclic,or fluctuations)成成分分;循循环环模模式式和和有有规规律律的的季季节节模模式式不不同同,周周期期长长短短不不一一定定固固定定。比比如如经经济危机周期,金融危机周期等等。济危机周期,金融危机周期等等。第13页,本讲稿共74页时间序列的组成部分时间序列的组成部分 一一个个时时间间序序列列可可能能有有趋趋势势、季季节节、
9、循循环环这这三三个个成成分分中中的的某某些些或或全全部部再再加上随机成分。因此,加上随机成分。因此,如如果果要要想想对对一一个个时时间间序序列列本本身身进进行行较较深深入入的的研研究究,把把序序列列的的这这些些成成分分分分解解出出来来、或或者者把把它它们们过过虑虑掉掉则则会会有很大的帮助。有很大的帮助。第14页,本讲稿共74页时间序列的组成部分时间序列的组成部分 如如果果要要进进行行预预测测,则则最最好好把把模模型型中中的的与与趋趋势势、季季节节、循循环环等等成成分分有有关关的的参参数估计出来。数估计出来。就就例例中中的的时时间间序序列列的的分分解解,通通过过计计算算机机统统计计软软件件,可可
10、以以很很轻轻而而易易举举地地得得到到该该序序列列的的趋趋势势、季季节节和和误误差差成成分。分。第15页,本讲稿共74页时间序列的组成部分时间序列的组成部分 下图表示了去掉季节成分,只有趋势和误差成分的序列。下图表示了去掉季节成分,只有趋势和误差成分的序列。第16页,本讲稿共74页时间序列的组成部分时间序列的组成部分 下图用两条曲线分别描绘了趋势成分和季节成分。下图用两条曲线分别描绘了趋势成分和季节成分。第17页,本讲稿共74页时间序列的组成部分时间序列的组成部分 下图用两条曲线分别描绘了趋势成分和误差成分。下图用两条曲线分别描绘了趋势成分和误差成分。第18页,本讲稿共74页SPSS的的实现实现
11、:时间序列的分解时间序列的分解前面前面对例对例tssales.sav数据进行分解利用数据进行分解利用SPSS的选的选项项Analyze-Time Series-Seasonal Decomposition,然后在然后在Variable(s)(变量变量)处选择处选择sales,在在Model选择选择Additive(可加模型,也可以试可乘可加模型,也可以试可乘模型模型Multiplicative),最后得到四个附加变量,它们是:最后得到四个附加变量,它们是:误差(误差(err_1)、)、季节调整后的序列(季节调整后的序列(sas_1)、)、季节因素(季节因素(saf_1)去掉季节后的趋势循环因素
12、(去掉季节后的趋势循环因素(stc_1)。)。前面图都是利用前面图都是利用GraphsSequence选项所做。选项所做。注意附加变量的名字根据前面已经得到过的附加变量数目注意附加变量的名字根据前面已经得到过的附加变量数目而调整而调整(按照性质及顺序按照性质及顺序)第19页,本讲稿共74页15.2 15.2 指数平滑指数平滑 如如果果不不仅仅满满足足于于分分解解现现有有的的时时间间序序列列,而而想想要要对对未未来来进进行行预预测测,就就需需要要建建立立模模型型。这这里里先先介介绍绍比比较较简简单单的的指指数数平平滑滑(exponential smoothing)。指指数数平平滑滑只只能能用用于
13、于纯纯粹粹时时间间序序列列的的情情况况,而而不不能能用用于于含含有有独独立立变变量量时时间间序序列列的的因因果关系的研究。果关系的研究。第20页,本讲稿共74页15.2 15.2 指数平滑指数平滑 指指数数平平滑滑的的原原理理为为:当当利利用用过过去去观观测测值值的的加加权权平平均均来来预预测测未未来来的的观观测测值值时时(这这个个过过程程称称为为平平滑滑),离离得得越越近近的的观观测测值值要要给给以以更多的权。更多的权。而而“指指数数”意意味味着着:依依已已有有观观测测值值“老老”的程度,其权数按指数速度递减。的程度,其权数按指数速度递减。以以简简单单的的没没有有趋趋势势和和没没有有季季节节
14、成成分分的的纯纯粹粹时时间间序序列列为为例例,指指数数平平滑滑在在数数学学上上是是一一个个几何级数。几何级数。第21页,本讲稿共74页指数平滑指数平滑 这这时时,如如果果用用Yt表表示示在在t时时间间的的平平滑滑后后的的数数据据(或或预预测测值值),而而用用X1,X2,Xt表表示示原原始始的的时间序列。那么指数平滑模型为时间序列。那么指数平滑模型为 或者,等价地,或者,等价地,这里的系数为几何级数。因此称之为这里的系数为几何级数。因此称之为“几何平几何平滑滑”比使人不解的比使人不解的“指数平滑指数平滑”似乎更有道理。似乎更有道理。第22页,本讲稿共74页指数平滑指数平滑 自自然然,这这种种在在
15、简简单单情情况况下下导导出出的的公公式式(如如上上面面的的公公式式)无无法法应应对对具具有有各各种种成分的复杂情况。成分的复杂情况。后后面面将将给给出出各各种种实实用用的的指指数数平平滑滑模模型型的公式。的公式。根根据据数数据据,可可以以得得到到这这些些模模型型参参数数的的估计以及对未来的预测。估计以及对未来的预测。第23页,本讲稿共74页指数平滑指数平滑 在在和和我我们们例例子子有有关关的的指指数数平平滑滑模模型型中中,需需要要估估计计1212个个季季节节指指标标和和三三个个参参数数(包包含含前前面面公公式式权权重重中中的的a a,和和趋趋势势有有关关的的g g,以以及和季节指标有关的及和季
16、节指标有关的d d)。)。在在简简单单的的选选项项之之后后,SPSSSPSS通通过过指指数数平平滑滑产产生生了了对对20032003年年一一年年的的预预测测。下下图图为为原原始始的的时时间间序序列列和和预预测测的的时时间间序序列列(光光滑滑后后的的),其其中中包包括括对对20032003年年1212个个月月的的预预测测。图下面为误差。图下面为误差。第24页,本讲稿共74页我们例中时间序列数据的指数平滑和对未来的预测我们例中时间序列数据的指数平滑和对未来的预测 第25页,本讲稿共74页SPSS的的实现实现:指数平滑指数平滑:tssales.sav数据数据用选项用选项AnalyzeTime Ser
17、iesExponential Smoothing,然,然后在后在Variable(s)(变量变量)处选择处选择sales,在,在Model选择选择custom(自自选模型选模型),再点,再点Custom之后再在之后再在Trend Component选选Exponential(这主要是因为看到序列原始点图趋势不象直线这主要是因为看到序列原始点图趋势不象直线,其其实选实选Linear也差不多也差不多;此外还有此外还有Damped(减幅减幅)选项选项)在在Seasonal Component选选Additive(这是可加模型,也可以这是可加模型,也可以试选可乘模型:试选可乘模型:Multiplica
18、tive,细节可参看公式,细节可参看公式)Continue之后,再点击之后,再点击Parameters来估计参数,在三个有关参来估计参数,在三个有关参数选项上:数选项上:General(Alpha)、Trend(Gamma)和和Seasonal(Delta)可均选可均选Grid Search(搜寻,这是因为不知道(搜寻,这是因为不知道参数是多少合适,参数意义参见后面公式),然后参数是多少合适,参数意义参见后面公式),然后Continue。最后如果要预测新观测值,在主对话框点击最后如果要预测新观测值,在主对话框点击Save,在,在Predict Cases中选择中选择Predict throug
19、h下面的截止年月(这里选了下面的截止年月(这里选了2003年年12月)。这样就可以得到各种结果了。月)。这样就可以得到各种结果了。第26页,本讲稿共74页SPSS的的实现实现:指数平滑指数平滑结果中增加的变量有误差结果中增加的变量有误差(err_1)和拟合(预测)和拟合(预测)值值fit_1。这在前面图中绘。这在前面图中绘出。在出。在SPSS输出文件中还输出文件中还有那些估计的参数值(三个有那些估计的参数值(三个参数加上季节因子)。参数加上季节因子)。第27页,本讲稿共74页15.3 Box-Jenkins 方法方法:ARIMA模型模型 如如果果要要对对比比较较复复杂杂的的纯纯粹粹时时间间序序
20、列列进进行行细细致致的的分分析析,指指数数平平滑滑往往往往是是无无法法满满足足要求的。要求的。而而若若想想对对有有独独立立变变量量的的时时间间序序列列进进行行预预测测,指数平滑更是无能为力。指数平滑更是无能为力。需需要要更更加加强强有有力力的的模模型型。这这就就是是下下面面要要介介绍的绍的Box-Jenkins ARIMA模型。模型。数数学学上上,指指数数平平滑滑仅仅仅仅是是ARIMA模模型型的的特特例。例。第28页,本讲稿共74页ARIMA模型模型:AR模型模型比比指指数数平平滑滑要要有有用用和和精精细细得得多多的的模模型型是是Box-Jenkins引引入入的的ARIMA模模型型。或或称称为
21、为整整合合自自回回归归移移动动平平均均模模型型(ARIMA 为为Autoregressive Integrated Moving Average一些关键字母的缩写一些关键字母的缩写)。该该模模型型的的基基础础是是自自回回归归和和移移动动平平均均模模型型 或或 ARMA(Autoregressive and Moving Average)模型。模型。第29页,本讲稿共74页ARIMA模型模型:AR模型模型ARMA由由两两个个特特殊殊模模型型发发展展而而成成,一一个个是是自自回回归归模模型型或或AR(Autoregressive)模模型型。假假定定时时间间序序列列用用X1,X2,Xt表表示示,则则
22、一一个个纯纯粹粹的的AR(p)模模型型意意味味着着变变量量的的一一个个观观测测值值由由其其以以前前的的p个个观观测测值值的的线线性性组组合合加加上上随随机机误误差差项项at(该该误误差差为为独独立立无无关的)而得:关的)而得:这看上去象自己对自己回归一样,所以称为自回归这看上去象自己对自己回归一样,所以称为自回归模型;它牵涉到过去模型;它牵涉到过去p个观测值(相关的观测值间隔最个观测值(相关的观测值间隔最多为多为p个个.第30页,本讲稿共74页ARIMA模型模型:MA模型模型ARMA模模型型的的另另一一个个特特例例为为移移动动平平均均模模型型或或MA(Moving Average)模模型型,一
23、一个个纯纯粹粹的的MA(q)模模型型意意味味着着变变量量的的一一个个观观测测值值由由目目前前的的和和先前的先前的q个随机误差的线性的组合:个随机误差的线性的组合:由于右边系数的和不为由于右边系数的和不为1(q q 甚至不一定是正数)甚至不一定是正数),因此叫做,因此叫做“移动平均移动平均”不如叫做不如叫做“移动线性移动线性组合组合”更确切;虽然行家已经习惯于叫更确切;虽然行家已经习惯于叫“平均平均”了,但初学者还是因此可能和初等平滑方法中了,但初学者还是因此可能和初等平滑方法中的什么的什么“三点平均三点平均”之类的术语混淆。之类的术语混淆。第31页,本讲稿共74页ARIMA模型模型:ARMA模
24、型模型显显然然,ARMA(p,q)模模型型应应该该为为AR(p)模模型型和和MA(q)模型的组合了:模型的组合了:ARMA(p,0)模型就是模型就是AR(p)模型,而模型,而ARMA(0,q)模型就是模型就是MA(q)模型。这个一模型。这个一般模型有般模型有p+q个参数要估计,看起来很繁个参数要估计,看起来很繁琐,但利用计算机软件则是常规运算;并琐,但利用计算机软件则是常规运算;并不复杂。不复杂。第32页,本讲稿共74页ARIMA模型:平稳性和可逆性模型:平稳性和可逆性但但是是要要想想ARMA(p,q)模模型型有有意意义义则则要要求求时时间间序序列列 满满 足足 平平 稳稳 性性(statio
25、narity)和和 可可 逆逆 性性(invertibility)的条件,的条件,这这意意味味着着序序列列均均值值不不随随着着时时间间增增加加或或减减少少,序序列列的的方方差差不不随随时时间间变变化化,另另外外序序列列本本身身相相关的模式不改变等。关的模式不改变等。一一个个实实际际的的时时间间序序列列是是否否满满足足这这些些条条件件是是无无法法在在数数学学上上验验证证的的,但但模模型型可可以以近近似似地地从从后后面面要要介介绍绍的的时时间间序序列列的的自自相相关关函函数数和和偏偏相相关关函函数数图图来识别。来识别。第33页,本讲稿共74页ARIMA模型:差分模型:差分一一般般人人们们所所关关注
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 时间序列分析 2精 时间 序列 分析
限制150内