《10SPSS时间序列分析教案gpp.pptx》由会员分享,可在线阅读,更多相关《10SPSS时间序列分析教案gpp.pptx(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、SPSSSPSSSPSS统计软件统计软件 时间序列分析时间序列分析SPSS横截面数据时间序列数据横截面数据时间序列数据v人们对统计数据往往可以根据其特点从两个方面来切入,人们对统计数据往往可以根据其特点从两个方面来切入,以简化分析过程。以简化分析过程。v一个是研究所谓横截面一个是研究所谓横截面(cross section)数据,也就数据,也就是对大体上和时间无关的不同对象的观测值组成的数据是对大体上和时间无关的不同对象的观测值组成的数据v另一个称为时间序列另一个称为时间序列(time series),也就是由对象,也就是由对象在不同时间的观测值形成的数据。在不同时间的观测值形成的数据。v前面讨
2、论的模型多是和横截面数据有关。这里将讨论时前面讨论的模型多是和横截面数据有关。这里将讨论时间序列的分析。我们将不讨论更加复杂的包含这两方面间序列的分析。我们将不讨论更加复杂的包含这两方面的数据。的数据。SPSS时间序列和回归时间序列和回归v时间序列分析也是一种回归。时间序列分析也是一种回归。v回回归归分分析析的的目目的的是是建建立立因因变变量量和和自自变变量量之之间间关关系系的的模模型型;并并且且可可以以用用自自变变量量来来对对因因变变量量进进行行预预测测。通通常常线线性性回回归归分析因变量的观测值假定是互相独立并且有同样分布分析因变量的观测值假定是互相独立并且有同样分布v而而时时间间序序列列
3、的的最最大大特特点点是是观观测测值值并并不不独独立立。时时间间序序列列的的一一个个目目的的是是用用变变量量过过去去的的观观测测值值来来预预测测同同一一变变量量的的未未来来值。值。v即即时时间间序序列列的的因因变变量量为为变变量量未未来来的的可可能能值值,而而用用来来预预测测的自变量中就包含该变量的一系列历史观测值。的自变量中就包含该变量的一系列历史观测值。v当当然然时时间间序序列列的的自自变变量量也也可可能能包包含含随随着着时时间间度度量量的的独独立立变量。变量。SPSSv从从下下图图可可以以看看出出。总总的的趋趋势势是是增增长长的的,但但增增长长并并不不是是单单调调上上升升的的;有有涨涨有有
4、落落。但但这这种种升升降降不不是是杂杂乱乱无无章章的的,和和季季节节或或月月份份的的周周期期有有关关系系。当当然然,除除了了增增长长的的趋趋势势和和季季节节影影响响之之外外,还还有有些些无无规规律律的的随机因素的作用。随机因素的作用。时间序列的组成部分时间序列的组成部分 SPSSSPSS时间序列的分解时间序列的分解 v一个时间序列可能由趋势、季节、循环和随机成分组成,因此:一个时间序列可能由趋势、季节、循环和随机成分组成,因此:v如如果果要要想想对对一一个个时时间间序序列列本本身身进进行行较较深深入入的的研研究究,要要把把序序列列的的这这些成分分解出来、或者把它们过虑掉。些成分分解出来、或者把
5、它们过虑掉。v如如果果要要进进行行预预测测,则则最最好好把把模模型型中中的的与与趋趋势势、季季节节、循循环环等等成成分分有关的参数估计出来。有关的参数估计出来。v时时间间序序列列的的分分解解,通通过过计计算算机机统统计计软软件件,可可以以很很轻轻而而易易举举地地得得到到该序列的趋势、季节和误差成分。该序列的趋势、季节和误差成分。spssspss分解步骤分解步骤:分析:分析预测预测季节性分解季节性分解SPSS时间序列模型理论基础时间序列模型理论基础:指数平滑指数平滑 v如如果果不不仅仅满满足足于于分分解解现现有有的的时时间间序序列列,想想要要对对未未来来进进行行预预测测,就就需需要要建建立立模模
6、型型。这这里里先先介介绍绍比比较较简简单单的的指指数数平平滑滑(exponential smoothing)。v指指数数平平滑滑只只能能用用于于纯纯粹粹时时间间序序列列的的情情况况,而而不不能能用用于于含含有有独独立立变变量时间序列的因果关系的研究。量时间序列的因果关系的研究。v指指数数平平滑滑的的原原理理为为:当当利利用用过过去去观观测测值值的的加加权权平平均均来来预预测测未未来来的的观观测测值值时时(这这个个过过程程称称为为平平滑滑),离离得得越越近近的的观观测测值值要要给给以以更更多多的权。的权。v而而“指指数数”意意味味着着:依依已已有有观观测测值值“老老”的的程程度度,其其权权数数按
7、按指指数数速度递减。速度递减。v以以简简单单的的没没有有趋趋势势和和没没有有季季节节成成分分的的纯纯粹粹时时间间序序列列为为例例,指指数数平平滑在数学上是一个几何级数。滑在数学上是一个几何级数。SPSSv这这时时,如如果果用用Yt表表示示在在t时时间间的的平平滑滑后后的的数数据据(或或预预测测值值),而而用用X1,X2,Xt表示原始的时间序列。那么指数平滑模型为:表示原始的时间序列。那么指数平滑模型为:或者,等价地:或者,等价地:这里的系数为几何级数。因此称之为这里的系数为几何级数。因此称之为“几何平滑几何平滑”比使人不解的比使人不解的“指数平滑指数平滑”似乎更有道理。似乎更有道理。根据数据,
8、可以得到这些模型参数的估计以及对未来的预测。根据数据,可以得到这些模型参数的估计以及对未来的预测。时间序列模型理论基础时间序列模型理论基础:指数平滑指数平滑 如果要对比较复杂的纯粹时间序列进行细致的分析,指数平如果要对比较复杂的纯粹时间序列进行细致的分析,指数平滑往往是无法满足要求的;而若想对有独立变量的时间序列进滑往往是无法满足要求的;而若想对有独立变量的时间序列进行预测,指数平滑更是无能为力。下面介绍高精度的行预测,指数平滑更是无能为力。下面介绍高精度的ARIMA模模型型。SPSSARIMA模型基础模型基础:AR模型模型vAR 模模型型也也称称自自回回归归模模型型。假假定定时时间间序序列列
9、用用X1,X2,Xt表表示示,则则一一个个纯纯粹粹的的AR(p)模模型型意意味味着着变变量量的的一一个个观观测测值值由由其其以以前前的的p个个观观测测值值的的线线性性组组合合加加上上随随机机误误差差项项zt(该该误误差差是是独独立立无无关关的的)而得:而得:这看上去象自己对自己回归一样,所以称为自回归模型;它牵涉到这看上去象自己对自己回归一样,所以称为自回归模型;它牵涉到过去过去p个观测值(相关的观测值间隔最多为个观测值(相关的观测值间隔最多为p个)个).yt=1yt-1+2yt-2+pyt-p+ztSPSSARIMA模型基础模型基础:MA模型模型vMA 模模型型也也称称移移动动平平均均模模型
10、型,一一个个纯纯粹粹的的MA(q)模模型型意意味味着着变变量量的的一一个个观观测测值值的的误误差差由由目目前前的的和和先先前前的的q个个随机误差的线性的组合而得:随机误差的线性的组合而得:由于右边系数的和不为由于右边系数的和不为1(q q甚至不一定是正数),因此甚至不一定是正数),因此叫做叫做“移动平均移动平均”不如叫做不如叫做“移动线性组合移动线性组合”更确切。更确切。zt=t-1t-1-2t-2-qt-qSPSSARIMA模型基础模型基础:ARMA模型模型v自自回回归归和和移移动动平平均均模模型型也也即即ARMA(p,q)模模型型,是是AR(p)模型和模型和MA(q)模型的组合:模型的组合
11、:ARMA(p,0)模型就是模型就是AR(p)模型,而模型,而ARMA(0,q)模型就是模型就是MA(q)模型。这个一般模型有模型。这个一般模型有p+q个参数要估计,看起来个参数要估计,看起来很繁琐,但利用计算机软件则是常规运算,并不复杂。很繁琐,但利用计算机软件则是常规运算,并不复杂。yt=1yt-1+2yt-2+pyt-p+t-1t-1-2t-2-qt-qSPSSARIMA模型基础模型基础:平稳性和可逆性问题平稳性和可逆性问题vARMA(p,q)模模型型有有意意义义则则要要求求时时间间序序列列满满足足平平稳稳性性和和可可逆逆性性的条件的条件.v这这意意味味着着序序列列均均值值不不随随着着时
12、时间间增增加加或或减减少少,序序列列的的方方差差不不随随时时间变化等。间变化等。v一一个个实实际际的的时时间间序序列列是是否否满满足足这这些些条条件件是是无无法法在在数数学学上上验验证证的的,但但模模型型可可以以近近似似地地从从后后面面要要介介绍绍的的时时间间序序列列的的自自相相关关函函数数和和偏偏相关函数图来识别。相关函数图来识别。v一一般般人人们们所所关关注注的的的的有有趋趋势势、季季节节和和循循环环成成分分的的时时间间序序列列都都不不是是平平稳稳的的。这这时时就就需需要要对对时时间间序序列列进进行行差差分分来来消消除除这这些些使使序序列列不不平平稳稳的的成成分分,而而使使其其变变成成平平
13、稳稳的的时时间间序序列列,并并估估计计ARMA模型模型.v估估计计之之后后再再转转变变该该模模型型,使使之之适适应应于于差差分分之之前前的的序序列列得得到到的的模模型称为型称为ARIMA模型。模型。SPSSARIMA模型基础模型基础:差分差分v差差分分是是什什么么意意思思呢呢?差差分分可可以以是是每每一一个个观观测测值值减减去去其其前前面面的的一一个个观测值,即观测值,即Xt-Xt-1。这样,这样,v如如果果时时间间序序列列有有一一个个斜斜率率不不变变的的趋趋势势,经经过过这这样样的的差差分分之之后后,该该趋趋势势就就会会被被消消除除。一一般般而而言言,一一次次差差分分可可以以将将序序列列中中
14、的的线线性性趋趋势势去掉,二次差分可以将序列中的抛物线趋势去掉。去掉,二次差分可以将序列中的抛物线趋势去掉。v对对于于复复杂杂情情况况,可可能能要要进进行行多多次次差差分分,才才能能够够使使得得变变换换后后的的时时间间序列平稳。序列平稳。v上面引进了一些必要的术语和概念。下面就如何识别模型进行说上面引进了一些必要的术语和概念。下面就如何识别模型进行说明。明。v要想拟合要想拟合ARIMAARIMA模型,必须先把它利用差分变成模型,必须先把它利用差分变成ARMA(ARMA(p,qp,q)模型,模型,并确定是否平稳,然后确定参数并确定是否平稳,然后确定参数p p,q q。SPSSARIMA(p,d,
15、q)(P,D,Q)s模型模型v在在对对含含有有季季节节、趋趋势势和和循循环环等等成成分分的的时时间间序序列列进进行行ARIMA模模型型的的拟拟合合研研究究和和预测时,就不象对纯粹的满足平稳条件的预测时,就不象对纯粹的满足平稳条件的ARMA模型那么简单了。模型那么简单了。v一一般般的的ARIMA模模型型有有多多个个参参数数,没没有有季季节节成成分分的的可可以以记记为为ARIMA(p,d,q),如如果果没没有有必必要要利利用用差差分分来来消消除除趋趋势势或或循循环环成成分分时时,差差分分阶阶数数d=0,模模型型为为ARIMA(p,0,q),即,即ARMA(p,q)。v在在 有有 已已 知知 的的
16、固固 定定 周周 期期 s时时,模模 型型 多多 了了 4个个 参参 数数,可可 记记 为为ARIMA(p,d,q)(P,D,Q)s。(如如果果是是每每年年的的月月数数据据则则s=12,其其它它周周期期依依此类推,如每月的周数据此类推,如每月的周数据s=4等)等)v这这里里增增加加的的除除了了周周期期s已已知知之之外外,还还有有描描述述季季节节本本身身的的模模型型识识别别问问题题。其其中中,P、Q为为季季节节性性的的自自回回归归和和移移动动平平均均阶阶数数,D为为季季节节差差分分的的阶阶数数,s为为季季节节周周期。期。SPSS时间序列模型时间序列模型:ARIMA(p,d,q)模型模型vARIM
17、A 模型基本原理:模型基本原理:v ARIMA模型全称为自回归移动平均模型模型全称为自回归移动平均模型(Autoregressive Integrated Moving Average Model,简记简记ARIMA),是由博克思,是由博克思(Box)和詹金斯和詹金斯(Jenkins)于于70年代初提出的一著名时间序列预测方法,所以又称为年代初提出的一著名时间序列预测方法,所以又称为box-jenkins模型、博克思模型、博克思-詹金斯法。詹金斯法。vARIMA 方法是时间序列短期预测中一种常用而有效的方法方法是时间序列短期预测中一种常用而有效的方法,它是用变量它是用变量Yt 自自身的滞后项以
18、及随机误差项来解释该变量身的滞后项以及随机误差项来解释该变量,ARIMA 方法能够在对数据模式未知方法能够在对数据模式未知的情况下找到适合数据所考察的模型的情况下找到适合数据所考察的模型,因而在预测方面得到了广泛应用。它的具因而在预测方面得到了广泛应用。它的具体形式可表达成体形式可表达成ARIMA(p,d,q),其中其中p 表示自回归过程阶数表示自回归过程阶数;d 表示差表示差分的阶数分的阶数;q 表示移动平均过程的阶数。如果时间序列数据是非平稳的表示移动平均过程的阶数。如果时间序列数据是非平稳的,则需要则需要对其进行对其进行d 阶差分阶差分,使其平稳化使其平稳化,然后对平稳化后的序列用然后对
19、平稳化后的序列用ARIMA 建模。建模。注:注:spss中中ARIMA建模方法会自动进行差分和平滑处理,但不处理异常值。建模方法会自动进行差分和平滑处理,但不处理异常值。SPSS时间序列模型时间序列模型:SARIMA 模型模型v在在对对含含有有季季节节、趋趋势势和和循循环环等等成成分分的的时时间间序序列列进进行行ARIMA模模型型的的拟拟合合研研究究和和预预测测时时,模模型型需需要要增增加加4个个参参数数,增增加加后后可可记记为为ARIMA(p,d,q)(P,D,Q)s。(在在有有已已知知的的固固定定周周期期s时时,如如果果是是每每年年的的月月数数据据则则s=12,其其它它周周期期依依此此类类
20、推推,如如每每月月的的周周数数据据s=4等)等)v这这里里增增加加的的除除了了周周期期s已已知知之之外外,还还有有描描述述季季节节本本身身的的模模型型识识别别问问题题。其其中中,P、Q为为季季节节性性的的自自回回归归和和移移动动平平均均阶阶数数,D为为季季节差分的阶数,节差分的阶数,s为季节周期。为季节周期。SPSS时间序列模型还可增加自变时间序列模型还可增加自变量来提高预测的准确性(有量来提高预测的准确性(有的情况下)。但应的情况下)。但应注意:注意:使使用用专家建模器专家建模器时,只有在自时,只有在自变量与因变量之间具有统计变量与因变量之间具有统计显著性关系时才会包括自变显著性关系时才会包
21、括自变量。如果选择量。如果选择ARIMA模型模型,“变量变量”选项卡上指定的所选项卡上指定的所有自变量都包括在该模型中,有自变量都包括在该模型中,这点与使用专家建模器相反。这点与使用专家建模器相反。添加方法如右图所示。添加方法如右图所示。时间序列模型时间序列模型:带自变量的带自变量的ARIMA模型模型SPSSv时间序列分析的一般步骤时间序列分析的一般步骤:v数据的准备阶段数据的准备阶段v数据的观察及预处理阶段数据的观察及预处理阶段v数据分析和建模阶段数据分析和建模阶段v模型的评价阶段模型的评价阶段v模型的实施阶段(预测)模型的实施阶段(预测)SPSS数据准备数据准备 SPSS的数据准备包括数据
22、文件的建立、时间定义和数的数据准备包括数据文件的建立、时间定义和数据期间的指定。其中数据文件的建立与一般据期间的指定。其中数据文件的建立与一般SPSS数据文件数据文件的建立方法相同,每一个变量将对应一个时间序列数据,且的建立方法相同,每一个变量将对应一个时间序列数据,且不必建立标志时间的变量。具体操作这里不再赘述,仅重点不必建立标志时间的变量。具体操作这里不再赘述,仅重点讨论时间定义的操作步骤。讨论时间定义的操作步骤。SPSS的时间定义功能用来将数据编辑窗口中的一个或的时间定义功能用来将数据编辑窗口中的一个或多个变量指定为时间序列变量,并给它们赋予相应的时间标多个变量指定为时间序列变量,并给它
23、们赋予相应的时间标志,具体操作步骤是:志,具体操作步骤是:(1)选择菜单:)选择菜单:数据数据定义日期定义日期,出现窗口:,出现窗口:SPSSv(2)个案框提供了多种时间形式,可根据数据的实际情况)个案框提供了多种时间形式,可根据数据的实际情况选择与其匹配的时间格式和参数。选择与其匹配的时间格式和参数。至此,完成了至此,完成了SPSS的时间定义操作。的时间定义操作。SPSS将在当前数据编辑窗口中将在当前数据编辑窗口中自动生成标志时间的变量。同时,在输出窗口中将输出一个简要的日志自动生成标志时间的变量。同时,在输出窗口中将输出一个简要的日志,说明时间标志变量及其格式和包含的周期等。说明时间标志变
24、量及其格式和包含的周期等。SPSS时间序列的图形化观察及预处理时间序列的图形化观察及预处理v时间序列的图形化及检验时间序列的图形化及检验目的目的 通过图形化观察和检验能够把握时间序列的诸通过图形化观察和检验能够把握时间序列的诸多特征,如时间序列的发展趋势是上升还是下降,多特征,如时间序列的发展趋势是上升还是下降,还是没有规律的上下波动;时间序列的变化的周期还是没有规律的上下波动;时间序列的变化的周期性特点;时间序列波动幅度的变化规律;时间序列性特点;时间序列波动幅度的变化规律;时间序列中是否存在异常点,时间序列不同时间点上数据的中是否存在异常点,时间序列不同时间点上数据的关系等。关系等。SPS
25、Sv时间序列的图形化观察工具时间序列的图形化观察工具 序列图(序列图(Sequence)一个平稳的时间序列在水平方向平稳发展,在垂直方向一个平稳的时间序列在水平方向平稳发展,在垂直方向的波动性保持稳定,非平稳性的表现形式多种多样,主要特的波动性保持稳定,非平稳性的表现形式多种多样,主要特征有:趋势性、异方差性、波动性、周期性、季节性、以及征有:趋势性、异方差性、波动性、周期性、季节性、以及这些特征的交错混杂等。这些特征的交错混杂等。序列图还可用于对序列异常值的探索,以及体现序列的序列图还可用于对序列异常值的探索,以及体现序列的“簇集性簇集性”,异常值是那些由于外界因素的干扰而导致的与,异常值是
26、那些由于外界因素的干扰而导致的与序列的正常数值范围偏差巨大的数据点。序列的正常数值范围偏差巨大的数据点。“簇集性簇集性”是指数是指数据在一段时间内具有相似的水平。在不同的水平间跳跃性变据在一段时间内具有相似的水平。在不同的水平间跳跃性变化,而非平缓性变化。化,而非平缓性变化。SPSS自相关函数图和偏自相关函数图(自相关函数图和偏自相关函数图(ACFPACF)所谓自相关是指序列与其自身经过某些阶数滞后形成的序列之间存在某种程度的相关性所谓自相关是指序列与其自身经过某些阶数滞后形成的序列之间存在某种程度的相关性(即数据与其前(即数据与其前k个数据的相关性),对自相关的测度往往采用自协方差函数和自相
27、关函数。个数据的相关性),对自相关的测度往往采用自协方差函数和自相关函数。白噪声序列(平稳序列)的各阶自相关函数和偏自相关函数值在理论上均为白噪声序列(平稳序列)的各阶自相关函数和偏自相关函数值在理论上均为0(即数据与其(即数据与其前面的数据无相关性)。而实际当中序列多少会有一些相关性,但一般会落在置信区间内,前面的数据无相关性)。而实际当中序列多少会有一些相关性,但一般会落在置信区间内,同时没有明显的变化规律。对于平稳的时间序列,理想情形是自相关函数在一定的条件下同时没有明显的变化规律。对于平稳的时间序列,理想情形是自相关函数在一定的条件下服从正态分布,当样本量服从正态分布,当样本量n很大时
28、,一般在自相关很大时,一般在自相关ACF图形中其值介于两条虚线之间的概率图形中其值介于两条虚线之间的概率为为95%;如果存在明显不在这两条直线之内的情况,说明序列存在;如果存在明显不在这两条直线之内的情况,说明序列存在k阶自相关(阶自相关(适合用适合用ARIMA模型),),如果在如果在r处之后,全部落入这个范围,处之后,全部落入这个范围,说明序列中的数据与其自身的前说明序列中的数据与其自身的前r个个数据有相关性,即数据有相关性,即k=r,序列表现出序列表现出MA(r)的的移动平均移动平均特性,特性,pacf类似。类似。Spss操作操作:分析分析预测预测 自相关自相关互相关图互相关图 对两个互相
29、对应的时间序列进行相关性分析的实用图形工具。互相关图是依据互相关函对两个互相对应的时间序列进行相关性分析的实用图形工具。互相关图是依据互相关函数绘制出来的。是不同时间序列间不同时期滞后序列的相关性。数绘制出来的。是不同时间序列间不同时期滞后序列的相关性。Spss操作操作:分析分析描述统计描述统计 互相关图互相关图时间序列的图形化观察工具时间序列的图形化观察工具SPSS附:附:spss自相关函数和偏自相关函数图具体分析自相关函数和偏自相关函数图具体分析 首先自相关(首先自相关(ACF)和偏自相关()和偏自相关(PACF)都是在时间序列模都是在时间序列模型中经常用来判断模型的工具,最好用滞后阶数的
30、那个图来看比型中经常用来判断模型的工具,最好用滞后阶数的那个图来看比较直观,在较直观,在ARIMA(p,d,q)模型中,参数的选择:确定)模型中,参数的选择:确定pdq,首先要确定,首先要确定 d,答:看序列要不要差分后才能平稳。,答:看序列要不要差分后才能平稳。其次确定其次确定 AR、MA还是还是ARMA?答:若平稳序列的偏相答:若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合则可断
31、定序列适合MA模型;若平稳序列的偏相关函数和自相关模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合函数均是拖尾的,则序列适合ARMA模型。模型。接下来,关键在于分清托尾、截尾的概念。答:相关函数值接下来,关键在于分清托尾、截尾的概念。答:相关函数值在在kq以后全部是以后全部是0,称为截尾性;如果随着滞后期,称为截尾性;如果随着滞后期k的增加,函的增加,函数值呈现指数或正弦波衰减,趋于数值呈现指数或正弦波衰减,趋于0,称为拖尾性。说白了,截,称为拖尾性。说白了,截尾就是前面只有孤立的长长一根,后面突然全没了。拖尾就是没尾就是前面只有孤立的长长一根,后面突然全没了。拖尾就是没有截干净
32、的,后面杂七杂有截干净的,后面杂七杂八八还有。还有。确定确定AR、MA还是还是ARMA后,第三,才是确定后,第三,才是确定p、q。答:。答:看拖尾部分,有几根在可信区间外,偏自相关确定看拖尾部分,有几根在可信区间外,偏自相关确定p,自相关确,自相关确定定q。SPSSv时间序列的图形化观察和检验的基本操作时间序列的图形化观察和检验的基本操作 v绘制序列图的基本操作绘制序列图的基本操作(1)选择菜单)选择菜单分析分析预测预测 序列图(自相关图)序列图(自相关图)。SPSS(2)将需绘图的序列变量选入)将需绘图的序列变量选入变量变量框中。框中。(3)在)在时间标签时间标签框中指定横轴(时间轴)标志变
33、量。该标志框中指定横轴(时间轴)标志变量。该标志变量默认的是日期型变量。变量默认的是日期型变量。(4)在)在转换转换框中指定对变量进行怎样的变化处理。框中指定对变量进行怎样的变化处理。(5)单击)单击时间线时间线 按钮定义序列图中需要特别标注的时间点。按钮定义序列图中需要特别标注的时间点。(6)单击)单击格式格式按钮定义图形的格式,可选择横向或纵向序列按钮定义图形的格式,可选择横向或纵向序列图;对于单变量序列图,可选择绘制线图或面积图,还可选图;对于单变量序列图,可选择绘制线图或面积图,还可选择在图中绘制序列的均值线;对多变量的序列图,可选择将择在图中绘制序列的均值线;对多变量的序列图,可选择
34、将不同变量在同一时间点上的点用直线连接起来。不同变量在同一时间点上的点用直线连接起来。SPSS序列图序列图时间序列的图形化观察时间序列的图形化观察SPSS 时间序列的预处理时间序列的预处理 v时间序列预处理的目的和主要方法时间序列预处理的目的和主要方法 预处理的目的可大致归纳为两个方面:预处理的目的可大致归纳为两个方面:第一,使序列的特征体现得更加明显,利于分析模型的选择;第一,使序列的特征体现得更加明显,利于分析模型的选择;第二,使数据满足于某些特定模型的要求。第二,使数据满足于某些特定模型的要求。序列的预处理主要包括以下几个方面:序列的预处理主要包括以下几个方面:序列缺失数据的处理序列缺失
35、数据的处理序列数据的变换处理序列数据的变换处理 主要包括序列的平稳化处理和序列的平滑处理等。均值平主要包括序列的平稳化处理和序列的平滑处理等。均值平稳化一般采用差分处理,方差平稳化一般用变换处理。稳化一般采用差分处理,方差平稳化一般用变换处理。SPSS 时间序列的平滑处理目的是为了消除序列中随机波动性影响。平滑处理时间序列的平滑处理目的是为了消除序列中随机波动性影响。平滑处理的方式很多,常用的有各种移动平均、移动中位数以及这些方法的各种的方式很多,常用的有各种移动平均、移动中位数以及这些方法的各种组合等。组合等。中心移动平均法中心移动平均法 计算以当前为中心的时间跨度计算以当前为中心的时间跨度
36、k范围内数据的移动平均数。范围内数据的移动平均数。向前移动平均法向前移动平均法 若指定时间跨度为若指定时间跨度为k,则用当前值前面,则用当前值前面k个数据(注意:不包括当前值)个数据(注意:不包括当前值)的平均值代替当前值。的平均值代替当前值。移动中位数移动中位数 它以当前时间点为中心,根据指定的时间跨度它以当前时间点为中心,根据指定的时间跨度k计算中位数。计算中位数。时间序列的平滑处理时间序列的平滑处理SPSSv 时间序列缺失值处理的基本操作时间序列缺失值处理的基本操作序列缺失数据处理的基本操作序列缺失数据处理的基本操作(1)选择菜单)选择菜单转换转换替换缺失值替换缺失值。SPSS(2)把需
37、处理的变量(序列)选择到)把需处理的变量(序列)选择到新变量新变量框中。框中。(3)在)在名称和方法名称和方法框中选择处理缺失值的处理方法。在框中选择处理缺失值的处理方法。在名称名称后输入处理新后输入处理新生成变量名,在生成变量名,在方法方法中选择处理缺失值的替代方法,并单击中选择处理缺失值的替代方法,并单击确定确定按钮。按钮。其中:其中:序列均值序列均值:表示整个序列的均值作为替代值。:表示整个序列的均值作为替代值。临近点的均值临近点的均值:表示利用邻近点的均值作为替代值。对此用:表示利用邻近点的均值作为替代值。对此用附近点的跨度附近点的跨度框指定数据段。在框指定数据段。在数数后输入数值后输
38、入数值k,表示以缺失值为中心,前后分别选,表示以缺失值为中心,前后分别选取取k个数据点。这样最后填补的值就是由这个数据点。这样最后填补的值就是由这2k个数的平均数。也可选择个数的平均数。也可选择全部全部,作用同,作用同序列均值序列均值选项。选项。临近点的中位数临近点的中位数:表示利用邻近点的中位数作为替代值。数据段指定方法:表示利用邻近点的中位数作为替代值。数据段指定方法同上。同上。线性插值法线性插值法:表示用缺失值前后两时点数据的某种线性组合进行填补,是:表示用缺失值前后两时点数据的某种线性组合进行填补,是一种加权平均。一种加权平均。点处的线性趋势点处的线性趋势:表示利用回归拟合线的拟合值作
39、为替代值。:表示利用回归拟合线的拟合值作为替代值。请注意,如果序列的第一个和最后一个数据为缺失值,只能利用序请注意,如果序列的第一个和最后一个数据为缺失值,只能利用序列均值和线性趋势值法处理,其他方法不适用。列均值和线性趋势值法处理,其他方法不适用。SPSSv序列数据平滑处理的基本操作序列数据平滑处理的基本操作(1)选择菜单)选择菜单转换转换创建时间序列创建时间序列 SPSS(2)把待处理的变量选择到)把待处理的变量选择到新变量名称新变量名称框。框。(3)在)在名称和函数名称和函数框中选择数据变换法。在框中选择数据变换法。在名称名称后输入处理后输入处理后新生成的变量名,在后新生成的变量名,在函
40、数函数中选择处理方法,在中选择处理方法,在顺序顺序后输入后输入相应的阶数,并单击相应的阶数,并单击确定确定按钮。其中的方法除前面介绍的几按钮。其中的方法除前面介绍的几种外,还包括:种外,还包括:累计求和累计求和:即对当前值和当前值之间的所有数据进行求和,生:即对当前值和当前值之间的所有数据进行求和,生成原序列的累计值序列。成原序列的累计值序列。滞后滞后:即对指定的阶数:即对指定的阶数k,用从当前值向前数到第,用从当前值向前数到第k个数值来个数值来代替当前值。这样形成的新序列将损失前代替当前值。这样形成的新序列将损失前k个数据。个数据。提前提前:与数据滞后正好相反,即指定的阶数:与数据滞后正好相
41、反,即指定的阶数k,从当前值向后,从当前值向后数以第数以第k个数值来代替当前值。这样形成的新序列将损失后个数值来代替当前值。这样形成的新序列将损失后k个数据。个数据。SPSS时间序列模型举例时间序列模型举例 以某地区以某地区2005年年1月到月到2015年年4月的进出口总月的进出口总额数据为基础,建立预测模型,预测额数据为基础,建立预测模型,预测2015年年4月月后后5个月的进出口总额。个月的进出口总额。SPSS序列图序列图模型选择:模型选择:由于影响进出口总额的因素很多,且这些因素之间常常存在多重由于影响进出口总额的因素很多,且这些因素之间常常存在多重共线性,所以找出影响进出口总额的诸多因素
42、并进行建模比较困难。由于金共线性,所以找出影响进出口总额的诸多因素并进行建模比较困难。由于金融和经济领域数据常常是自相关非平稳的,从融和经济领域数据常常是自相关非平稳的,从进出口总额的自相关图容易看进出口总额的自相关图容易看出,自相关函数值出,自相关函数值明显有不在明显有不在95%95%置信区间内(两条直线之间)的情况,说明置信区间内(两条直线之间)的情况,说明序列存在序列存在k k阶自相关性;另外从序列图容易看出,数据序列有明显的趋势性和阶自相关性;另外从序列图容易看出,数据序列有明显的趋势性和波动性且不平稳,波动性且不平稳,因而采用因而采用ARIMAARIMA模型进行预测比较合理而且精度较
43、高。模型进行预测比较合理而且精度较高。自相关图自相关图ARIMA模型的确定模型的确定SPSS数据分析和建模阶段数据分析和建模阶段ARIMA预测模型步骤:分析预测模型步骤:分析预测预测创建模型,打开如下对话框创建模型,打开如下对话框在方法中选择专家建在方法中选择专家建模器(无需自己确定模器(无需自己确定ARIMA模型的模型的p、d、q等各个参数,软等各个参数,软件自行优化给出),件自行优化给出),然后打开条件对话框然后打开条件对话框数据来源:数据来源:进出口总值进出口总值SPSS数据分析和建模阶段数据分析和建模阶段在专家建模器条件中选择在专家建模器条件中选择模型类型,本例选仅限模型类型,本例选仅
44、限ARIMA模型并考虑季节性模型并考虑季节性因素,当前周期为因素,当前周期为s=12。SPSS数据分析和建模阶段数据分析和建模阶段统计量的设计如下图:统计量的设计如下图:R R方:拟合优度可描述方:拟合优度可描述模型的回归效果;参数模型的回归效果;参数估计可给出模型的相关估计可给出模型的相关参数;显示预测值可在参数;显示预测值可在输出窗口中显示预测值。输出窗口中显示预测值。SPSS数据分析和建模阶段数据分析和建模阶段图表的设计如下图:图表的设计如下图:以图表的形式输出观察以图表的形式输出观察值、预测值、拟合值,值、预测值、拟合值,并绘制残差自相关图和并绘制残差自相关图和残差偏相关图,用以分残差
45、偏相关图,用以分析拟合效果。析拟合效果。SPSS数据分析和建模阶段数据分析和建模阶段保存的设计如下图:保存的设计如下图:在数据编辑器中保存预在数据编辑器中保存预测值,及相应的置信区测值,及相应的置信区间,并给出残差(噪声间,并给出残差(噪声残值);并保存模型文残值);并保存模型文件为件为“进出口总额进出口总额.xml”.xml”。SPSS数据分析和建模阶段数据分析和建模阶段选项的设计如下图:选项的设计如下图:设计预测截止时间,本设计预测截止时间,本例为例为20152015年年1212月,并可月,并可修改置信区间(本例为修改置信区间(本例为默认)默认)SPSS运行结果运行结果由模型描述表可得序列
46、模型的类型为由模型描述表可得序列模型的类型为ARIMA(0,1,1)()(0,1,1),从对比),从对比图可看出拟合结果较好。图可看出拟合结果较好。注:注:由于由于ARIMA模型的表达式比较复杂,在写论文时只要写模型类型便可。模型的表达式比较复杂,在写论文时只要写模型类型便可。SPSS模型的评价(统计量的参数分析)模型的评价(统计量的参数分析)v平稳的平稳的R方和方和R方:显示固定的方:显示固定的R平方值。此统计量是序列中由模型解平方值。此统计量是序列中由模型解释的总变异所占比例的估计值(本例中释的总变异所占比例的估计值(本例中R 方方=0.938)。该值越高)。该值越高(最大值为(最大值为
47、1.0),则模型拟合会越好。),则模型拟合会越好。v正太化的正太化的BIC:表示输出标准的:表示输出标准的BIC统计量,可用于不同预测模型优统计量,可用于不同预测模型优劣的比较,越小越好。劣的比较,越小越好。vSig.列给出了列给出了 Ljung-Box 统计量的显著性值,该检验是对模型中残统计量的显著性值,该检验是对模型中残差的随机检验;表示指定的模型是否正确。显著性值小于差的随机检验;表示指定的模型是否正确。显著性值小于0.05 表示表示残差不是随机的,则意味着所观测的序列中存在模型无法解释的结构。残差不是随机的,则意味着所观测的序列中存在模型无法解释的结构。SPSS模型的评价(图表模型的
48、评价(图表-拟合图拟合图)v下下图图为为原原始始序序列列和和由由模模型型得得到到的的拟拟合合值值以以及及对对未未来来10个观测的预测图;看来拟合得还不错。个观测的预测图;看来拟合得还不错。SPSS模型的评价(图表模型的评价(图表-残差残差pacpac和和acfacf图图)v下下面面再再看看剩剩下下的的残残差差序序列列是是否否还还有有什什么么模模式式。这这可可以以由由残残差差的的acf(左左)和和pacf(右右)图图来来判判断断,可可以以看看出出它它们们没没有有什什么么模模式式或或规律性,这说明拟合比较成功。规律性,这说明拟合比较成功。SPSS 当确定了最终选择的预测模型和方法后,就可以预测未来
49、当确定了最终选择的预测模型和方法后,就可以预测未来了,在保存中作如下设定:了,在保存中作如下设定:分别设定:预测值输出,分别设定:预测值输出,95%95%置信度的上下限置信度的上下限。注意:注意:SPSS中文环境有个小中文环境有个小Bug,必须改一下名字!,必须改一下名字!预测的设计(保存)预测的设计(保存)SPSS预测的设定(选项)预测的设定(选项)在选项中,选择你的预测时间,预测期将根据你在选项中,选择你的预测时间,预测期将根据你事先定义的数据时间格式填写。事先定义的数据时间格式填写。SPSS预测结果预测结果上面就是预测结果!于此同时,上面就是预测结果!于此同时,SPSS活动数据集活动数据集中也存储了预测值!中也存储了预测值!SPSS预测结果(数据编辑器)预测结果(数据编辑器)SPSS时间序列预测模块还包含模型应用,也就是可以把预测模型转存为XML模型文件,以后预测的时候就可以不用原始数据了!步骤:步骤:分析预测应用模型SPSS模型应用模型应用预测(相关设计类似创建模型)预测(相关设计类似创建模型)SPSS数学建模数学建模spss时间序列预测论文时间序列预测论文论文:居民消费价格指数的季节ARIMA模型及短期预测说明:注意论文的写作框架、ARIMA模型理论基础等内容SPSS完完
限制150内