spss(时间序列分析)精讲.ppt
《spss(时间序列分析)精讲.ppt》由会员分享,可在线阅读,更多相关《spss(时间序列分析)精讲.ppt(72页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一节第一节 简介简介一、横截面数据与时间序列数据一、横截面数据与时间序列数据 人们对统计数据往往可以根据其特点从两个方面来切入,以人们对统计数据往往可以根据其特点从两个方面来切入,以简化分析过程。一个是研究所谓简化分析过程。一个是研究所谓横截面横截面(cross section)数数据据,也就是对大体上同时,或者和时间无关的,也就是对大体上同时,或者和时间无关的不同对象的观不同对象的观测值测值组成的数据。组成的数据。 另一个称为另一个称为时间序列时间序列(time series)数据数据,也就是由,也就是由同一对象同一对象在不同时间的观测值在不同时间的观测值形成的数据。如形成的数据。如 前面
2、讨论的模型多是和横截面数据有关。本章将讨论时间序前面讨论的模型多是和横截面数据有关。本章将讨论时间序列数据的统计分析。列数据的统计分析。 横截面数据也常称为变量的一个横截面数据也常称为变量的一个简单随机样本简单随机样本,也即假设每,也即假设每个数据都是来自于总体分布的一个取值,且它们之间是相互个数据都是来自于总体分布的一个取值,且它们之间是相互独立的独立的(独立同分布独立同分布)。 而时间序列的最大特点是而时间序列的最大特点是观测值并不独立观测值并不独立。时间序列的一个。时间序列的一个目的是用变量过去的观测值来预测同一变量的未来值目的是用变量过去的观测值来预测同一变量的未来值。 下面看一个时间
3、序列的数据例子。下面看一个时间序列的数据例子。 例例1. 某企业从某企业从1990年年1月到月到2002年年12月的月销售数据月的月销售数据(单位:单位:百万元百万元)储存于储存于SPSS数据文件数据文件tssales.sav中。中。 在该数据文件中,除了销售额变量在该数据文件中,除了销售额变量“sales”以外,还有三个以外,还有三个时间变量时间变量“year”、“month”和和“date”。事实上这三个变。事实上这三个变量是我们后期通过量是我们后期通过SPSS操作自动加上去的。操作自动加上去的。 选择选择SPSS菜单中的菜单中的“Data = Define Dates”选项,在弹选项,在
4、弹出窗口的出窗口的“Cases Are”下方选择下方选择“Years, months”,再在,再在右侧右侧“First Case Is”下的空格输入下的空格输入起始时间起始时间,即可自动生,即可自动生成该例中的三个时间变量。成该例中的三个时间变量。 当然,根据数据记录的背景不同和不同的需要,我们也可以当然,根据数据记录的背景不同和不同的需要,我们也可以选择选择“Days”、“Weeks” 等其他形式的时间变量。等其他形式的时间变量。 作为时间序列数据的一个基本要求,其数据都是作为时间序列数据的一个基本要求,其数据都是等间隔记录等间隔记录的,比如每天或每月记录一个数据。的,比如每天或每月记录一个
5、数据。 在金融时间序列在金融时间序列(比如股票价格比如股票价格),每周的记录时间只有,每周的记录时间只有5天天(周一至周五周一至周五),此时我们也把它当成是等间隔记录的,此时,此时我们也把它当成是等间隔记录的,此时记录的时间间隔是记录的时间间隔是“每个工作日每个工作日”。 我们接下来看看例我们接下来看看例1的销售数据的的销售数据的时间序列图时间序列图(TSplot)。YEAR20032002200120001999199819971996199519941993199219911990SALES12010080604020图图1 销售数据的时间序列图销售数据的时间序列图(返回返回27页页) 从
6、图从图1可以看出:该企业销售额总的趋势是可以看出:该企业销售额总的趋势是增长增长的;但增长的;但增长并不是单调上升的,有涨有落。并不是单调上升的,有涨有落。 更进一步,这种升降不是杂乱无章的,和季节或月份的更进一步,这种升降不是杂乱无章的,和季节或月份的周期周期有关系。有关系。 当然,除了增长的趋势和季节影响之外,还有些无规律的当然,除了增长的趋势和季节影响之外,还有些无规律的随随机因素机因素的作用。的作用。 这些都说明了这个数据前后之间不是独立而是这些都说明了这个数据前后之间不是独立而是相关的相关的。 上述图形是选择上述图形是选择SPSS菜单中的菜单中的“Graphs = Sequences
7、”选项,在窗口中把选项,在窗口中把“sales”作为画图变量作为画图变量“Variables”,而,而把把“year”作为横坐标作为横坐标“Time Axis Labels”而得到的。而得到的。在在成图后我们还把时间标值的间隔和格式做了修改。成图后我们还把时间标值的间隔和格式做了修改。二、时间序列分析的目的二、时间序列分析的目的 在例在例1中,我们希望能够从这些历史销售数据出发,找出其中,我们希望能够从这些历史销售数据出发,找出其中的一些中的一些规律规律,并且建立可以对未来的销售额进行,并且建立可以对未来的销售额进行预测预测的时的时间序列模型,这一统计过程就是时间序列分析。间序列模型,这一统计
8、过程就是时间序列分析。 事实上,事实上,时间序列分析也是一种回归时间序列分析也是一种回归。 回归分析的目的是回归分析的目的是建立建立应变量和自变量之间关系的应变量和自变量之间关系的模型模型;并;并且可以且可以用自变量来对应变量进行用自变量来对应变量进行预测预测。 而在时间序列分析中,应变量为变量而在时间序列分析中,应变量为变量未来的可能值未来的可能值,而用来,而用来预测的自变量中就包含该变量的一系列预测的自变量中就包含该变量的一系列历史观测值历史观测值。 时间序列的时间序列的自变量也可能包含随着时间度量的独立变量自变量也可能包含随着时间度量的独立变量。三、指数平滑模型三、指数平滑模型 时间序列
9、分析的一个简单和常用的预测模型叫做时间序列分析的一个简单和常用的预测模型叫做指数平滑指数平滑(exponential smoothing)模型模型。 指数平滑只能用于指数平滑只能用于纯粹时间序列纯粹时间序列的情况,而不能用于含有独的情况,而不能用于含有独立变量时间序列的因果关系的研究。立变量时间序列的因果关系的研究。 指数平滑的指数平滑的原理原理为:为:利用过去观测值的利用过去观测值的加权平均加权平均来预测未来来预测未来的观测值的观测值(这个过程称为这个过程称为平滑平滑),且,且离现在越近的观测值要给离现在越近的观测值要给以越重的权以越重的权。 而而“指数指数”意味着:按历史观测值记录时间离现
10、在的距离远意味着:按历史观测值记录时间离现在的距离远近,其上的近,其上的权数按指数速度递减权数按指数速度递减。 这一距离通常用这一距离通常用数据间隔位置差数据间隔位置差,也称,也称步数步数(lag)来表示。来表示。 若记时刻若记时刻 t 的观测值为的观测值为 Xt 时刻时刻 t 的指数平滑记为的指数平滑记为 Yt 。 指数平滑的数学模型为指数平滑的数学模型为Yt = a aXt+a a(1- -a a)Xt -1+a a(1- -a a)2Xt -2+ +a a(1- -a a)t-1X1, (1) 其中其中0a aN 。见图。见图2,其中取,其中取a a = 0.4。YEAR20032002
11、20012000199919981997199619951994199319921991199012010080604020SALESXSMOOTH图图2 销售数据的简单指数平滑销售数据的简单指数平滑 指数平滑的指数平滑的SPSS操作操作 选择菜单中的选择菜单中的“Analyze = Time Series = Exponential Smoothing”选项,在弹出的选项,在弹出的窗口中把变量窗口中把变量“sales”选入选入“Variables”空格。空格。 点击右下方点击右下方“Parameter”按钮,在新弹出窗口改变权按钮,在新弹出窗口改变权重指数重指数a a 的取值;点击的取值;点
12、击“Continue”返回。返回。 点击点击“Save”按钮,在新窗口选择按钮,在新窗口选择“Predict through”,并在下方并在下方“Year”后输入后输入“2003”,表示将预测,表示将预测2003年的销年的销售额;点击售额;点击“Continue”返回一级窗口,点返回一级窗口,点“OK”即可。即可。 指数平滑的结果储存在原数据文件后新增的两个变量中,它指数平滑的结果储存在原数据文件后新增的两个变量中,它们分别是们分别是指数平滑数据指数平滑数据Yt 以及以及Yt 与与 Xt 之间的之间的误差误差。 图图2即为即为Xt 与与 Yt 叠合在一起的共同的时间序列图。叠合在一起的共同的时
13、间序列图。从图从图2可以看出一下几点:可以看出一下几点:指数平滑曲线比原有观测值曲线来得指数平滑曲线比原有观测值曲线来得平整光滑平整光滑些,其波动些,其波动没有原来那么强了,这也是平滑一词的来意。没有原来那么强了,这也是平滑一词的来意。不考虑最初几个指数平滑值,当不考虑最初几个指数平滑值,当 t N 时时,指数平滑曲线很快得呈一条直线状,指数平滑曲线很快得呈一条直线状,没没有体现出原有观测值的上升趋势和周期性规律有体现出原有观测值的上升趋势和周期性规律。可见用这。可见用这一指数平滑作为原销售数据的预测效果不理想。一指数平滑作为原销售数据的预测效果不理想。1.上述第三点的原因是我们在做指数平滑时
14、没有考虑原数据上述第三点的原因是我们在做指数平滑时没有考虑原数据的任何趋势或周期规律,我们在下一节再对此做弥补。的任何趋势或周期规律,我们在下一节再对此做弥补。第二节第二节 时间序列的分解时间序列的分解一、成分的分离一、成分的分离 从图从图1可以看出,该销售数据序列由三部分组成:指数向上可以看出,该销售数据序列由三部分组成:指数向上的的趋势趋势(trend)、周期性变化的、周期性变化的季节季节成分成分(seasonal component) 和无法用趋势和季节模式解释的和无法用趋势和季节模式解释的随机干扰随机干扰(disturbance)。 一般的时间序列还可能有一般的时间序列还可能有循环循环
15、或或波动成分波动成分(Cyclic, or fluctuations)。 循环模式和有规律的季节模式不同,其周期长短不一定固定。循环模式和有规律的季节模式不同,其周期长短不一定固定。比如经济危机周期,金融危机周期等等。比如经济危机周期,金融危机周期等等。 一般地来讲,一个时间序列可能有一般地来讲,一个时间序列可能有趋势趋势、季节季节、循环循环这三个这三个成分中的成分中的某些或全部某些或全部再加上再加上随机成分随机成分组成。组成。 时间序列的分解时间序列的分解就是要把一个时间序列中可能包含的各种成就是要把一个时间序列中可能包含的各种成分分解开来,以便于有针对性的进一步分析讨论。分分解开来,以便于
16、有针对性的进一步分析讨论。 就例就例1中的时间序列的分解,通过中的时间序列的分解,通过SPSS软件,可以很轻而软件,可以很轻而易举地得到该序列的趋势、季节和误差成分。易举地得到该序列的趋势、季节和误差成分。 SPSS操作操作 选择菜单中的选择菜单中的“Analyze = Time Series = Seasonal Decomposition”选项,把变量选项,把变量“sales”选入选入“Variables”空格,再在空格,再在“Model”下选择下选择“Additive”,点,点击击“OK”即可得到分解结果。即可得到分解结果。上述上述SPSS对时间序列做分解的结果自动储存在原有数据对时间序
17、列做分解的结果自动储存在原有数据文件中新增的几个变量中,它们分别是:文件中新增的几个变量中,它们分别是:err_1:误差误差(error)项,也即原序列的随机扰动成分,记项,也即原序列的随机扰动成分,记为为ERt ;sas_1:季节调整后的序列季节调整后的序列(seasonal adjusted series) ,记为记为SAt ;saf_1:季节因素季节因素(seasonal factor) ,记为,记为SFt ;1.stc_1:去掉季节及随机扰动后的:去掉季节及随机扰动后的趋势及循环因素趋势及循环因素(trend-cycle series),记为,记为TCt 。 这些分解出来的序列或成分与
18、原有时间序列这些分解出来的序列或成分与原有时间序列之间有如下的简单和差关系:之间有如下的简单和差关系:Xt = SFt + SAt , (3)Xt = SFt + TCt + ERt . (4)YEAR2002200120001999199819971996199519941993199219911990120100806040200-20Seanal adjustedseries SASeas factors SF图图3 销售数据的季节因素分离销售数据的季节因素分离可以看出,这一销可以看出,这一销售数据序列大致上售数据序列大致上是以一年是以一年(12个月个月)为周期的。为周期的。 YEAR2
19、002200120001999199819971996199519941993199219911990120100806040200-20Trend-cycleseries TCError series ER图图4 销售数据的趋势与扰动分离销售数据的趋势与扰动分离可以看出,逐月的销可以看出,逐月的销售额大致沿一个指数售额大致沿一个指数曲线呈增长趋势。曲线呈增长趋势。 YEAR2002200120001999199819971996199519941993199219911990Error from Seasonal decomposition3210-1-2-3-4图图5 分离季节和趋势后的扰
20、动序列分离季节和趋势后的扰动序列 (返回返回27页页)可以看到,扰动项不再带有明显的周期或趋势。可以看到,扰动项不再带有明显的周期或趋势。二、带季节与趋势的指数平滑二、带季节与趋势的指数平滑 如果我们不仅仅满足于分解现有的时间序列,而且想利用该如果我们不仅仅满足于分解现有的时间序列,而且想利用该分解对未来进行更好的预测,就可以建立分解对未来进行更好的预测,就可以建立带季节成分和趋势带季节成分和趋势的指数平滑模型的指数平滑模型。 作这样的指数平滑,必须事先作这样的指数平滑,必须事先估计估计出季节成分和趋势,其估出季节成分和趋势,其估计结果就是这两条曲线的函数关系式计结果就是这两条曲线的函数关系式
21、(参数参数),也即时间指标,也即时间指标 t 的两个确定的的两个确定的(非随机的非随机的)函数。函数。 分别记季节因素和趋势分别记季节因素和趋势(及循环及循环)的估计为的估计为 和和 ,而剩,而剩余的扰动余的扰动(自然也是估计自然也是估计)记为记为 。 带季节和趋势的指数平滑就是先计算带季节和趋势的指数平滑就是先计算扰动序列的指数平滑扰动序列的指数平滑,然后再然后再加上估计加上估计(预测预测)的季节和趋势成分的季节和趋势成分,作为最终的指数,作为最终的指数平滑数据。平滑数据。SFtTCtERt我们不介绍上述指数平滑背后的数学,而直接来看它的我们不介绍上述指数平滑背后的数学,而直接来看它的SPS
22、S操作,该操作要分步来完成。操作,该操作要分步来完成。选择菜单中的选择菜单中的“Analyze = Time Series = Exponential Smoothing”选项,在弹出的窗口中把变量选项,在弹出的窗口中把变量“sales”选入选入“Variables”空格。空格。在该窗口的在该窗口的“Model”下选择下选择“Custom”,并点击其下的,并点击其下的“Custom”按钮进入二级窗口按钮进入二级窗口(进行模型选择进行模型选择)。1.在在“Trend Component”下选择下选择“Exponential”(因为本因为本例中的趋势近似一条指数曲线例中的趋势近似一条指数曲线),在
23、,在“Seasonal Component”下选择下选择“Additive”,点击,点击“Continue”返返回一级窗口。回一级窗口。4. 点击点击“Parameters”来进行参数选择和估计。在弹出的二来进行参数选择和估计。在弹出的二级窗口中的级窗口中的“General”、“Trend”和和“Seasonal”下方下方都选择都选择“Grid Search”,表示留给程序自己去搜索,表示留给程序自己去搜索(估计估计),其下的搜索范围其下的搜索范围(“Start”和和“Stop”)和搜索步长和搜索步长(“By”)可可不作修改。这三个参数中的第一项,也即权重指数不作修改。这三个参数中的第一项,也
24、即权重指数 a a ,一,一般可作人为选择。选好参数后,点击般可作人为选择。选好参数后,点击“Continue”返回一返回一级窗口。级窗口。点击点击“Save”按钮作预测选择后,此操作同上一节的简单按钮作预测选择后,此操作同上一节的简单指数平滑。指数平滑。再在一级窗口点击再在一级窗口点击“OK”,即可得到所需要的结果了。,即可得到所需要的结果了。5.我们来看看此时的指数平滑结果,见图我们来看看此时的指数平滑结果,见图6。YEAR2003200220012000199919981997199619951994199319921991199012010080604020SALESSMOOTH图图6
25、 销售数据的带季节和趋势的指数平滑销售数据的带季节和趋势的指数平滑我们看到,此时的我们看到,此时的估计效果比上一节估计效果比上一节的简单指数平滑要的简单指数平滑要好得多,当然其预好得多,当然其预测也更可信。测也更可信。第三节第三节 基本基本概念与相关图概念与相关图 如果要对比较复杂的纯粹时间序列如果要对比较复杂的纯粹时间序列(一般指已分离了一般指已分离了确定性确定性的的季节成分和趋势后的扰动序列季节成分和趋势后的扰动序列)进行细致的分析,指数平进行细致的分析,指数平滑往往是无法满足要求的。滑往往是无法满足要求的。 而若想对有独立变量的时间序列进行预测,指数平滑更是无而若想对有独立变量的时间序列
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 时间 序列 分析
限制150内