预测理论与方法讲义(PPT 50页).pptx
1预测理论与方法授课教师:杨小宝 副教授北京交通大学2012.122 6.1 时间序列分析概述 6.2 数据准备 6.3 时间序列的图形化观察及检验 6.4 时间序列的预处理(重点)6.5 简单回归分析法和趋势外推法(自学)6.6 指数平滑法(重点)6.7 ARIMA 模型分析(重点)6.8 季节调整法(重点)时间序列分析36.7 ARIMA 模型 6.7.1 ARIMA 模型的基本原理 6.7.2 ARIMA 模型的基本操作 6.7.3 ARIMA 模型实例分析4 ARIMA(自回归综合移动平均)是时间序列分析中最为常用的模型,也称之为Box-Jekins模型,或带差分的自回归移动平均模型。ARIMA模型可以对含有季节成分的时间序列数据进行分析,它包含三个主要的参数自回归阶数(p)、差分阶数(d)、移动平均阶数(q),一般模型的形式记为ARIMA(p,d,q)。56.7.1 ARIMA 模型的基本原理 处理非平衡的时间序列时,可以先建立一个包含趋势成分的模型,对由此初步模型得到的残差项,再使用ARIMA模型来拟合。1.差分2.ARIMA模型的分类3.建立ARIMA模型的一般步骤61.差分 差分是使序列平稳化的主要手段,常用的有一般性差分和季节差分两种。72.ARIMA 模型的分类 所谓ARIMA模型,就是对差分后的序列建立ARMA模型。根据参数个数的不同,ARIMA模型可分为如下几个基本类型:自回归(AR)模型;移动平均模型(MA)模型;自回归移动平均(ARMA)模型.8(1)AR 模型9(2)MA 模型10(3)ARMA 模型1 1(4)ARIMA(p,d,q)模型12(5)ARIMA(p,d,q)(P,D,Q)s模型133.建立ARIMA 模型的一般步骤通过差分或其它变换,使时间序列满足平稳性的要求;模型识别。主要是利用ACF、PACF和AIC等序列估计模型的大致类型,并给出几个初步模型以待进一步验证和完善。14参数估计和模型诊断。对识别阶段所给初步模型的参数进行估计及假设检验,并对模型的残差序列作诊断分析,以判断模型的合理性。预测。利用最优模型对序列的未来取值或走势进行预测。第2和3步过程通常需要不断反馈、逐渐完善的过程。156.7.2 ARIMA 模型的基本操作1)选择菜单分析预测创建模型在弹出窗口中方法中选择ARIMA。2)把待分析的变量选择到因变量框中。3)点击条件按钮,弹出模型参数设置框。4)若要对序列进行变换后再建模,可在转换框中选择变换方式。天津食品消费相关数据.sav16天津食品消费相关数据.sav17阶数设置当前周期转换函数若时间序列的均值为零,或者已对其应用了差分算子,建议模型中不包含常数模型参数设置18加法:只影响单个观测记录的异常值;移动水平:由数据的水平移动引起的异常值;创新的:由于噪声变动形成的异常值;瞬时的:对后续观测的影响程度,按指数水平衰减至0的异常值;季节性可加的:周期性的影响某些时刻的异常值;局部趋势:局部的线性异常值;可加的修补:表示多个连续出现的可加类型的异常值.异常值检测的设置不作处理自动检测用户指定195)在统计量、图表、选项等子对话框中,选择需要输出的统计量和图表。20216.7.3 ARIMA 模型的应用举例 利用1950年1990年的天津食品消费数据,分析这段时间内的人均生活费用年收入的变化情况。1.首先绘制和观察它的序列图2.选择适当的 ARIMA模型对其进行分析(ARIMA(1,1,2);3.提出改进模型ARIMA(0,1,2),再分析和预测天津食品消费相关数据.sav22具体操作1.首先绘制和观察它的序列图(自己练习)2.运用ARIMA(1,1,2)分析,具体操作见上一节,离群值不做处理;3.ARIMA(0,1,2)的操作与ARIMA(1,1,2)类似23ARIMA(1,1,2)模型描述和模型拟合24ARMA(1,1,2)模型残差序列的自相关和偏自相关图25ARIMA(1,1,2)模型的预测结果26一阶自回归系数不是特别显著,可考虑去掉自回归部分模型参数输出27运用ARMA(0,1,2)模型的分析结果28ARMA(0,1,2)模型参数输出29ARMA(0,1,2)模型残差序列的自相关和偏自相关图30ARIMA(0,1,2)模型的预测结果316.8 季节分解模型 6.8.1 季节分解法概述 6.8.2 季节分解模型的基本操作 6.8.3 季节分解模型实例分析32 时间序列是对某一统计指标,按照指定的时间间隔,搜集整理的一组统计数据.一个时间序列可能包含4种变动因素:长期趋势变动、季节性变动、循环性变动和不规则变动。但并不是所有的时间序列都会同时含有这4种变动因素。336.8.1 季节分解法概述 所谓季节分解,就是通过某些手段把时间序列中的4种变动趋势分解出来,并分别对其加以分析,再将分析结果综合起来组成的一个对原始时间序列的总模型。1.时间序列的4种成分2.季节分解模型的种类341.时间序列的4种成分长期趋势,记为T。表示序列取值随时间逐渐增加、减少或不变的长期发展趋势。例如:全球人口总数随着时间推移,正在逐步增长;人口死亡率出现长期向下的趋势。季节趋势,记为S。表示由于受到季节因素或某些习俗的影响,而出现的有规则的变化规律。如每天的交通流量在上下班时间出现高峰期,其余时间较为稳定。35循环趋势,记为C。表示序列取值沿着趋势线有如钟摆般循环变动的规律。例如:总体经济指标的循环就是由各个产业的循环组合而成。不规则趋势,记为R。表示把时间序列中的长期趋势、季节趋势和循环趋势都去除后余下的部分。不规则趋势是随机性的,它发生的原因有自然灾害、天气突变、人为的意外因素等。362.季节分解模型的种类加法模型。假设时间序列的由4种成分相加而成的;各成分之间彼此独立,没有交互影响。如果以Y表示某个时间序列,它的加法模型变为:Y=T+C+S+R。按照加法模型的假设,季节因素、周期因素和不规则因素都围绕着长期趋势而上下波动,它们可以表现为正值或负值,反映了各自对时间序列的影响方式和程度。37乘法模型。假设时间序列的由4种成分相乘而成的;各成分之间存在着相互依赖的关系。如果以Y表示某个时间序列,它的乘法模型变为:Y=TCSR。按照乘法模型的假设,季节因素、周期因素和不规则因素也围绕着长期趋势而上下波动,但这种波动表现为一个大于或小于1的系数,反映了它们在长期趋势和基础上对原始序列的相对影响方式和程度。386.8.2 季节分解模型的基本操作1.数据和问题描述 利用季节分解模型,对某城市5年内每个季度的游客数量进行分析,以了解其旅游市场的发展变化规律。某市游客量时序数据.sav39 查看和设定日期变量。依次单击数据 定义日期,打开定义日期变量的对话框,在左侧列表中单击年份、季度,右侧输入起始日期1986年第1季度。单击确定按钮。1.数据和问题描述当前时间变量信息402.参数设置1)选择菜单分析预测季节性分解,弹出周期性分解窗口。2)把分析变量(游客量)选择到变量框中,将其指定为时序变量;3)在模型类型框中选择模型形式(加法);4)在移动平均权重框中选择移动平均权数的确定方法(结束点按0.5加权)。41某市游客量时序数据.sav表示输出对每个观测量的季节分解结果变量列表分析变量425)如果序列中有几种周期性,则SPSS默认的周期是跨度最大的周期。例如一个数据中存在月度周期12和季度周期4,那么时间序列默认的周期就是12。若想进行季度性周期的分析,需重新进行日期变量的定义,将最高水平的周期定义为季度。6)保存按钮设置保存四种趋势参数的方式,SAF表示序列的季节成分;SAS表示去除季节成分后的序列;STC表示序列的趋势和循环成分;ERR表示序列的不规则成分(随机部分)。436.8.3 季节分解模型的应用举例 利用季节分解模型,对某城市5年内每个季度的游客数量进行分析,以了解其旅游市场的发展变化规律。1.利用季节分解模型给出分解结果;2.绘制原始序列、趋势循环序列和季节调整序列的趋势线;3.预测1991年第2季度的游客量。某市游客量时序数据.sav44模型基本统计信息45 时期 原始序列 移动平均数序列 差分 SAF SAS STC ERR原始序列=移动平均数序列+差分原始序列=SAF+SAS原始序列=SAF+STC+ERR(加法)季节分解结果46原始数据集中增加的变量47绘制序列趋势线的操作48三条序列的图形原始序列(游客量)SAS(去除季节成分)STC(序列的趋势和循环成分,即去除季节成分和随机部分)49预测基本思路:针对STC(序列的趋势和循环成分),运用前面章节的方法去预测,1991年第2季度的STC预测值。最后,1991年第2季度的STC预测值=它的STC预测值+第 2季度的 SAF季节成分值(19.67969)50Thank you