《SPSS时间序列分析-spss操纵步骤.ppt》由会员分享,可在线阅读,更多相关《SPSS时间序列分析-spss操纵步骤.ppt(70页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第17章 时间序列分析,Time Series,返回,各种时间序列分析过程 修补缺失值与创建时间序列 序列图 操作 实例 建立时间序列模型 操作 实例 应用时间序列模型 操作 自相关 操作 实例,季节分解法 操作 实例 频谱分析法 频谱分析操作 实例 互相关 操作 实例 习题17及参考答案 结束,目 录,返回,各种时间序列分析过程,返回,修补缺失值过程与对话框,返回,创建时间序列对话框,运行函数Lag时的结果说明,返回,序列图,Sequence Charts,返回,序列图过程 主对话框,返回,时间轴参考线对话框,返回,定义时间轴的格式对话框,返回,序列图应用实例输出,模型描述表,样品处理摘要,
2、含有基准线的序列图,返回,建立时间序列模型,Create models,返回,时间序列建模提示框,Time Serises Modeler 对话框Variables选项卡,返回,专家建模标准模型选项卡,返回,判断异常值选项卡,指数平滑标准模型选项卡,返回,ARIMA Criteria Model选项卡,返回,侦查异常值的选项卡,返回,自变量转换选项卡,返回,时间序列模型Statistics选项卡,返回,Time Serises Modler Plots选项卡,返回,Time Serises Modler Output Filter对话框,返回,Time Serises Modler Save选
3、项卡,返回,时间序列模型 Option选项卡,返回,时间序列分析实例输出,模型描述,均数绝对百分比误差频数图,最大绝对百分比误差频数图,返回,时间序列分析实例输出(1),模型拟合,返回,时间序列分析实例输出(2),模型统计数据,返回,时间序列分析实例输出(3),预测部分结果,数据编辑器中的新变量,返回,应用时间序列模型,(Apply models ),返回,Apply time Series models对话框,返回,自相关,(Autocorrelations ),返回,Autocorrelations对话框,返回,Options选项卡,返回,自相关分析实例输出,模型描述,样品处理摘要,自相关
4、表,返回,自相关分析实例输出(1),自相关图,偏自相关表,偏自相关图,返回,季 节 分 解 法,Seasonal Deccomposition,返回,季节分解主对话框,返回,季节分解法分析实例输出,模型描述,季节因素,数据文件中增加的4个新变量,返回,频谱分析,Spectral Analyze,返回,谱图选择对话框,返回,频谱分析实例输出,模型描述,周期图,密度图,返回,互相关,Cross -Autocorrelation,返回,Cross-Autocorrelation对话框,返回,Options对话框,返回,互相关实例输出,模型描述,样品处理摘要,返回,互相关实例输出(1),互相关系数表,
5、男女服装销售量的互相关图,返回,17 习题,1、 时间序列的基本概念。 时间序列分析过程中有哪几种常用的方法? 2、 对数据用时间序列模型进行拟合处理前,应做哪些准备工作? 3、 在哪个过程中可进行缺失值的修补?修补缺失值的方法共有几种? 4、 在哪个过程中可定义时间变量? 5、 时间序列分析是建立在序列的平稳的条件上的,怎样判断序列是否平稳? 6、为什么要建一个时间序列的新变量?在SPSS的哪个过程中来建时间序列的新变量? 7、光盘中Data17-07.sav(Data17-07a.sav是Data17-07.sav使用中文标签名的同一个文件)记录了一个邮购公司在1989年1月至1998年1
6、2月间男、女服装产品的销售量情况以及一些可能影响服装销售的宣传、服务方面的变量。试用学过的时间序列方法对其进行分析,并预测1999年4月的男装的销售量。,返回,时间序列习题参考答案,1、 时间序列是指一个依时间顺序做成的观察资料的集合。时间序列分析过程中最常用的方法是:指数平滑、自回归、综合移动平均及季节分解。 2、 先对数据进行必要的预处理和观察,直到它变成稳态后再用这些过程对其进行分析。根据对数据建模前的预处理工作的先后顺序,将它分为三个步骤:首先,对有缺失值的数据进行修补,其次将数据资料定义为相应的时间序列,最后对时间序列数据的平稳性进行计算观察。 3、 修补缺失值可在Transform
7、菜单的Replace Missing Values过程中进行。修补缺失值的方法共有五种,它们分别是: 、Series mean; 、Mean of nearby points; 、Median of nearby points; 、Linear interpolation; 、Linear trend at point。 4、 定义时间变量可在Data菜单的Define dates过程里实现。 5、 判断序列是否平稳可以看它的均数和方差是否不再随时间的变化而变化、自相关系数是否只与时间间隔有关而与所处的时间无关。 6、在时间序列分析中,为检验时间序列的平稳性,经常要用一阶差分、二阶差分,有时为
8、选择一个合适的时间序列的模型还要对原时间序列数据进行对数转换或平方根转换等。这就需要在已经建立的时间序列的数据库中,再建一个新的时间序列的变量。在SPSS的Create Time Series中可根据现有的数字型时间序列变量的函数建立一个新的变量。,返回,时间序列习题参考答案(1),7、一、定义时间序列 (说明:1、对data17-07a.sav和data17-07.sav都要做这个工作。2、在第四步起data17-07.sav),返回,时间序列习题参考答案(2),二、序列图分析,返回,时间序列习题参考答案(3),返回,时间序列习题参考答案(4),序列图显示了许多峰值,其中许多峰值是等间隔出现
9、的,有很清楚的上升趋势。等间隔的峰值暗示存在时间序列的周期成分。考虑到销售的季节性,高峰典型地发生在假期期间,你不必对数据中发现的年季节成分感到吃惊。 也有峰值似乎没有成为季节性模式的一部分,这表示邻近的数据点显著偏离。这些点可能是异常值,它可以而且应该由Expert Modeler解决。,返回,时间序列习题参考答案(5),三、自相关分析,返回,时间序列习题参考答案(6),表中显示的是自相关计算结果,从左向右,依次列出的是:滞后数、自相关系数值值、标准误差、Box-ljung统计量(值、自由度、原假设成立的概率值)。由于原假设(假设基本过程是独立的,也即假定时间序列所反映的随机过程是白噪声)成
10、立的概率值都小于0.05,所以全部自相关均有显著性意义。,返回,时间序列习题参考答案(7),在滞后12处的重要的顶点暗示在数据中存在周期为12(12个季度)的季节成分。检查偏自相关函数图同样可得到这个十分明确的结论。,返回,时间序列习题参考答案(8),四、建立时间序列模型,返回,时间序列习题参考答案(9),返回,时间序列习题参考答案(10),返回,时间序列习题参考答案(11),预测值与观察值很好地拟合在一起,表明模型有令人满意的预测能力。,返回,时间序列习题参考答案(12),该模型描述表包含每个估计模型名称和模型类型。在本例中,因变量是男子服装销售量,系统分配的名称是Model_1。专家建模得
11、出的最佳拟合模型为ARIMA(0,0,0)(0,1,0),它是1阶季节差分自回归综合移动平模型。 模型的季节性说明了在序列图中见到的季节性峰值,1阶差分反映了数据中明显的上升趋势。,返回,时间序列习题参考答案(13),模型统计表给出了汇总信息和对每个估计模型最佳拟合的统计量。每个模型的结果用模型描述表中提供的模型标识符被标识。模型包含你最初指定的5个候选预测因子中的两个预测因子。所以专家建模已经识别出两个可以用来预测的自变量。尽管时间序列模型主动提供了许多不同的最佳拟合统计量,但我们只选择了平稳值。该统计量提供了由模型解释的序列中总变异的百分比的估计,当有趋势或季节性模式时平稳是最适宜的,就像
12、本例的情况一样。本例是个很大的值说明拟合很好。Ljung-Box统计量同改良的Box-Pierce统计量一样知名,提供了模型是否被正确地指定的象征。显著性值小于0.05暗示在观察值序列中存在不是由模型解释的结构。本例0.984的显著性值说明它是不显著的,所以我们可以肯定正确地指定了模型。专家建模侦查出9个异常值。这些点中的每一个都已适当地被模拟处理,所以不需要你从序列中移走它们。,返回,时间序列习题参考答案(14),ARIMA模型参数表显示模型中所有参数的值,及由模型标识符标识的每个模型。它列出了模型中所有的变量,包括因变量和由专家建模确定有显著性的自变量。现在我们清楚地看到在模型统计量表中的
13、两个预测因子分别是邮寄商品目录的数量和用于订购的开放式电话线数量。它们都有显著性意义(Sig.小于0.05)。,返回,时间序列习题参考答案(15),五、预测1999年3月的邮寄商品目录的数量和用于订购的开放式电话线数量。,返回,时间序列习题参考答案(16),在数据编辑窗中显示新变量Predicted_mail_Model_1 and Predicted_phone_Model_2,包括其模型预测值。这些预测值被添加到121至123的记录中。下面用这些值做相应变换后来预测1999年3月的男装销售量。,返回,时间序列习题参考答案(17),六、数据转换,返回,时间序列习题参考答案(18),返回,时间序列习题参考答案(19),七、预测1999年3月的男装销售量,返回,时间序列习题参考答案(20),返回,时间序列习题参考答案(21),预测表包含因变量序列男子服装销售量的预测值,其中两个预测因子为邮寄商品目录的数量和用于订购的开放式电话线数量。该表还包含置信区间的上(UCL)、下限(LCL)。 在影响销售量的邮寄商品目录的数量每月增加2000份,而电话数量还是按原先变化规律的前提下,1999年3月时男装的销售量的预测值为21580.96。,返回,预测的必要条件:取得真实的数据选择正确的方法,挖掘更多信息,返回,返回,
限制150内