数据分析方法时间序列分析.pptx
《数据分析方法时间序列分析.pptx》由会员分享,可在线阅读,更多相关《数据分析方法时间序列分析.pptx(81页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、16.1 时间序列分析概述时间序列分析概述16.1.1 时间序列的相关概念16.1.2 时间序列分析的一般步骤16.1.3 SPSS时间序列分析的特点第1页/共81页时时间间序序列列分分析析是是研研究究事事件件发发展展变变化化规规律律的的一一种种量量化化分分析析方方法法。一一般般情情况况下下,那那些些依时间先后顺序排列起来的一系列有相同内涵的数据通信都可以称为时间序列。依时间先后顺序排列起来的一系列有相同内涵的数据通信都可以称为时间序列。时时间间序序列列与与一一般般的的统统计计数数据据的的不不同同之之处处在在于于:这这是是一一些些有有严严格格先先后后顺顺序序的的数数据据。大大多多数数情情况况下
2、下它它们们往往往往存存在在某某种种前前后后相相承承的的关关系系,而而非非互互相相独独立立的的。时时间间序序列列分分析析就就是是包包含含了了针针对对这这种种独独特特数数据据特特点点而而形形成成和和发发展展起起来来的的一一系系列列统统计计分分析析方方法法的的一个完整的体系。一个完整的体系。第2页/共81页16.1.1 时间序列分析概述时间序列分析概述第3页/共81页第4页/共81页研究时间序列问题时常会涉及到以下概念:研究时间序列问题时常会涉及到以下概念:1.指标集指标集T 指标集指标集T可理解为时间可理解为时间t的取值范围。的取值范围。2.采样间隔采样间隔t 采样间隔采样间隔t可理解为时间序列中
3、相邻两个数的时间间隔。可理解为时间序列中相邻两个数的时间间隔。3.平稳随机过程和平稳时间序列平稳随机过程和平稳时间序列 时间序列的平稳性时间序列的平稳性是指时间序列的统计规律不会随着时间的推移而发生变化。是指时间序列的统计规律不会随着时间的推移而发生变化。第5页/共81页直观上,一个平稳的时间序列可以看作是一条围绕其均值上下波动的曲线。从理论上,直观上,一个平稳的时间序列可以看作是一条围绕其均值上下波动的曲线。从理论上,有两种意义的平稳性,一个是严平稳或完全平稳,一个是宽平稳或广义平稳。有两种意义的平稳性,一个是严平稳或完全平稳,一个是宽平稳或广义平稳。严平稳严平稳:如果对如果对 t1,t2,
4、tn,hT和任意整数和任意整数n,都使(,都使(yt1,yt2,ytn)与)与(yt1+h,yt2+h,ytn+h)同分布,则概率空间()同分布,则概率空间(W,F,P)上随机过程)上随机过程y(t),tT称称为平稳过程为平稳过程。具有时间上的平稳不变性。实践当中是非常困难甚至是不可能的。具有时间上的平稳不变性。实践当中是非常困难甚至是不可能的。第6页/共81页直观上,一个平稳的时间序列可以看作是一条围绕其均值上下波动的曲线。从理论上,直观上,一个平稳的时间序列可以看作是一条围绕其均值上下波动的曲线。从理论上,有两种意义的平稳性,一个是严平稳或完全平稳,一个是宽平稳或广义平稳。有两种意义的平稳
5、性,一个是严平稳或完全平稳,一个是宽平稳或广义平稳。严平稳严平稳:如果对如果对 t1,t2,tn,hT和任意整数和任意整数n,都使(,都使(yt1,yt2,ytn)与)与(yt1+h,yt2+h,ytn+h)同分布)同分布,则概率空间(则概率空间(W,F,P)上随机过程)上随机过程y(t),tT称称为平稳过程为平稳过程。具有时间上的平稳不变性。实践当中是非常困难甚至是不可能的。具有时间上的平稳不变性。实践当中是非常困难甚至是不可能的。第7页/共81页宽宽平平稳稳:宽宽平平稳稳是是指指随随机机过过程程的的均均值值函函数数、方方差差函函数数均均为为常常数数,自自协协方方差差函函数数仅仅是是时时间间
6、间间隔隔的的函函数数。如如二二阶阶宽宽平平稳稳随随机机过过程程定定义义为为:E(yt)=E(yt+h)为为常常数数,且且对对 t,t+hT都都使使协协方方差差Eyt E(yt)yt+h E(yt+h)存存在在且且与与t无无关关,只只依依赖赖于于时时间间隔间间隔h。第8页/共81页4.白白噪噪声声序序列列:若若随随机机序序列列yt由由互互不不相相关关的的随随机机变变量量构构成成,即即对对所所有有st,Cov(ys,yt)=0,则称其为白噪声序列。,则称其为白噪声序列。白白噪噪声声序序列列是是一一种种特特殊殊的的平平稳稳序序列列,在在不不同同时时点点上上的的随随机机变变量量的的协协方方差差为为0。
7、该该特特性性通通常常被被称称为为“无无记记忆忆性性”,意意味味着着无无法法根根据据其其过过去去的的特特点点推推测测其其未未来来的的走走向向,其其变变化化没没有规律可循。有规律可循。当当模模型型的的残残差差序序列列成成为为白白噪噪声声序序列列时时,可可认认为为模模型型达达到到了了较较好好的的效效果果,剩剩余余残残差差中中已已经没有可以识别的信息。因此,白噪声序列对模型检验也是很有用处的。经没有可以识别的信息。因此,白噪声序列对模型检验也是很有用处的。第9页/共81页5.时点序列和时期序列时点序列和时期序列人人们们研研究究的的那那些些按按时时间间先先后后顺顺序序排排列列的的一一系系列列时时间间序序
8、列列数数据据往往往往由由两两部部分分组组成成:一一是是观测值;二是观测值对应的时间点或时间段。观测值;二是观测值对应的时间点或时间段。指标集指标集T中的每个元素表示的是一段时间中的每个元素表示的是一段时间,这种数据被称为这种数据被称为时期数据时期数据;指标集指标集T中的每个元素表示的是一个时间点中的每个元素表示的是一个时间点,这种数据被称为这种数据被称为时点数据时点数据。第10页/共81页16.1.2 时间序列分析的一般步骤时间序列分析的一般步骤(重重点点)数据的准备阶段数据的准备阶段;数数据据的的观观察察及及检检验验阶阶段段:总总体体把把握握时时间间序序列列发发展展变变化化的的特特征征,以以
9、便便选选择择恰恰当当的的模模型进行分析,包括图形方法和统计检验方法;型进行分析,包括图形方法和统计检验方法;数数据据的的预预处处理理阶阶段段:一一方方面面能能够够使使序序列列的的特特征征体体现现得得更更加加明明显显,利利于于分分析析模模型型的的选择;另一方面使数据满足于模型的要求;选择;另一方面使数据满足于模型的要求;第11页/共81页数数据据分分析析和和建建模模阶阶段段:根根据据时时间间序序列列的的特特征征和和分分析析的的要要求求,选选择择恰恰当当的的模模型型进进行行数据建模和分析;数据建模和分析;模模型型的的评评价价阶阶段段:与与模模型型分分析析的的目目标标相相结结合合评评价价是是否否达达
10、到到了了分分析析的的目目的的以以及及效效果果如何;如何;模型的实施应用阶段模型的实施应用阶段。第12页/共81页时间序列分析方法可分为时域分析和频域分析两类,具体有时间序列分析方法可分为时域分析和频域分析两类,具体有:简单回归分析法简单回归分析法适合序列间结构分析和比较的预测适合序列间结构分析和比较的预测;趋势外推法趋势外推法适用于精度要求不很高的中长期趋势预测适用于精度要求不很高的中长期趋势预测;自自回回归归移移动动平平均均(ARMA)模模型型常常用用于于对对随随机机性性波波动动较较频频繁繁序序列列的的短短期期预预测测,对对于于非平稳的序列可用非平稳的序列可用ARIMA模型模型;谱分析方法谱
11、分析方法适用于那些高频波动数据适用于那些高频波动数据。第13页/共81页16.1.3 时间序列分析的特点时间序列分析的特点SPSS的的时时间间序序列列分分析析是是分分散散在在Data、Transform、Analyze、Graph四四个个功功能菜单当中。能菜单当中。在在Data和和Transform中中实实现现对对时时间间序序列列数数据据的的定定义义和和必必要要处处理理,以以适适应应各各种种分析方法的要求;分析方法的要求;第14页/共81页在在分分析析预预测测中中主主要要提提供供了了几几种种时时间间序序列列的的分分析析方方法法,包包括括指指数数平平滑滑法法、ARIMA模型和季节调整方法;模型和
12、季节调整方法;在在分分析析预预测测中中提提供供了了时时间间序序列列分分析析的的图图形形工工具具,包包括括序序列列图图(Sequence)、自相关函数和偏自相关函数图等。自相关函数和偏自相关函数图等。另外,也可利用另外,也可利用分析分析预测预测频谱分析频谱分析模块进行简单的谱分析。模块进行简单的谱分析。第15页/共81页16.2 数据准备数据准备 SPSS的的数数据据准准备备包包括括数数据据文文件件的的建建立立、时时间间定定义义和和数数据据期期间间的的指指定定。其其中中数数据据文文件件的的建建立立与与一一般般SPSS数数据据文文件件的的建建立立方方法法相相同同,每每一一个个变变量量将将对对应应一
13、一个个时时间间序序列列数数据据,且且不不必必建建立立标标志志时时间间的的变变量量。具具体体操操作作这这里里不不再再赘赘述述,仅仅重重点点讨讨论论时时间定义的操作步骤。间定义的操作步骤。第16页/共81页SPSS的的时时间间定定义义功功能能用用来来将将数数据据编编辑辑窗窗口口中中的的一一个个或或多多个个变变量量指指定定为为时时间间序序列列变变量量,并给它们赋予相应的时间标志并给它们赋予相应的时间标志,具体操作步骤是:,具体操作步骤是:1)选择菜单选择菜单:DataDefine Dates,出现窗口,出现窗口:第17页/共81页2)个个案案为为(Cases Are)框框提提供供了了多多种种时时间间
14、形形式式,可可根根据据数数据据的的实实际际情情况况选选择择与与其其匹匹配配的的时时间间格式和参数。并在格式和参数。并在第一个个案为第一个个案为框中输入起初日期。框中输入起初日期。至至此此,完完成成了了SPSS的的时时间间定定义义操操作作。SPSS将将在在当当前前数数据据编编辑辑窗窗口口中中自自动动生生成成标标志志时时间间的的变变量量。同同时时,在在输输出出窗窗口口中中将将输输出出一一个个简简要要的的日日志志,说说明明时时间间标标志志变变量量及及其其格格式式和和包包含的周期等。含的周期等。数据期间的选取可通过数据期间的选取可通过SPSS的的数据数据选择个案选择个案(Select Cases)功能
15、实现。功能实现。第18页/共81页16.3 时间序列的图形时间序列的图形化观察及检验化观察及检验16.3.1 图形化观察及检验目的16.3.2 图形化观察工具16.3.3 时间序列的检验方法16.3.4 图形化观察和检验的基本操作16.3.5 图形化观察的应用举例第19页/共81页回忆一下回归分析的图形回忆一下回归分析的图形观察与观察与检验检验做散点图看大致趋势检验基本假设是否满足非线性的转化为线性的处理第20页/共81页16.4.1 图形化及检验目的图形化及检验目的 时时间间序序列列分分析析的的第第一一步步是是对对其其发发展展变变化化的的特特征征有有一一个个初初步步的的总总体体把把握握。通通
16、过过图图形形化化观观察察和和检检验验能能够够把把握握时时间间序序列列的的诸诸多多特特征征,如如时时间间序序列列的的发发展展趋趋势势是是上上升升还还是是下下降降,还还是是没没有有规规律律的的上上下下波波动动;时时间间序序列列的的变变化化的的周周期期性性特特点点;时时间间序序列列波波动动幅幅度度的的变变化化规规律律;时时间间序序列列中中是是否否存存在在异异常常点点,时时间间序序列列不不同同时时间间点点上上数数据据的的关关系等。系等。第21页/共81页通过图形化观察和检验应把握以下几点通过图形化观察和检验应把握以下几点:时间序列的正态性时间序列的正态性,考察数据是否符合正态分布;,考察数据是否符合正
17、态分布;时时间间序序列列的的平平稳稳性性,是是要要了了解解时时间间序序列列数数据据适适合合于于什什么么样样的的模模型型,能能否否直直接接用用来建立模型等;来建立模型等;时间序列的周期性时间序列的周期性,是指随着时间的推移序列呈现出有规律的周期性波动;,是指随着时间的推移序列呈现出有规律的周期性波动;时间序列的其他特性时间序列的其他特性,如异常值、簇集性等。,如异常值、簇集性等。第22页/共81页16.3.2 图形化观察工具图形化观察工具序列图(序列图(Sequence)一一个个平平稳稳的的时时间间序序列列在在水水平平方方向向平平稳稳发发展展,在在垂垂直直方方向向的的波波动动性性保保持持稳稳定定
18、,非非平平稳稳性性的的表表现现形形式式多多种种多多样样,主主要要特特征征有有:趋趋势势性性、异异方方差差性性、波波动动性性、周周期期性、季节性、以及这些特征的交错混杂等。性、季节性、以及这些特征的交错混杂等。第23页/共81页序序列列图图还还可可用用于于对对序序列列异异常常值值的的探探索索,以以及及体体现现序序列列的的“簇簇集集性性”。异异常常值值是是那那些些由由于于外外界界因因素素的的干干扰扰而而导导致致的的与与序序列列的的正正常常数数值值范范围围偏偏差差巨巨大大的的数数据据点点。“簇簇集集性性”是是指指数数据据在在一一段段时时间间内内具具有有相相似似的的水水平平,在在不不同同的的水水平平间
19、间跳跳跃跃性性变变化化,而而非平缓性变化。非平缓性变化。第24页/共81页直方图直方图(Histogram)直直方方图图是是体体现现序序列列数数据据分分布布特特征征的的一一种种图图形形,通通过过直直方方图图可可以以了了解解序序列列的的平平稳稳性性、正态性等特征正态性等特征。自相关函数图和偏自相关函数图自相关函数图和偏自相关函数图(ACFPACF)所所谓谓自自相相关关是是指指序序列列与与其其自自身身经经过过某某些些阶阶数数滞滞后后形形成成的的序序列列之之间间存存在在某某种种程程度度的的相相关关性性。对对自自相相关关的的测测度度往往往往采采用用自自协协方方差差函函数数和和自自相相关关函函数数。偏偏
20、自自相相关关函函数数是是在在其其他序列给定情况下的两序列条件相关性的度量函数。他序列给定情况下的两序列条件相关性的度量函数。第25页/共81页自相关函数图和偏自相关函数图自相关函数图和偏自相关函数图对识别时间序列的各种非平稳性和确定时序模型对识别时间序列的各种非平稳性和确定时序模型中的参数有非常重要的作用中的参数有非常重要的作用。各种时间序列的自相关函数图和偏自相关函数图通常有一定的特征和规律:各种时间序列的自相关函数图和偏自相关函数图通常有一定的特征和规律:1)白白噪噪声声序序列列的的各各阶阶自自相相关关函函数数和和偏偏自自相相关关函函数数值值在在理理论论上上均均为为0。但但实实际际当当中中
21、序序列列多少会有一些相关性,但一般会落在置信区间内,同时没有明显的变化规律。多少会有一些相关性,但一般会落在置信区间内,同时没有明显的变化规律。第26页/共81页2)具具有有趋趋势势性性的的非非平平稳稳时时间间序序列列,序序列列的的各各阶阶自自相相关关函函数数值值显显著著不不为为零零,同同时时随随着着阶阶数数的的增增大大,函函数数值值呈呈缓缓慢慢下下降降的的趋趋势势;偏偏自自相相关关函函数数值值则则呈呈明明显显的的下下降降趋趋势势,很快落入置信区间。很快落入置信区间。3)异异方方差差的的非非平平稳稳时时间间序序列列,其其各各阶阶自自相相关关函函数数显显著著不不为为零零,且且呈呈现现出出正正负负
22、交交错错,缓慢下降的趋势缓慢下降的趋势;偏自相关函数值也呈正负交错的形式,且下降趋势明显。;偏自相关函数值也呈正负交错的形式,且下降趋势明显。第27页/共81页4)具具有有周周期期性性的的非非平平稳稳时时间间序序列列,其其自自相相关关函函数数呈呈明明显显的的周周期期性性波波动动,且且以以周周期期长长度及其整数倍数为阶数的自相关和偏自相关函数值均显著不为零度及其整数倍数为阶数的自相关和偏自相关函数值均显著不为零。5)非非周周期期的的波波动动性性时时间间序序列列,自自相相关关函函数数值值会会在在一一定定的的阶阶数数之之后后较较快快的的趋趋于于零零,而而偏自相关函数则会很快的落入到置信区间内。偏自相
23、关函数则会很快的落入到置信区间内。第28页/共81页谱密度图谱密度图(Spectral)谱谱密密度度图图用用于于序序列列周周期期性性的的检检验验,它它是是时时间间序序列列频频域域分分析析中中识识别别序序列列隐隐含含周周期期性性的的有有效效方方法法。谱谱分分析析法法重重在在对对序序列列当当中中的的周周期期成成分分进进行行识识别别,从从而而达达到到对对序序列列进进行行认认识识和和分解的目的。分解的目的。互相关图互相关图(Cross correlations)对对两两个个互互相相对对应应的的时时间间序序列列进进行行相相关关性性分分析析的的实实用用图图形形工工具具。互互相相关关图图是是依依据据互互相相
24、关函数绘制出来的。关函数绘制出来的。是不同时间序列间不同时期滞后序列的相关性。是不同时间序列间不同时期滞后序列的相关性。第29页/共81页16.3.3 时间序列的检验方法时间序列的检验方法 通通常常序序列列的的非非平平稳稳性性可可通通过过序序列列图图、自自相相关关函函数数图图和和偏偏自自相相关关函函数数图图大大致致分分辨辨出出来来。但有时还需要一些定量的检验方法。但有时还需要一些定量的检验方法。参参数数检检验验法法。基基本本思思路路是是,将将序序列列分分成成若若干干子子序序列列,并并分分别别计计算算子子序序列列的的均均值值、方方差差、相相关关函函数数。根根据据平平稳稳性性假假设设,当当子子序序
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 方法 时间 序列
限制150内