第7章时间序列分析.pptx
《第7章时间序列分析.pptx》由会员分享,可在线阅读,更多相关《第7章时间序列分析.pptx(91页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2023/3/207-1最早的时间序列分析可以追溯到7000年前的古埃及。古埃及人把尼罗河涨落的情况逐天记录下来,就构成所谓的时间序列。对这个时间序列长期的观察使他们发现尼罗河的涨落非常有规律。由于掌握了尼罗河泛滥的规律,使得古埃及的农业迅速发展,从而创建了埃及灿烂的史前文明。按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列分析。第1页/共91页2023/3/207-2主要内容7.1 时间序列的定义7.2 时间序列的趋势分析法7.3 Box-Jenkin模型7.4 时间序列的季节分解第2页/共91页
2、2023/3/207-37.1 7.1 时间序列的基本概念 7.1.1 时间序列的定义时间序列的定义设 为整数集,如果对每一中每一元素,都有一与其对应,那么就称随机变量的集合为一时间序列。的一子集(称为 指标集)随机变量 简单地说,所谓时间序列,就是按照某种次序(多数情况下是时间顺序)排列的一族随机变量。第3页/共91页2023/3/207-4当获得了时间序列中每一随机变量的观测值,时,我们就得到了该序列。的一次实现特殊情况下 常常取正整数值,即 此时时间序列记为 ,本章讨论的问题 均考虑这样的时间数据。第4页/共91页2023/3/207-57.1.2 时间序列的自相关系数时间序列的自相关系
3、数设为一时间序列,均值:自协方差函数:的协方差与与称称为的自协方差函数。第5页/共91页2023/3/207-6 自相关函数:与与 时间序列的自协方差和相关系数是同一指标值在不同时间点上的相关,它们是时间点的函数。的相关系数称称为的自相关函数。第6页/共91页2023/3/207-77.1.3 时间序列的平稳性时间序列的平稳性设为一时间序列,若它满足(1)的均值函数在上为一常数;(2)的自协方差函数 在 上只依赖于 ;则称 是平稳序列(这里的的平稳指的是协方差意义下的平稳,也称弱平稳)。第7页/共91页2023/3/207-8依均值和方差的统计意义,平稳序列 的实现大致是由在某一水平线附近 和
4、自相关函数和自相关函数可分别简记为 和和。近等幅波动的点构成的。此时自协方差函数 第8页/共91页2023/3/207-9平稳时间序列与非平稳时间序列图平稳时间序列与非平稳时间序列图 tX tX t t (a)(b)第9页/共91页2023/3/207-107.1.4 时间序列的差分时间序列的差分假设 为一时间序列,一阶差分为:其中 表示一阶差分算子(difference operator),也即当前的观测值减去前面一定间隔的某个观测值。在许多时间序列数据中,差分可以是时间序列达到平稳性目的。当一个时间序列有斜率不变的趋势,通过一阶差分可以消除这种趋势。第10页/共91页2023/3/207-
5、11 有时我们需要对其进行多次一阶差分,从而达到平稳性的目的。令 表示一个后移算子,则 阶后移算子定义为:显然,那么,那么。第11页/共91页2023/3/207-12 【例7.1】(数据文件example7.1)选取我国从1978年至2008年国内生产总值(GDP,亿元)数值,总31个观测值,数据来源“国泰安宏观经济数据库”。试对该数据进行分析,判断其是否具有平稳性。第12页/共91页2023/3/207-13 解:时间序列的一个重要特征是数据是按时间顺序录入的,在许多情况下,我们可以增加一个时间变量来标示变量与时间的关系,但SPSS软件提供了一种更为方便的功能定义这种时间变量,使数据的图示
6、更为方便。在原始数据中,example7.1的第一列给出了我国从1978年至2008年国内生产总值(GDP,亿元)数值,此时没有时间变量。为了定义时间变量,打开数据文件,执行 DataDefine Dates 命令,打开Define Dates命令框,左边显示的是各种日期格式,在此数据中,时间格式是以年为单位,因此点中Years,右边即显示出需第13页/共91页2023/3/207-14要指定的时间初始值,在First Cases is中输入Years的初始值为1978,单击OK按钮,就可以形成两个新的时间变量,YEAR_,DATE_,并出现在数据文件的第二、三列。其中YEAR_,DATE_的
7、数值看上去是一样的,但YEAR_是数值变量,DATE_是字符变量,字符型变量主要功能在与方便进行图型显示。在SPSS软件中,还提供了对时间序列的变化计算功能Transform,可以计算时间序列数据的各种数据变换形式,其中最常用的是差分函数。第14页/共91页2023/3/207-15我们以一阶差分为例,在刚才的数据文件中,选择 命令,将对话框左边的GDP点入到New Variable(s)中,此时形成一个新的变量名称GDP_1,在Function功能框中选择Difference,Order选择1,单击OK按钮,就可以形成一阶差分后新的时间变量GDP_1,该变量的第一个数值为缺省,这是因为一阶差
8、分后,观测数据减少了一个。如果是两阶差分,前两个为缺省,以此类推。为了了解时间序列的初步特征,可以首先给出时间序列的时序图,操作如下:点击选择TransformCreate Time Series 第15页/共91页2023/3/207-16Time series Sequence chart命令,将对话框中左边的GDP及GDP_1选入右边的Variable中,将YEAR_选入Time Axis Labels中(Time lines及Format不做选择,即设为默认值;读者也可以根据自己的偏好进行选择),单击OK按钮,就可以得到图7.1中的时间序列图,这里我们将GDP及GDP_1同时列在一个图
9、中,以便比较。从图7.17.1中可以看出,GDP随着时间的增加呈现明显上升趋势,因此不具有平稳性特征。但经过一次差分后,曲线变得更为平滑,平稳性比原来的曲线更好。Analyze第16页/共91页2023/3/207-17图7.1 例7.1中GDP及GDP_1的时序图第17页/共91页2023/3/207-18 SPSS中还提供了计算自相关函数的功能。在上述数据文件中,选择 AnalyzeTime seriesAutocorrelations命令,将对话框中左边的GDP选入右边的Variable中,在Display选项中选择Autocorrelations,单击OK按钮,即可得到表7.1中计算结
10、果(同时会给出自相关函数的点图,这里不再列出,我们将在7.4节中详细讨论),从表7.1 的结果可以看出,自相关函数是滞后长度 的函数。随着lag长度的增加,序列的自相关性渐减弱,这是时间序列的一个重要特征。第18页/共91页2023/3/207-19表7.1 例7.1中GDP序列的自相关函数第19页/共91页2023/3/207-207.2 7.2 时间序列的趋势分析法 7.2.1 指数平滑法指数平滑法 指数平滑方法的基本原理是:当利用过去数据的加权平均预测将来的数值时,对序列中较近的数据给予较大的权重,远期的数据给于较小的权重。令 ,则 的预测值为:即利用过去的观测值进行加权平均预测时间序列
11、在 时刻的数值。(7.3)第20页/共91页2023/3/207-21由于 ,上式中求和号前面乘以 以保证系数求和为1 1。且权数 随着 的增加而递减,反映了较远的观测值对 时刻预测值的影响逐渐减小。事实上,(7.3)另一个等价形式是 也即如果知道本期观测值和上一期的预测值就可以求出本期的预测值。第21页/共91页2023/3/207-22 【例7.2】(数据文件example7.0)对例7.0的数据利用上面介绍的指数平滑方法进行分析。第22页/共91页2023/3/207-23 解:该数据的第一列给出了19901990年至20042004年我国月度社会消费品零售总额数据(亿元),每一年又12
12、12个月数据。我们首先可以类似的定义时间变量。打开数据文件,执行Data Define Data 命令,左边First Cases is显示的日期格式中选择“Years,months”,右边年的初始值设为1990;月的初始值选定为1,单击OK按钮,可以形成三个新的时间变量,YEAR_,MONTHS_,DATE_,并出现在数据文件的第2-4列中。第23页/共91页2023/3/207-24其中最后一列为字符型变量,该变量综合了年和月的时间表示。利用时序图类似的操作方法Analyze Time series Sequence chart 命令 下面我们利用SPSSSPSS软件对该数据进行指数平滑分
13、析。打开数据文件,执行Analyze Time series Create Model命令,出现一个对话框。点中Variables框中RetailSales点入到右边的Dependent variables中;在Method中选择Exponential Smoothing;点击Criteria,出现一个新的对话框,在Model type中选择Seasonal就可以给出7.0中的时序图。第24页/共91页2023/3/207-25中的其中一种(因为该数据有季节趋势,因此选择seasonal;如果对没有季节效应的数据,应选择nonseasonal),这里我们选择 Winters Multiplic
14、ative,在Dependent variable transformation中选择none(因为这里我们没有自变量),然后点击Continue,回到原来的对话框。当选择完成后,单击OK按钮,即可得到计算和输出结果。第25页/共91页2023/3/207-26图7.2 通过指数平滑后拟合值和预测值的时间序列图 第26页/共91页2023/3/207-27 图7.2给出了通过指数平滑后拟合值和预测值的时间序列图,可以看出,指数平滑方法可以很好的估计出我国月度社会消费品零售总额数据的变化趋势和周期波动。指数平滑过程中参数估计结果列在表7.2中.其他模型拟合结果可以在输出文件中得到,这里不再一一列
15、出。第27页/共91页2023/3/207-28表7.2 指数平滑的模型参数估计第28页/共91页2023/3/207-297.2.2 时间趋势的线性模型分析时间趋势的线性模型分析 研究时间序列随时间变动的趋势模型还可以用前面介绍的线性模型方法进行研究。此时将时间序列数据看成是因变量,时间 看成是自变量,建立相应的线性模型,对其长期趋势进行研究,最简单的模型是参数 可以使用最小二乘估计的方式进行计算。第29页/共91页2023/3/207-30在某些情况下,与时间 直线,而是 的二次函数关系,则此时可以用如 的关系可能不是下模型描述:第30页/共91页2023/3/207-31 Box-Jen
16、kins模型是一种描述时间序列数据参数模型,它包括自回归(AR)模型、滑动平均(MA)模型、自回归滑动平均(ARMAARMA)模型和可积自回归滑动平均(ARIMA)模型。其中AR、MA、ARMA模型在一定条件下用于拟合平稳时间序列,ARIMA用于处理非平稳时间序列数据。本节主要介绍这些模型的统计建模、参数估计和模型识别等内容。7.3 7.3 Box-Jenkins 模型 第31页/共91页2023/3/207-327.3.1 7.3.1 ARMA模型 自回归滑动平均(ARMA)模型是一种建立在平稳时间序列基础之上的参数模型,它由自回归模型(AR)和滑动平均模型(MA)构成。我们下面对这些模型做
17、一简要介绍。第32页/共91页2023/3/207-33 具有如下结构的模型称为 阶自回归模型,简记为1 1、自回归模型(AR)(7.6)第33页/共91页2023/3/207-34 其中的序列其中的序列 在时间序列中,在时间序列中,通常称为白噪声过程。通常称为白噪声过程。白噪声过程的本质:目前时刻与过去时刻的值不相关,过去时刻对未来也没有任何有用的价值。“白”是因为它的谱与白光有相同的特点,它的谱密度在所有的频率上都是常数。第34页/共91页2023/3/207-35假设为后移(滞后)算子,即,令,则(7.6)可以写为:。第35页/共91页2023/3/207-36假设表示的一个阶多项式,则
18、AR(p)模型平稳的充分必要条件是:的根全部落在单位圆之外。特别的,特别的,AR(1)的平稳域为:的平稳域为:;AR(2)的平稳域为:AR模型的平稳性第36页/共91页2023/3/207-37AR(2)模型的平稳域模型的平稳域第37页/共91页2023/3/207-38 具有如下结构的模型称为 阶自回归模型,简记为2 2、滑动平均模型(MA)类似的类似的,(7.8)可以表示为:可以表示为:(7.8)其中 。由于只有有限项,因此(7.8)是一个平稳过程。第38页/共91页2023/3/207-39MA模型的可逆性 MA模型中的一个重要内容是研究它的可逆性。令 表示 的 阶多项式,则MA(q)模
19、型满足可逆性的充分必要条件是:的根全部落在单位圆之外。当满足可逆条件时,(7.87.8)可以写为:由于 ,此时时间序列 可以看成是一个 模型。,第39页/共91页2023/3/207-403 3、自回归滑动平均模型(ARMA)当模型既有自回归项,又有滑动平均项时,就得到一个混合模型,称为自回归滑动平均模型,简记为 :(7.9)引进后移算子,模型又可以写为:第40页/共91页2023/3/207-41平稳条件与可逆条件ARMA(p,q)模型的平稳条件 的根都在单位圆外 即ARMA(p,q)模型的平稳性完全由其自 回归部分的平稳性决定ARMA(p,q)模型的可逆条件 的根都在单位圆外 即ARMA(
20、p,q)模型的可逆性完全由其移动平滑部分的可逆性决定第41页/共91页2023/3/207-427.3.2 7.3.2 ARMA模型的参数估计及模型待估参数:个未知参数常用估计方法:极大似然估计最小二乘估计第42页/共91页2023/3/207-431 1、条件最小二乘估计 条件最小二乘估计主要用于AR模型参数的估计,是一种比较简单的估计方法。原理:使残差平方和达到最小的那组参数值即为最小二乘估计值第43页/共91页2023/3/207-44残差估计为:的无偏估计为:由于 具有正态分布,参数 的最小二乘估计等价于条件极大似然估计。第44页/共91页2023/3/207-45度量模型拟合程度的一
21、个统计量是 或分别定义为:,其中 是基于样本数据的样本方差。或 越大,表明模型拟合越好。在时间序列模型中,也称为Stationary 。第45页/共91页2023/3/207-462 2、条件极大似然估计 对 及 模型,模型参数估计使用比较广泛的是条件极大似然估计,我们以 为例,此时模型(7.9)可以写为在给定个初始值,及 的初始值之后,参数 的似然函数为:第46页/共91页2023/3/207-47 通过极大化上述似然函数得到的参数估计就是条件极大似然估计。一般情况下,参数的估计需要迭代计算。对应于模型拟合度量的统计量主要有AIC及BIC统计量,分别定义为 第47页/共91页2023/3/2
22、07-48 其中,是-2乘以最大似然函数的对数值,代表模型中参数的个数,是有效观察个数(即样本量)。AIC或BIC越小,说明模型拟合越好。第48页/共91页2023/3/207-497.3.3 7.3.3 ARMA模型的模型识别 识别模型阶数的两个重要统计量是自相关函数(autocorrelation function,简记为ACF)和偏自相关函数(partial Autocorrelation function,简记为PACF)。称为样本ACF。当我们得到时间序列数据 之后,可以给出ACF的样本形式 第49页/共91页2023/3/207-50 偏相关函数是指在给定 的条件下,与 之间的相关
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 时间 序列 分析
限制150内