ARMA模型和SAS求解电子版本.doc
《ARMA模型和SAS求解电子版本.doc》由会员分享,可在线阅读,更多相关《ARMA模型和SAS求解电子版本.doc(84页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Good is good, but better carries it.精益求精,善益求善。ARMA模型和SAS求解-第6讲时间序列分析教材:应用时间序列分析课件(中国人民大学王燕),SAS如何解及下载例程。时间序列分析(Timeseriesanalysis)是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题。时间序列是把反映现象发展水平的统计指标数值,按照时间先后顺序排列起来所形成的一组统计数字序列。时间序列又称动态数列或时间数列。时间序列分析就是利用这组数列,应用数理统计方法加以处理,以预测未来事物的发展。时间序列分析
2、是定量预测方法之一,它的基本原理:一是承认事物发展的延续性。应用过去数据,就能推测事物的发展趋势。二是考虑到事物发展的随机性。任何事物发展都可能受偶然因素影响,为此要利用统计分析中加权平均法对历史数据进行处理。该方法简单易行,便于掌握,但准确性差,一般只适用于短期预测。时间序列预测一般反映三种实际变化规律:趋势变化、周期性变化、随机性变化。时间序列分析是根据系统观测得到的时间序列数据,通过曲线拟合和参数估计来建立数学模型的理论和方法。时间序列分析常用在国民经济宏观控制、区域综合发展规划、企业经营管理、市场潜量预测、气象预报、水文预报、地震前兆预报、农作物病虫灾害预报、环境污染控制、生态平衡、天
3、文学和海洋学等方面。时间序列分析主要用途:系统描述。根据对系统进行观测得到的时间序列数据,用曲线拟合方法对系统进行客观的描述。系统分析。当观测值取自两个以上变量时,可用一个时间序列中的变化去说明另一个时间序列中的变化,从而深入了解给定时间序列产生的机理。预测未来。一般用ARMA模型拟合时间序列,预测该时间序列未来值。决策和控制。根据时间序列模型可调整输入变量使系统发展过程保持在目标值上,即预测到过程要偏离目标时便可进行必要的控制。基本步骤:用观测、调查、统计、抽样等方法取得被观测系统时间序列动态数据。根据动态数据作相关图,进行相关分析,求自相关函数。相关图能显示出变化的趋势和周期,并能发现跳点
4、和拐点。跳点是指与其他数据不一致的观测值。如果跳点是正确的观测值,在建模时应考虑进去,如果是反常现象,则应把跳点调整到期望值。拐点则是指时间序列从上升趋势突然变为下降趋势的点。如果存在拐点,则在建模时必须用不同的模型去分段拟合该时间序列,例如采用门限回归模型。辨识合适的随机模型,进行曲线拟合,即用通用随机模型去拟合时间序列的观测数据。对于短的或简单的时间序列,可用趋势模型和季节模型加上误差来进行拟合。对于平稳时间序列,可用通用ARMA模型(自回归滑动平均模型)及其特殊情况的自回归模型、滑动平均模型或组合ARMA模型等来进行拟合。当观测值多于50个时一般都采用ARMA模型。对于非平稳时间序列则要
5、先将观测到的时间序列进行差分运算,化为平稳时间序列,再用适当模型去拟合这个差分序列。本章重点:1)建立阶自回归模型:2)建立阶移动平均模型:3)模型:三个模型的拖尾、截尾性模型自相关系数偏自相关系数拖尾阶截尾阶截尾拖尾拖尾拖尾一. 建模步骤:平稳非白噪声序列?计算ACF,PACFARMA模型识别估计模型中未知参数值模型优化模型预测模型检验即残差白噪声检验NY图6.0自回归滑动平均(ARMA)模型建模步骤Y平滑处理N几个概念随机过程:X(t);-t,其中X(t)是随机变量.随机序列:Xk;k=,-1,0,1,其中Xk是随机变量.特别当Xk=X(kh)时,序列Xk是过程X(t)的等间隔采样序列.根
6、据随机变量X和它的样本的定义,我们有:样本序列:,x-1,x0,x1,是序列xk的一个样本序列,又称为一个实现,或一个观测序列等.请注意:随机变量X的一个样本,就是一个数;随机向量X的一个样本,就是一个向量数;随机序列Xk的一个样本,是一个无穷数列;在实际应用中,我们无法记录无穷数列,从而在讨论随机序列Xk的样本时,只能考虑一个样本的有限部分,比如x1,x2,xn是序列Xk的一段观测值序列.在理论讨论时,为了方便又不得不涉及无穷数列.这些都是学习和掌握时间序列分析时,首先要认清的起点.序列的分布:回忆随机变量X的定义便知,它的特征被它的概率分布所确定.同样,随机序列也被它的概率分布所确定.不过
7、,随机序列的分布是无穷个随机变量的概率分布,其复杂性可以想像.这里为了避免涉及太深的概率论概念,我们仅考虑最简单的,即XkN(mk,s2k),它有密度fk(x)=(2ps2k)-1/2exp(x-mk)2/2s2k而且(Xk+1,Xk+2,Xk+m)有联合正态分布.于是有:期望(均值):EXk=xfk(x)dx=mk,方差:Var(Xk)=E(Xk-mk)2=(x-mk)2fk(x)dx=s2k.自协方差:gkj=E(Xk-mk)(Xj-mj)=(x-mk)(y-mj)fkj(x,y)dxdy=E(Xj-mj)(Xk-mk)=gjk.二. (注E(X-EX)(Y-EY)展开=E(XY)-E(X
8、)E(Y)=cov(X,Y),协方差,不同事件之间的相关性度量)平稳性检验1. 严平稳和宽平稳平稳时间序列有两种定义,根据限制条件的严格程度,分为:l 严平稳时间序列(strictlystationary)指序列所有的统计性质都不会随着时间的推移而发生变化,即(Xk+1,Xk+2,Xk+m)的联合分布(实际很难求)与k无关。l 宽平稳时间序列(weekstationary)指序列的统计性质只要保证序列的二阶矩平稳就能保证序列的主要性质近似稳定。如果在任取时间、和时,时间序列满足如下三个条件:(6.1)(6.2)(6.3)则称为宽平稳时间序列。也称为弱平稳或二阶平稳。对于正态随机序列而言,由于联
9、合概率分布仅由均值向量和协方差阵决定,即只要二阶矩平稳,就等于分布平稳了。2. 平稳时间序列的统计性质根据平稳时间序列的定义,可以推断出两个重要的统计性质:l 均值为常数。即式(6.2)的条件。l 自协方差只依赖于时间的平均长度(只与起点有关与跨度无关)。即式(6.3)的条件。如果定义自协方方差函数(autocovariancefunction)为:(6.4)那么它可由二维函数简化为一维函数,由此引出延迟自协方差函数:(6.5)容易推断出平稳时间序列一定具有常数方差:(6.6)如果定义时间序列自相关函数(autocorrelationfunction),简记为ACF:(6.7)由延迟自协方差函
10、数的概念可以等价得到延迟自相关函数的概念:(6.8)容易验证自相关函数具有几个基本性质:l ;l ;l 自相关阵为对称非负定阵;l 非惟一性。注意区分:协方差函数和相关函数度量两个不同事件彼此之间的相互影响的程度。自协方差函数和自相关函数度量同一事件在两个不同时期之间的相互影响的程度。3. 样本的估计值在平稳序列场合,序列的均值等于常数意味着原本含有可列多个随机变量的均值序列变成了只含有一个变量的常数序列,所以常数均值的估计值为(6.9)同样可以根据平稳序列二阶矩平稳的性质,得到基于样本计算出来的各种估计值。延迟自协方差函数的估计值:(6.10)总体方差的估计值:(6.11)延迟自相关函数的估
11、计值:(6.12)4. 平稳性检验的方法对序列的平稳性检验有两种方法:一种是根据时序图和自相关图显示的特征做出判断的图检验方法;一是构造检验统计量进行假设检验的单位根检验(unitroottest)方法。是建模的前提,可借助SAS(见例程)、SPSS、Eviews等软件实现。l 时序图和自相关图检验l 单位根检验(unitroottest)所谓单位根检验就是通过检验时间序列自回归特征方程的特征根是在单位圆内还是在单位圆外(包括在单元圆上),来检验时间序列的平稳性。单位根检验统计量中最常用的是ADF检验统计量,又称增广DF检验(augmentedDickey-Fuller)。对任一p阶自回归AR
12、(p)过程(6.13)它的特征方程为(6.14)如果该方程所有的特征根都在单位圆内,即则序列平稳。如果至少存在一个特征根不在单位圆内,不妨设,则序列非平稳,且自回归系数之和恰好等于1。即(6.15)因而,对于AR(p)过程可以通过检验自回归系数之和是否大于等于1来考察该序列的平稳性。设,那么原假设:(序列非平稳),ADF检验统计量:(6.16)式中,为参数的样本标准差。1979年,Dickey和Fuller使用蒙特卡洛模拟方法算出了检验统计量的临界值表。三. 纯随机性检验如果序列值彼此之间没有任何相关性,那就意味着该序列是一个没有记忆的数据序列,即过去的行为对未来的发展没有丝毫影响,这种序列我
13、们称之为纯随机序列。从统计分析的角度而言,纯随机序列是没有任何分析价值的序列。因此,为了确保平稳序列还值不值得分析下去,需要对平稳序列进行纯随机性检验。5. 纯随机序列(白噪声序列)如果在任取时间和时,时间序列满足如下三个条件:(6.17)(6.18)(6.19)称此序列为纯随机序列,也称为白噪声(whitenoise)序列,简记为。之所以称之为白噪声序列是因为人们最初发现白光具有这种特性。比较平稳时间序列的定义,可看出白噪声序列一定是平稳序列,且是一种最简单的平稳序列。见图6.1所示是随机生成的1000个服从标准正态分布的白噪声序列观察值。图6.1标准正态白噪声序列时序图根据白噪声序列的定义
14、,白噪声序列具有三个重要的性质:l 常数均值();l 纯随机性();l 方差齐性(,即序列中每个度量的方差相等)。6. 纯随机性检验即白噪声检验(通常对残差序列做)。Barlett证明,如果一个时间序列是纯随机的,得到一个观察期数为的观察序列,那么该序列的延迟非零期的样本自相关系数将近似服从均值为零、方差为序列观察数倒数的正态分布,即(6.20)式中为延迟期数,为样本观察期数。根据Barlett定理,可以构造检验统计量和检验统计量来检验序列的纯随机性。原假设:延迟期数小于或等于期的序列值之间相互独立,即;备选假设:延迟期数小于或等于期的序列值之间有相关性,即至少存在某个。1) 检验统计量由Bo
15、x和Pierce推导出的检验统计量为:(6.21)式中,为序列观察期数,为指定延迟期数。2) 检验统计量因为检验统计量在小样本场合时不太精确,所以Ljung和Box又推导出检验统计量为:(6.22)式中,为序列观察期数,为指定延迟期数。一般取值为6、12。为什么只需要检验前6期和前12期延迟的检验统计量就可以直接判断序列是否为白噪声序列呢?这是因为平稳序列通常具有短期相关性,只要序列时期足够长,自相关系数都会收敛于零。所以,如果序列值之间存在显著的相关关系,通常只存在在延迟时期比较短的序列值之间,而如果短期延迟的序列之间都不存在显著的相关关系,那么长期延迟之间就更不会存在显著的相关关系。纯随机
16、性检验小结:当Q统计量的P值大于给定的显著水平a(譬如=0.05)时,不拒绝原假设,即相关系数为0,认为序列是白噪声无任何信息可取,停止统计分析(建模)。四. 方法性工具7. 差分运算差分运算分为两种:步差分和阶差分。1) 步差分相距期的两个序列值之间的减法运算称为步差分运算,记为,表示与之间的减法运算,即:(6.23)2) 阶差分相距一期的两个序列值之间的减法运算称为1阶差分运算,记为,表示与之间的减法运算,即:(6.24)对1阶差分运算后序列再进行一次1阶差分运算称为2阶差分,记为,表示与之间的减法运算,即:(6.25)依此类推,对阶差分后序列再进行一次1阶差分运算称为阶差分,记为,表示与
17、之间的减法运算,即:(6.26)8. 延迟算子延迟算子类似于一个时间指针,一个延迟算子乘以当前序列值,就相当于把当前序列值的时间向过去拨了一个时间刻度,记B为延迟算子,有(6.27)用延迟算子表示的步差分为:(6.28)用延迟算子表示的阶差分为:(6.29)五. ARMA模型ARMA模型的全称是自回归移动平均(autoregressionmovingaverage)模型,它是目前最常用的拟合平稳时间序列的模型。ARMA模型又可细分为AR模型、MA模型和ARMA模型三大类。9. 模型具有如下结构的模型称为阶自回归模型,简记为:(6.30)其中包含三个限制条件:模型的最高阶数为,即;随机干扰序列为
18、零均值的白噪声序列,即;当期的随机干扰与过去的序列值无关,即。1) 中心化的模型当时,式(6.30)又称为中心化的模型。非中心化的序列都可以通过假设满足平稳性条件,在式(6.30)两边取期望,根据平稳时间序列均值为常数的性质,有,且因为为零均值的白噪声,有,所以:(6.31)如果把非中心化的序列减去上式(6.31)中的,则转化为中心化序列。特别地,对于中心化序列,有。引进延迟算子,设,又称为阶自回归系数多项式,则中心化模型可以简记为:(6.32)2) 模型的方差要得到平稳模型的方差,需要借助于Green函数的帮助。下面以求模型的方差为例来说明:将第二式代入第一式,有当我们继续将代入上式,一直到
19、,可得到如果,设Green函数为,上式可改为(6.33)对求方差为(6.34)3) 模型的协方差对中心化的平稳模型在等号两边同乘,再求期望得到(6.35)由模型的限制条件,有,再根据平稳时间序列的统计性质,有自协方差函数只依赖于时间的平均长度而与时间的起止点无关,于是可由(6.35)式得到自协方差函数的递推公式:(6.36)例如,对于模型的自协方差函数的递推公式为:(6.37)4) 模型的自相关函数由于平稳时间序列有自相关函数,在自协方差函数的递推公式(6.36)等号两边同除以方差函数,就得到自相关函数的递推公式:(6.38)例如,对于模型的自相关函数的递推公式为:(6.39)根据式(6.38
20、)可以推出,平稳模型的自相关函数有两个显著的性质:l 拖尾性指自相关函数始终有非零取值,不会在大于某个常数之后就恒等于零。l 负指数衰减随着时间的推移,自相关函数会迅速衰减,且以负指数(其中为自相关函数的差分方程的特征根)的速度在减小。见图6.2和图6.3所示是两个平稳模型的理论自相关图。图6.2ACF按负指数单调收敛到零图6.3ACF按正负相间地衰减到零5) 模型的偏自相关系数对于一个平稳模型,求出滞后自相关系数时,实际上得到的并不是与之间单纯的相关关系。因为这个还会受到中间个随机变量的影响,即这个随机变量既与又与具有相关关系。为了能单纯测度与之间的相关关系,引进了时间序列偏自相关函数(pa
21、rtialautocorrelationfunction),简记为PACF。它是在剔除了中间个随机变量的干扰之后的滞后自相关系数,计算公式为:(6.40)式中,。如果我们用过去的期序列值对作阶自回归拟合,即(6.41)那么有。这说明滞后偏自相关系数实际上等于阶自回归模型第个回归系数的值。根据这个性质很容易计算PACF的值。在公式(6.41)中等号两边同乘,求期望并除以,得到(6.42)取前个方程构成的方程组:(6.43)该方程组被称为Yule-Walker方程。根据线性方程组求解的Gramer法则,有(6.44)式中:可以证明对于平稳模型,当时,有,这样。也就是说平稳模型的偏自相关系数具有步截
22、尾性。见图6.4和图6.5所示是两个平稳模型的样本偏自相关图。图6.4一个AR(1)模型n=101样本偏自相关函数PACF(k)图图6.5一个AR(1)模型n=101样本偏自相关函数PACF(k)图由于样本的随机性,样本偏自相关系数不会和理论偏自相关系数一样严格截尾,但可以从图6.4和图6.5中看出,两个平稳模型的样本偏自相关系数1阶显著不为零,1阶之后都近似为零。样本偏自相关图可以直观地验证平稳模型偏自相关系数具有步截尾性。10. 模型具有如下结构的模型称为阶移动平均,简记为:(6.45)其中包含两个限制条件:模型的最高阶数为,即;随机干扰序列为零均值的白噪声序列,即。1) 中心化的模型当时
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ARMA 模型 SAS 求解 电子 版本
限制150内