《自回归AR模型、移动平均MA模型与自回归移动平均ARMA模型的比较分析.doc》由会员分享,可在线阅读,更多相关《自回归AR模型、移动平均MA模型与自回归移动平均ARMA模型的比较分析.doc(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、自回归AR模型、移动平均MA模型与自回归移动平均ARMA模型的比较分析系统中某一因素变量的时间序列数据没有确定的变化形式,也不能用时间的确定函数描述,但可以用概率统计方法寻求比较合适的随机模型近似反映其变化规律。(自变量不直接含有时间变量,但隐含时间因素)1 自回归AR(p)模型(R:模型的名称 P:模型的参数)(自己影响自己,但可能存在误差,误差即没有考虑到的因素)(1)模型形式(t越小越好,但不能为0:为0表示只受以前Y的历史的影响不受其他因素影响) yt=1yt-1+2yt-2+pyt-p+t 式中假设:yt的变化主要与时间序列的历史数据有关,与其它因素无关; t不同时刻互不相关,t与y
2、t历史序列不相关。式中符号:p模型的阶次,滞后的时间周期,通过实验与参数确定;yt当前预测值,与自身过去观测值yt-1、yt-p是同一序列不同时刻的随机变量,相互间有线性关系,也反映时间滞后关系;yt-1、yt-2、yt-p同一平稳序列过去p个时期的观测值;1、2、p自回归系数,通过计算得出的权数,表达yt依赖于过去的程度,且这种依赖关系恒定不变;t随机干扰误差项,是0均值、常方差2、独立的白噪声序列,通过估计指定的模型获得。(2)识别条件 当kp时,有k=0或k服从渐近正态分布N(0,1/n)且(|k|2/n1/2)的个数4.5%,即平稳时间序列的偏相关系数k为p步截尾,自相关系数rk逐步衰
3、减而不截尾,则序列是AR(p)模型。 实际中,一般AR过程的ACF函数呈单边递减或阻尼振荡,所以用PACF函数判别(从p阶开始的所有偏自相关系数均为0)。(3)平稳条件 一阶:|1|1。二阶:1+21、1-21、|2|q时,有自相关系数rk=0或自相关系数rk服从N(0,1/n(1+2r2i)1/2)且(|rk|2/n1/2(1+2r2i)1/2)的个数4.5%,即平稳时间序列的自相关系数rk为q步截尾,偏相关系数k逐步衰减而不截尾,则序列是MA(q)模型。 实际中,一般MA过程的PACF函数呈单边递减或阻尼振荡,所以用ACF函数判别(从q阶开始的所有自相关系数均为0)。(4)可逆条件 一阶:
4、|1|1。二阶:|2|1、1+21。 当满足可逆条件时,MA(q)模型可以转换为AR(p)模型3自回归移动平均ARMA(p,q)模型(1) 模型形式 yt=1yt-1+2yt-2+pyt-p+t-1t-1-2t-2-pt-p式中符号: p与q是模型的自回归阶数与移动平均阶数;与是不为零的待定系数;t独立的误差项;yt是平稳、正态、零均值的时间序列。(2) 模型含义使用两个多项式的比率近似一个较长的AR多项式,即其中p+q个数比AR(p)模型中阶数p小。前二种模型分别是该种模型的特例。一个ARMA过程可能是AR与MA过程、几个AR过程、AR与ARMA过程的迭加,也可能是测度误差较大的AR过程。(
5、3) 识别条件平稳时间序列的偏相关系数k与自相关系数rk均不截尾,但较快收敛到0,则该时间序列可能是ARMA(p,q)模型。实际问题中,多数要用此模型。因此建模解模的主要工作是求解p、q与、的值,检验t与yt的值。(4) 模型阶数AIC准则:最小信息准则,同时给出ARMA模型阶数与参数的最佳估计,适用于样本数据较少的问题。目的是判断预测目标的发展过程与哪一随机过程最为接近。因为只有当样本量足够大时,样本的自相关函数才非常接近母体的自相关函数。具体运用时,在规定范围内使模型阶数从低到高,分别计算AIC值,最后确定使其值最小的阶数是模型的合适阶数。模型参数最大似然估计时AIC=(n-d)log2+
6、2(p+q+2)模型参数最小二乘估计时AIC=nlog2+(p+q+1)logn式中:n为样本数,2为拟合残差平方与,d、p、q为参数。其中:p、q范围上线是n较小时取n的比例,n较大时取logn的倍数。实际应用中p、q一般不超过2。4自回归综合移动平均ARIMA(p,d,q)模型(1)模型识别 平稳时间序列的偏相关系数k与自相关系数rk均不截尾,且缓慢衰减收敛,则该时间序列可能是ARIMA(p,d,q)模型。(2)模型含义模型形式类似ARMA(p,q)模型,但数据必须经过特殊处理。特别当线性时间序列非平稳时,不能直接利用ARMA(p,q)模型,但可以利用有限阶差分使非平稳时间序列平稳化,实际
7、应用中d一般不超过2。若时间序列存在周期性波动,则可按时间周期进行差分,目的是将随机误差有长久影响的时间序列变成仅有暂时影响的时间序列。即差分处理后新序列符合ARMA(p,q)模型,原序列符合ARIMA(p,d,q)模型。自回归移动平均模型(2011-02-24 01:41:42) 标签: 校园分类: 工作篇 3.3时间序列分析3.3.1时间序列概述1. 基本概念(1)一般概念:系统中某一变量的观测值按时间顺序(时间间隔相同)排列成一个数值序列,展示研究对象在一定时期内的变动过程,从中寻找与分析事物的变化特征、发展趋势与规律。它是系统中某一变量受其它各种因素影响的总结果。(2)研究实质:通过处
8、理预测目标本身的时间序列数据,获得事物随时间过程的演变特性与规律,进而预测事物的未来发展。它不研究事物之间相互依存的因果关系。(3)假设基础:惯性原则。即在一定条件下,被预测事物的过去变化趋势会延续到未来。暗示着历史数据存在着某些信息,利用它们可以解释与预测时间序列的现在与未来。 近大远小原理(时间越近的数据影响力越大)与无季节性、无趋势性、线性、常数方差等。(4)研究意义:许多经济、金融、商业等方面的数据都是时间序列数据。 时间序列的预测与评估技术相对完善,其预测情景相对明确。 尤其关注预测目标可用数据的数量与质量,即时间序列的长度与预测的频率。2. 变动特点(1)趋势性:某个变量随着时间进
9、展或自变量变化,呈现一种比较缓慢而长期的持续上升、下降、停留的同性质变动趋向,但变动幅度可能不等。(2)周期性:某因素由于外部影响随着自然季节的交替出现高峰与低谷的规律。(3)随机性:个别为随机变动,整体呈统计规律。(4)综合性:实际变化情况一般是几种变动的叠加或组合。预测时一般设法过滤除去不规则变动,突出反映趋势性与周期性变动。3. 特征识别认识时间序列所具有的变动特征,以便在系统预测时选择采用不同的方法。(1)随机性:均匀分布、无规则分布,可能符合某统计分布。(用因变量的散点图与直方图及其包含的正态分布检验随机性,大多数服从正态分布。)(2)平稳性:样本序列的自相关函数在某一固定水平线附近
10、摆动,即方差与数学期望稳定为常数。 样本序列的自相关函数只是时间间隔的函数,与时间起点无关。其具有对称性,能反映平稳序列的周期性变化。 特征识别利用自相关函数ACF:k=k/0其中k是yt的k阶自协方差,且0=1、-1k50,滞后周期kn/4,所以此处控制最大滞后数值Maximum Number of Lags设定为12。点击继续Continue返回自相关主对话框后,点击OK运行系统,输出自相关图如图3.19所示。图3.19 从图中看出;样本序列数据的自相关系数在某一固定水平线附近摆动,且按周期性逐渐衰减,所以该时间序列基本是平稳的。(3)数据变换:若时间序列的正态性或平稳性不够好,则需进行数
11、据变换。常用有差分变换(利用transformCreate Time Series)与对数变换(利用TransformCompute)进行。一般需反复变换、比较,直到数据序列的正态性、平稳性等达到相对最佳。2. 模型识别分析时间序列样本,判别模型的形式类型,确定p、d、q的阶数。(1)判别模型形式与阶数 相关图法: 运行自相关图后,出现自相关图(图3.19)与偏自相关图(图3.20)。图3.20 从图中看出:自相关系数与偏相关系数具有相似的衰减特点:衰减快,相邻二个值的相关系数约为0.42,滞后二个周期的值的相关系数接近0.1,滞后三个周期的值的相关系数接近0.03。所以,基本可以确定该时间序
12、列为ARMA(p,q)模型形式,但还不能确定是ARMA(1,1)或是ARMA(2,2)模型。但若前四个自相关系数分别为0.40、0.16、0.064、0.0256,则可以考虑用AR(1) 模型。 另外,值得说明的是:只是ARMA模型需要检验时间序列的平稳性,若该序列的偏自相关函数具有显著性,则可以直接选择使用AR模型。 实际上,具体应用自相关图进行模型选择时,在观察ACF与PACF函数中,应注意的关键问题是:函数值衰减的是否快;是否所有ACF之与为-0.5,即进行了过度差分;是否ACF与PACF的某些滞后项显著与容易解释的峰值等。但是,仅依赖ACF图形进行时间序列的模型识别是比较困难的。 参数
13、估计: 从(m,m-1)开始试验,一般到m=p+q=1/n。实际应用中,往往从(1,1)、(2,2),逐个计算比较它们的AIC值(或SBC值),取其值最小的确定为模型。(2)建立时间序列新变量 无论是哪种模型形式,时间序列总是受自身历史数据序列变化的影响,因此需将历史数据序列作为一个新的时间序列变量。 按数据转换transform建立时间序列Create Time Series的顺序展开对话框,图3.21。图3.21在功能Function下拉框中选择变量转换的函数,其中:非季节差分Differences: 计算时间序列连续值之间的非季节性差异。季节性差分Seasonal Differences
14、: 计算时间序列跨距间隔恒定值之间的季节性差异,跨距根据定义的周期确定。领先移动平均Prior moving average:计算先前的时间序列数值的平均值。中心移动平均Centered moving average:计算围绕与包括当前值的时间序列数值的平均值。中位数Running medians:计算围绕与包括当前值的时间序列的中位数。累积与Cumulative sum:计算直到包括当前值的时间序列数值的累计总数。滞后顺序Lag: 根据指定的滞后顺序,计算在前观测量的值。领先顺序Lead:根据指定的领先顺序,计算连续观测量的值。平滑Smoothing:以混合数据平滑为基础,计算连续观测量的值
15、。以上各项主要用在生成差分变量、滞后变量、平移变量,并且还要关注差分、滞后、平移的次数,以便在建立模型、进行参数估计时,使方程达到一致。在顺序Order框中填入在前或在后的时间序列数值间隔的数目。在新变量New Variable框中接受左边框移来的源变量。在名称Name框中定义新变量的名称,但必单击改变Change方能成立。单击OK运行系统,在原数据库中出现新变量列。另外,若需产生周期性时间序列的日期型变量,则按数据Data定义日期Define Dates的顺序展开如图3.22所示对话框。图3.22在样本Cases Are栏中选择定义日期变量的时间间隔,在起始日期First Case Is栏中
16、设定日期变量第一个观测量的值,单击OK完成定义。3. 参数估计采用最大似然估计或最小二乘估计等方法估计、参数值,并进行显著性检验。按分析Analyze时间序列Time seriesARIMA模型的顺序展开如图3.23对话框。图3.23 在图3.23中:选择原时间序列变量进入因变量框;根据模型识别结果与建立的新时间变量,选择一个或多个变量进入自变量框;暂时不进行因变量的数据转换;与自变量的选择对应,根据模型识别结果或实验的思路设定p、(d)、q的值;选择模型中包含常数项;分别单击保存与设置按钮,展开如图3.24与3.25对话框。图3.24 图3.24中:在建立变量Create Variable栏
17、选择新建变量结果暂存原数据文件Add to file项,也可选择用新建变量代替原数据文件中计算结果Replace existing项;在设定置信区间百分比%Confidence Intervals下拉框选择95;在预测样本Predict Cases栏选择根据时期给出预测结果的方法。图3.25 图3.25中:在收敛标准Convergence Criteria栏选择迭代次数Maximum iterations、参数变化精度Parameter change、平方与变化精度Sum of squares change,当运算达到其中一个参数的设定,则迭代终止;在估计初始值Initial Values f
18、or Estimation栏选择由过程自动选择Automatic或由先前模型提供Apply from previous model,一般默认前者;在预测方法Forecasting Method栏选择无条件Unconditional或有条件最小二乘法Conditional least squares;在输出控制Display栏选择最初与最终参数的迭代摘要Initial and final parameters with iteration summary或详细资料details、或只显示最终参数Final parameters only。 单击OK,系统立即执行,输出信息如下:MODEL: MO
19、D_1Split group number: 1 Series length: 48No missing data.Melards algorithm will be used for estimation.Conclusion of estimation phase.Estimation terminated at iteration number 7 because:Sum of squares decreased by less than .001 percent.FINAL PARAMETERS:Number of residuals 48Standard error 1.199694
20、9Log likelihood -75.463915AIC 156.92783SBC 162.54143 Analysis of Variance: DF Adj. Sum of Squares Residual VarianceResiduals 45 65.099923 1.4392678 Variables in the Model: B SEB T-RATIO APPROX. PROB.AR1 .02318739 .31945836 .0725835 .94245925MA1 -.44871554 .28829314 -1.5564558 .12660552CONSTANT -.024
21、21308 .25505018 -.0949346 .92478827The following new variables are being created:Name LabelFIT_1 Fit for 样本数据 from ARIMA, MOD_1 CONERR_1 Error for 样本数据 from ARIMA, MOD_1 CONLCL_1 95% LCL for 样本数据 from ARIMA, MOD_1 CONUCL_1 95% UCL for 样本数据 from ARIMA, MOD_1 CONSEP_1 SE of fit for 样本数据 from ARIMA, MO
22、D_1 CON各个输出统计量的意义:常数项:认为是取值恒为1的常数变量,其系数就是自变量为0时因变量的最优预测值,也称为预测基准值。系数:反映自变量对因变量影响的权重。标准误:表明样本数据的可靠性。在(残差)参数近似服从正态分布条件下,系数加减两倍的标准误差近似等于总体参数95%的置信区间。其值越小,置信区间越窄;并且其对于系数的相对值越小,估计结果越精确。t统计量:估计系数与标准误差的比值,检验变量的不相关性。一般给定5%显著水平,则拒绝原假设的0值位于95%的置信区间外,其绝对值必大于2。t概率值:其值越小,则拒绝原假设不相关性的证据越充分。其值接近0.05与t统计量接近2相对应。均值:度
23、量变量的集中度,传递随机变量的位置信息。标准差:度量变量的离散度,传递随机变量的规模信息。平方与:残差平方与是许多统计量的组成部分,孤立考察无太大价值。准则:信息准则AIC与SBC用于模型的选择,越小越好,但受自由度约束较为严重。R2校正:是模型中自变量对因变量变动的解释比例,度量方程预测因变量的成功程度,其是回归标准误差与因变量标准差比较的结果。另一个比较方法是回归标准误差不超过因变量均值的10%则为好的模型。DW统计:用于检验随机误差项是否存在序列相关。LN似然:用于模型比较与假设检验,越大越好。残差图:4. 模型检验检验新建模型的合理性。若检验不通过,则调整(p,q)值,重新估计参数与检
24、验,反复进行直到接受为止。但模型识别、参数估计、检验修正三个过程之间相互作用、相互影响,有时需要交叉进行、反复实验,才能最终确定模型形式。(1)相关图检验残差白噪声:因为白噪声过程是序列无关的,所以白噪声过程的自相关函数与偏自相关函数在自相关图中均为等于0的水平直线。(2)散点图检验残差独立性:以误差值为纵坐标、以预测值为横坐标,观察散点分布的均匀性、随机性。理想预测模型的预测误差一定是不可预测的、无规律的、序列无关的。相应的DW统计量仅适用检验一阶序列。(3)直方图检验残差零均值: 零均值仅检验残差序列无关,若正态分布则检验独立性。(4)概率图检验残差自相关:以显著性水平0.05计算2()概
25、率值,。(5)均方差检验预测的效果:以预测误差的均方差最小为标准,注意预测误差仅与预测周期有关,而与起始时刻无关。5. 模型预测预测系统研究对象的未来某时刻状态。列出预测模型,计算预测值。(一)长期趋势长期趋势分析是统计动态分析的重要内容。其作用为: 观察与研究客观现象发展变化的方向,发展变化的幅度; 观察与研究客观现象在研究期内的主要波动,为进一步研究季节波动与循环波动做准备; 通过以上两方面的研究进一步预测未来发展状态。对客观现象的长期趋势进行分析,统计上主要的方法为图示法与模型法。图示法主要是利用较为简单的移动平均修匀数据后,再绘制散点图来描述事物发展变化的规律。而模型法是利用数学模型模
26、拟动态趋势,用最为的恰当的模型来概括事物的发展动态。1 时间变量回归模型时间变量回归模型是应用回归分析的原理,将时间序列中的时间因素(t)作为自变量(解释变量),所要描述的经济变量作为因变量(被解释变量)而建立的模型。其总体模型为:其中的两个参数a与b的估计值可以根据的各期观测值与各斯的序号t采用最小平方法得到。其参数估计公式为依据上述公式求出之后,即可得到反映长期趋势的回归方程:,把时间变量的t的未来取值代入该式,即可得到相应时期的预测值。2 时间序列模型时间序列模型也是应用回归分析的原理,在假定社会经济现象存在序列相关,即某一时期的发展水平与前几期水平相互关联的基础上,将前几期的变量作为自
27、变量而建立的模型。(1) 自回归模型自回归模型考虑的是时间序列第t期的观测值与前若干期的观测值之间的线性回归关系。最简单的自回归模型是一阶自回归模型。即时间序列在 t期的观测值,至少部分地与(t-1)期的观测值相关,一阶自回归模型可记为AR(1),定义如下:在一阶自回归模型中,部分地依赖于,部分地依赖随机扰动项。从AR(1)进一步扩展,可以引出二阶自回归模型AR(2),即:及n阶自回归模型AR(n):式中,表示时间序列在第t期的观测值,表示该时间序列在第期的观测值,表示该时间序列在第期的观测值,为自回归的阶数。(2) 滑动平均模型另一种常见的时间序列模型是滑动平均模型(MA),它可表示为:其中
28、为常数,()为随机扰动项。MA序列与AR序列不同,它是现在与有限范围内过去值的线性组合,所以只影响的m个未来值。(3) 自回归滑动平均模型更一般的时间序列模型是用n阶自回归m阶滑动平均的混合模型来描述,称为AR-MA(n,m)模型。它满足:建立时间序列模型,要进行四方面的选择与判断:一是判断所依据的时间序列资料是否能够满足稳定性要求;二是判断哪一种自回归模型适合,是AR模型,还是MA模型,或是ARMA模型;三是判断模型的阶数;四是对模型的参数进行估计。所谓“平稳”时间序列,是指其统计特性不随时间的变化而发生变化。完全平稳时间序列的定义较为复杂,且实际问题中的时间序列往往不只要能是完全平稳的,因
29、此统计中一般考虑的“平稳”可归结为:对所有的时间点,序列具有同样的均值、方差,而且任何两时间点s,t之间序列的协方差只取时间间隔(t-s),而与这些点在时间轴上的位置无关。相关内容自回归AR模型、移动平均MA模型、自回归移动平均ARMA模型等都是常用的线性动力学模型,非线性模型如神经网络模型等。!ARMA模型: !第五章功率谱估计-第3节【标题】基于高频数据的金融波动率模型【标题注释】基金项目:国家自然科学基金资助项目(70471050)【作 者】李胜歌/张世英【作者简介】李胜歌 张世英 天津大学管理学院,天津 300072【原文出处】统计与决策【原刊地名】武汉【原刊期号】20081【分 类
30、号】F104【分 类 名】统计与精算【复印期号】200802【内容提要】金融高频数据与金融波动率是目前金融领域研究的热点问题。本文对基于金融高频数据的金融波动率估计量“已实现”双幂次变差进行了建模与预测。“已实现”双幕次变差无模型、计算简便,在一定条件下是金融波动率的无偏估计量,并且具有稳健性与有效性。通过用上证综指对“已实现”双幂次变差进行ARFIMA建模,发现中国股票市场的上证综指“已实现”双幂次变差时间序列具有长记忆性。【摘 要 题】数理金融【关 键 词】金融高频数据/“已实现”双幂次变差/ARFIMA模型引言金融高频数据是指以小时、分钟或秒为抽样频率的日内数据。一般而言,金融市场的信息
31、是连续影响资产价格运动过程的,数据频率越低,则损失的信息越多;反之,数据频率越高,获得的市场信息就越多。因此,随着计算机及通信技术的发展,当获取金融高频数据成为可能后,金融高频数据的研究就成为了金融研究领域中的焦点。金融波动率的研究一直以来就是人们研究的热点问题。准确的金融波动率估计、建模等问题具有重要的意义,它是进行资产定价、风险管理、投资组合等研究的基础。在金融高频数据中,Andersen与Bollerslev提出了一种全新的波动率度量方法“已实现”波动(Realized Volatility, RV)来估计金融波动率,随后Bandorff-Nielsen与Neil Shephard提出了
32、又一类似“已实现”波动的波动率估计量“已实现”双幂次变差(Realized Bipower Variation, RBV),该估计量不但具有“已实现”波动的所有优点,如无模型、计算简便、具有无偏性等,而且具有稳健性,同时比“已实现”波动更有效。因此本文选取“已实现”双幂次变差来进行金融波动率建模。一、“已实现”双幂次变差当r=2,s=0或者r=0,s=2时,“已实现”双幂次变差即为“已实现”波动。同时Bandorff-Nielsen与Neil Shephard指出在不存在跳跃与存在有限次跳跃的条件下,当r+s=2并且r(0,2)时,有下式成立:其中,(p)表示伽玛函数。可以看出当r+s=2并且
33、r(0,2)时,“已实现”双幂次变差在M条件下的概率极限为积分波动(Integrated Volatility,IV),并且对偶尔出现的跳跃具有稳健性。在一定条件下,“已实现”双幂次变差是比“已实现”波动更有效的波动率估计量,并且当r=s=1时的“已实现”双幂次变差的有效性比r、s取其它值时的“已实现”双幂次变差以及“已实现”波动都更有效8。因此,“已实现”双幂次变差是比较理想的金融波动估计量。二、“已实现”双幂次变差建模(一)ARFIMA模型“已实现”波动估计量具有显著的长记忆性,即分整(Fractionally Integrated)的性质,通常长记忆性可以用分整自回归移动平均模型(Aut
34、oregressive Fractionally Integrated Moving Average Model, ARFIMA)来进行刻画9。“已实现”双幂次变差类似于“已实现”波动估计量,因此也可以考虑对其进行ARFIMA建模,通过分维数d的估计值就可以得知“已实现”双幂次变差时间序列是否具有长记忆性。分整自回归移动平均模型ARFIMA(p,d,q)用p+q个参数描述过程的短记忆特征,以参数d反映过程的长记忆特征。因此ARFIMA(p,d,q)模型综合考虑了过程的长记忆与短记忆过程,既优于单纯描述短记忆过程的自回归移动平均(Autoregressive Moving Average)ARM
35、A(p,q)模型。又优于单独描述长记忆过程的分整差分噪声(Fractional Differenced Noise,FDN)模型。当ARFIMA(p,d,q)模型中的参数p=q=0时,即为FDN模型,而当参数d=0时,则为ARMA模型。(二)分维数d的估计ARFIMA模型中分维数d可以用聚合方基法来进行估计10。将时间序列,t=1,2,T分成样本容量为m的T/m个子样本,在每个子样本内求均值,对于固定的m值,可以得到一个聚合序列:其中。利用最小二乘法可以得到H的估计值。H为Hurst值数,它是描述分数布朗运动的重要参数,它与ARFIMA模型中的分维数d有如下的确定关系:H=d+0.5。因此,借
36、助于估计H的方法即可以估计出分维数d。三、实证研究本文实证研究采用的高频数据为2002.1.42005.12.30上证综指的1分钟间隔时段的收盘价,这期间共有963个交易日,共有241963=232083个数据。对r=s=1时的“已实现”双幂次变差建立ARFIMA(p,d,q)模型:从以上结果可以获知中国上证综指的“已实现”双幂次变差时间序列为长记忆时间序列,并且具有分维数特性,扰动项对波动序列的影响将会持续若干个时期才会消退。这一特性由分整自回归移动平均模型ARFIMA(p,d,q)得到了很好的刻画。四、结束语金融高频数据比低频数据包含了更多的市场信息,因此基于金融高频时间序列的波动率估计也
37、就比基于低频时间序列的波动率估计要准确,而且金融高频领域采用“已实现”波动作为金融波动率的度量方法,避免了低频领域中复杂的参数估计。本文选用“已实现”双幂次变差这一具有无偏性、稳健性与有效性等良好统计性质的波动率估计量进行建模,通过ARFIMA模型对“已实现”双幂次变差时间序列的长记忆性进行了很好的刻画。通过“已实现”双幂次变差的ARFIMA建模,发现中国上证综指的“已实现”双幂次变差的金融波动时间序列具有长记忆性,扰动项对波动率的冲击会维持若干个时期才会逐渐消退。对“已实现”双幂次变差进行ARFIMA建模后,还可以实现对金融波动率的准确预测,这对金融应用领域的研究具有重要意义。【责任编辑】邓
38、军AR谱估计 1.分清AR谱估计与线性预测的关系 AR(P)过程是指x(n)由v(n)经过激励一个P阶AR模型产生;白化过程是AR的逆过程;线性预测过程e(n)=x(n)-x(n),其中x(n)是估计值,e(n)为估计误差,x(n)、v(n)为平稳随机过程。 根据最小均方正交性原理为使得p=Ee(n)2有最小值,可得线性预测(由过去的p个样本预测x(n))的Wiener-Hopf方程,由于系数矩阵是Toeplitz方阵,正定,方程有惟一解对应Pmin。通过自相关与Z变换的定义AR模型(已知x的N个样本)可以推导得到Yule-Walker方程。这两方程其实是相对应的,AR模型参数ak相当于预测x
39、(n)时的线性预测系数,白噪声功率相当于线性预测的最小均方误差。由此得到两种模型实质上转换成方程的求解了。而预测误差滤波器实质上是横向结构FIR滤波器,AR模型谱估计法通常又称为线性预测AR模型法。 2.各种算法比较 直接用矩阵求逆解Yule-Walker方程运算量较大,Levinson-Durbin递推算法(autocorrelation求解法)使得方程的计算量简化了将近一倍。但是预测阶数接近样本长度时,即使加窗也会产生较大误差引起谱线分裂与谱线偏离,从而70年代初由日本学者板仓提出了格型预测(前向预测与后向预测)误差滤波器,因而由此引入了目前广泛应用的Burg算法。由于双向预测的能量相同并等于预测的最小均方误差,Burg算法即是求解一组反射系数使得它们的能量之与最小,再求解模型参数,当在一维即实数情况下等价于最大熵谱估计。但是Burg算法保留了Levinson-Durbin关系式的约束,因此又由Clayton、Ulrych与Nuttall提出了去除这种约束的LS(改进的协方差)算法。从算法复杂程度上,自相关法Burg算法LS算法。 3.AR模型的讨论 实际应用当中,仍有不足之处,AR估计谱与SNR有密切关系,当SNR较大时AR功率谱估计不如传统谱估计;当分析含有噪声的余弦信号时,AR并没有很大的优势;AR谱估计时借此P不容易确定。
限制150内