非线性模型理论及其应用研究.doc
Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-date非线性模型理论及其应用研究非线性模型理论及其应用研究 第一组计量经济学理论与方法 字数 10000非线性模型理论及其应用研究天津财经大学 马薇 袁铭摘要本文对长记忆模型(ARFIMA)及其估计方法,平滑转移自回归模型(STAR)的一般形式与拓展形式,经济过程中的非线性检验以及模型选择检验进行简要介绍和初步研究,并在此基础上引入了分整平滑转移自回归模型(FI-STAR)。在模型应用方面,本文使用FI-STAR模型,结合使用GARCH模型修正模型残差,给出了研究微观金融市场“杠杆效应”和股指联动性的分析框架,也对使用STAR族模型研究微观市场数据进行了初步尝试。关键词:ARFIMA、STAR、LSTAR、ESTARAbstractThis paper emphasis on the ARFIMA model and its estimation as well as provide a brief sketch on the basic form and some extensions of smooth transition autoregressive model. Then, we review the nonlinear test and model specification test of a given economic process and introduce the fractional integrated STAR model. Finally, for the model appliance, we subtly combine the FI-STAR model with GARCH model as an adjustment of the residuals to provide a framework of the research on the “leverage effect” and interactions between different stock market. These preliminary explorations are still as some attempts of using STAR family model to analysis the micro economic and market processes.Key word: ARFIMA、STAR、LSTAR、ESTAR作者简介姓名 马薇 性别 女 出生日期 1958.12.21 学位:博士学位 职称 教授(博士生导师) 天津财经大学姓名 袁铭 性别 男 出生日期 1982 05 12 天津财经大学博士研究生 研究方向 计量经济学引言现实中,自然、社会经济现象各因素之间一般存在非线性的复杂关系。长期以来,因受自身能力约束,人们难以有效识别与分析。在问题研究中,往往采用牛顿还原论的思维模式,力图将其转化或逼近成线性关系处理。作为数学、理论统计学的一个研究方向,目前非线性数据的线性化工作取得了重要进展,建立了较完备理论方法体系,成功应用于自然科学领域。人们关注的热点已转向社会经济领域中的应用。由于不可能针对每一组非线性数据设计单独的分解方法,所以通过非线性模型分类,针对类型设计出相应的线性转换或逼近方法成为此项研究的主流。而非线性模型族的识别则成为基础性的工作。对于非线性经济数据的线性转化而言,合理性判断应是其能否较充分反映原有的经济关系。一、ARFIMA模型及其估计长期记忆及分整的概念是由Granger和Joyeux(1980)1提出的。他们认为,对于许多时间序列来说,差分序列的谱密度函数表现出过度差分的现象;同时,原始序列也表现出长期相关性,这与稳定ARMA模型相悖。因此,Granger和Joyeux引入分数差分算子将原始序列转换为平稳的ARMA序列过程。一般形式的线性ARFIMA(p,d,q)模型具有如下形式: (1.1)其中和分别为p阶和q阶滞后算子多项式,L为滞后算子,为了满足时间序列的平稳性要求,需要约束算子多项式的特征根都在单位圆外,分数阶差分算子通常还可以写作: (1.2)ARFIMA模型的检验与估计主要Geweke,Porter和Hudak(1983)2提出的半参数谱分析方法(GPH)。该方法的核心思想是分数阶差分参数d等于时序谱密度函数在处的斜率, 对于d的估计还有研究人员给出了基于最大似然函数的参数化估计方法,例如Sowell(1992)提出的精确最大似然估计法,还有Fox和Taqqu(1983)给出的频域近似最大似然估计法。这两种方法都能够同时估计模型的短记忆和长记忆参数,但计算起来较为复杂,并且依赖对ARFIMA中高频部分的正确设定,也就是说差分参数d的估计结果对ARMA中滞后阶数p,q的选择较为敏感。总之,在长记忆参数d的估计问题上,参数方法比半参数方法的效率高,但是计算量庞大,并且受限于模型的错误识别;相对地,半参数方法的计算量较小,对模型的错误识别具有稳健型,但效率较低。因此,可以考虑使用贝叶斯思想将两类方法结合起来,例如可以使用半参数估计方法,如GPH方法得当参数d的初始估计并构造d和残差的先验分布,然后在此基础上,使用近似极大似然估计方法(Baron,1995)得当d的贝叶斯估计,从而使长记忆参数d的估计更加准确、稳健。二、 平滑转移自回归模型及其非线性检验平滑转移自回归模型(STAR)是Granger和Teräsvirta(1993)3提出的,作为机制转换类模型的一种,STAR模型可以使在两个极端机制之间的变化成为平滑或逐渐的变化。下面就STAR模型的一般形式、拓展形式,STAR模型的检验展开讨论。1.STAR模型的一般形式一般来说,两机制的STAR(p)模型可以写作: (2.1)函数用来协调经济过程在两种机制(或)之间的转换,并且这种转换是平滑的。是转移变量,可以是(1)滞后内生解释变量();(2)外生解释变量();(3)滞后内生变量的线性或非线性函数();(4)线性时间趋势,即使STAR模型具有时变的特征。对于函数形式的选择一般有两种:logistic形式的(LSTAR)或指数形式(ESTAR)的。一阶Logistic形式的函数可以写作: (2.2)其中,参数c是两个机制转换的门限值,的值随着转移变量值的递增从0单调递增至1,并有;参数决定了logistic函数值变化的平滑程度,即从一种机制向另一种机制转变的平滑程度。如果非常大,则两种机制之间的转换几乎是瞬间实现的。更一般的,可以将一阶Logistic形式的转换函数拓展为n阶的Logistic函数,用来捕捉经济过程中两种机制的多重转换关系,即: (2.3)指数型STAR(ESTAR)的转换函数可以写作: (2.4)ESTAR 的转换函数关于是对称的,并且无论趋近于负无穷或者正无穷都有;若转换速度参数或,都将退化为常数(0或1)使得ESTAR模型退化为线性模型。在实证研究中,LSTAR模型对从一种机制转换至另一种机制时,呈现规律的平滑转移过程的时间序列具有较强的解释能力,因而适合分析经济过程非对称机制调整的情况;反之,ESTAR模型则更适于描述具有对称机制转换的经济过程。2.STAR模型的拓展形式虽然两机制STAR模型能够满足经济研究大部分应用,但也可以将更多机制加入STAR模型中,从而得到多重机制平滑转移自回归模型简称MRSTAR。典型的三机制STAR的形式如下: (2.5)如果假设,则该模型的自回归参数随着的增加平滑地从通过变化到。更一般的多重机制STAR模型可以写作: (2.6)关于多重机制STAR模型的构造问题一般采用“封装”的思想,例如构造一个四重机制STAR模型,可以通过将两个不同的双机制模型封装来得到,即:(2.7)在(1.11)式中若假定和是内生解释变量的线性组合(),并且施加约束:,则可以得到MRSTAR模型衍生模型,即变系数平滑转移模型,该模型实际上是人工神经网络模型(ANN)的一个特例。更多关于MRSTAR模型的讨论详见Van Dijk与Franses(1999)4。同样在上式中若令,则得到时变STAR模型(TVSTAR)5,用来解决STAR模型中参数估计不一致的问题,典型的TVSTAR模型可以写作: (2.8)其中,与此同时,可以将一元STAR模型拓展为多元的情形,即向量STAR模型。令是一个时间序列向量,则k维二机制向量STAR模型可以写作: (2.9)其中,是向量;是矩阵;是k维向量白噪声过程。基于向量STAR模型的研究包括STAR-ECM模型(Granger和Swanson,1996)6(将非线性或者非对称误差修正机制引入)以及共同非线性(向量时间序列的非线性是由同一个非线性部分产生的)的识别与检验。3.STAR模型的检验STAR模型的检验主要涉及两个方面:(1)非线性检验,即检验原始时间序列是否呈现非线性特征;(2)模型选择检验,即如果确定建立非线性模型,检验选择的转换变量和过渡函数是否合适;(3)模型设定检验,即检验估计的模型是否存在残差序列相关、残余非线性问题,以及参数估计是否稳定。本文的研究重点主要是STAR模型的非线性检验和模型选择检验。非线性检验的核心思想是Luukkonen、Saikkonen和(1988)7提出的,即将转换函数用适当的泰勒级数展开式近似值替代,这样就避免了不能直接对线性与非线性假设进行检验的问题,并且在线性原假设成立的条件下,LM统计量渐进服从分布。该方法有两个优点:(1)不需要估计备择假设下的模型;(2)可以运用蒙特卡洛模拟方法,根据渐进分布理论得到检验临界值。表1是针对LSTAR和ESTAR非线性检验的辅助回归、检验原假设,及在线性原假设成立的情况下统计量的渐进分布。其中,。统计量的提出是为了避免当不同机制之间的差别仅体现在截距上统计量失效的问题;统计量的提出是因为指数形式的转换函数存在两个拐点,因而用一阶泰勒级数展开式作为转换函数的近似值不足以概括出模型的特征。尽管如此,在检验势上,没有足够的证据表明统计量比统计量要强。下面以统计量为例介绍STAR模型的非线性检验过程。(1)在线性原假设下,估计模型,计算其残差平方和;(2)估计统计量的辅助回归式 ,计算其残差平方和;(3)计算统计量的值: (2.10)如果研究的经济过程样本容量较小,则应该使用F统计量来计算LM检验的临界值8,即: (2.11)基于同样的思想和辅助回归式,还可以进行模型选择检验,即选择LSTAR模型还是ESTAR模型作为转换函数能够更好地描述经济过程的特征。模型选择检验使用的三个原假设如下:; (2.12)检验步骤为:分别在三个原假设以及非约束的条件下估计辅助回归式得到残差平方和SSR01、SSR02、SSR03、SSRUR;根据表1及式(1.14)和(1.15)构造LM统计量,并根据临界值判断是否接受原假设;若拒绝H01,则适用LSTAR模型来拟合数据;若接受H01但拒绝H02,则适用ESTAR模型来拟合数据,若接受H01和H02,但却拒绝H03,则适用LSTAR模型来拟和数据;若同时接受H01、 H02、 H03,则又回到了非线性检验的原假设,此时应该使用线性模型来拟合数据。在实证研究中,也可以同时建立LSTAR模型和ESTAR模型,然后根据模型的预测效果进行选择。总之,如何选择STAR 模型的转换函数,或者寻找特征更为贴近真实经济过程的函数作为指数模型或者logistic模型的替代仍然是一个需要进一步深入研究的课题。4.STAR模型在经济学实证分析中的应用目前,基于STAR模型的实证分析主要集中在宏观经济数据方面,例如:Sarantis(1999)9使用STAR模型研究1980年至1990年十大主要工业国家的月度实际汇率。实证结果显示,除了荷兰与瑞士以外,其他国家的实际汇率序列均有明显的非线性关系,他还根据数据特征选择不同的非线性模型(ESTAR和LSTAR)来拟合数据,并且发现其中三国实际汇率序列使用LSTAR模型拟合较为适合,而其他五国则应将模型设定为ESTAR。估计得到的模型都通过了诊断检验,能够对实际汇率提供合理的解释。David G.(2003)10分别基于线性模型、LSTAR模型和ESTAR模型,使用1975年1月至1995年4月的季度数据,研究英国股指与宏观经济变量(失业率、工业生产指数、消费物价指数、广义货币供给余额)之间的相关性,并使用1996年1月至2001年4月的数据作为样本外预测。实证结果表明,ESTAR模型的样本内与样本外的预测效果均优于LSTAR模型和线性模型。此外,许多学者也使用拓展形式的STAR模型来描述和解释经济现象,例如:Rothman,van Dijk和Franses (1999)11使用向量STAR模型研究货币供给与GDP之间的关系; van Dijk和Franses (1999)使用多重机制STAR模型对经济周期加以描述;van Dijk和Franses(2000)12则使用基于STAR的非线性误差修正模型研究荷兰利率的变动情况。三、FI-STAR模型及其非线性检验下面讨论非线性模型与长记忆模型之间的关系。Diebold和Inoue(2001)13指出长记忆模型和机制转换模型从本质上是紧密相连的,即机制转换模型可以表现出与长记忆模型相似的随机特征,两种模型都可以对同一经济过程做出恰当地刻画。因此,为了能够同时描述经济过程中非线性和长记忆问题,需要建立分整平滑转移自回归模型(FI-STAR),这里仅对FI-STAR模型的基本形式和非线性检验进行简要介绍。一般来说,FI-STAR模型的形式如(3.1):(3.1)由于分数阶差分参数d的存在,使得其非线性检验和LM统计量的构造变得更加复杂。针对该问题,van Dijk、Franses和Paap(2002)14提出了改进的LM统计量,本文以ESTAR模型为例对其基本思想和检验方法进行简要介绍。首先将指数转换函数按照一阶泰勒级数展开,构造用于检验的辅助回归:(3.2)检验的线性原假设为。在线性原假设成立的条件下,原时序服从长记忆ARFIMA(p,d,0)过程,第t个观测值的条件似然函数为: (3.3)其中,是在线性原假设(即原始数据是ARFIMA(p,d,0)过程)成立的条件下,估计参数得到的残差序列。这里隐含一个假设,即假定残差是正态的,并且具有常方差性。如果放宽常方差假设,则需要将条件似然函数中的替换成。构造LM统计量的核心思想是将原假设条件看成一个约束条件,通过对有约束的极大似然函数的一阶偏导数进行检验,对参数假设做出判断。由于FI-ARFIMA模型多了长记忆参数d,因此需要对条件似然函数关于d求偏导,得到: (3.4)并且有,(3.5)即在线性原假设成立的条件下有: (3.6)其中,是针对原始序列建立ARFIMA(p,d,0)模型得到的残差序列。在此基础上,得到FI-STAR非线性检验的步骤如下:(1)在线性原假设下估计ARFIMA(p,d,0)模型,得到残差序列和分整参数估计量,并且计算其残差平方和记为;(2)建立形如(1.22)的辅助回归,并且计算其残差平方和为: (3.7)(3)计算LM统计量; (3.8)或: (3.9)四、FI-STAR模型在金融时序分析中的应用本文在第二节中已经指出,目前基于STAR模型的实证分析主要集中在宏观经济数据方面,而对微观市场数据涉及较少。与此同时,最近20年以来,金融时间序列中存在的非线性与长记忆性受到学者的广泛关注,对金融时序进行建模与预测也成为计量经济学和金融学研究的热点。以金融资产的波动率为例,其序列具有如下特征:1)波动率存在聚类性,也就是波动率可能在一些时间段上较高,而在另一些时间段上较低;(2)波动率以连续方式变化,波动率的跳跃现象是少见的;(3)波动率是平稳的,不会发散到无穷,而是在一定范围内随时间连续变化;(4)波动率对利好消息和利空消息的反应是不同的,即存在杠杆效应。这些特征都是波动率序列存在长记忆性与非线性的典型特征。因此,本小节在FI-STAR模型的基础上,给出分析“杠杆效应”和股指联动性的基本框架,对使用STAR模型分析微观市场数据进行初步探索。1.使用FI-STAR模型刻画波动率“杠杆效应”对于金融资产波动率时序中存在的“杠杆效应”,一般的处理方法是建立Nelson(1991)15提出的EGARCH模型。EGARCH(1,1)的条件方差方程如下: (4.1)其中,为条件方差项,为随机干扰项。在估计参数后,通过观察参数的数值及其显著性水平来判断是否存在杠杆效应。考虑到波动率序列中普遍存在的长记忆性,Bollersev 和Mikkelsen(1996)16提出了FIEGARCH模型。FIEGARCH(1,d,1)的条件方差方程如下: (4.2)虽然FIEGARCH模型有较好的应用前景,但也存在一定问题,其中较为典型的就是得到FIEGARCH参数估计量的渐进值是非常困难的。本文介绍的FI-STAR模型为刻画波动率序列杠杆效应提供了一种新思路,即将指数或者对数形式的转移函数引入ARCH/GARCH模型的条件方差方程中。以ARCH(1)模型为例,条件方差方程可以写作: (4.3)若,且有,则表明波动率序列存在杠杆效应。2.基于FI-STAR模型的股指联动性分析股指联动性一直以来是人们的研究热点问题,近两年随着中国金融体制改革的深化,股指联动性特别是中国股市与世界及周边股市指数的联动性研究也持续升温。研究这一问题的传统方法是基于协整理论的,即通过考察两个或多个股指之间是否存在稳定的线性组合。但该方法存在较为明显的缺陷:(1)它假定股指之间的相互影响是线性的;(2)没有考虑股指联动性随时间发生变化的情况,即所谓的协结构突变问题;(3)没有考虑条件异方差问题。解决该问题的另一种方法是Engle 和Bollerslev (1986, 1993)17提出的基于向量GARCH模型的波动持续(volatility persistence)和协同持续(common Persistence)概念,即向量GARCH过程各分量的波动之间存在一种长期的线性均衡关系,该方法较全面地考虑了股指波动性的特征,但也存在一定局限性:向量GARCH模型形式复杂,参数多,估计困难,而简化的向量GARCH模型(对角向量GARCH、常相关向量GARCH模型)则存在约束过严或者经济意义不明确的问题。FI-STAR模型可以有效地解决这一问题。例如,若研究恒生指数对上证指数的影响,可以建立如下的回归: (4.4)其中,是上证指数收益率序列,为恒生指数收益率序列,、d、为待估参数。至于转移变量滞后期数的选择,可以分别估计不同滞后期数下的模型,根据模型的预测效果,即h期预测均方差误差(MSE)进行选择。考虑到股指收益率序列存在明显的异方差性,可以在上式回归中添加GARCH修正项,即: (4.5)五、结语本文对ARFIMA模型以及STAR模型、STAR的拓展形式及其非线性检验进行了介绍,并在此基础上将二者结合起来,提出了FI-STAR模型,对经济过程中长记忆性与非线性联合检验进行了初步探索。与此同时,本文也提出了几个值得深入研究的问题:首先是基于贝叶斯思想的长记忆参数估计问题,也即如何将参数化估计方法与非参数估计方法有机结合起来;其次是STAR 模型转换函数的选择问题,即能否构造更为贴近真实经济过程的函数作为指数模型或者logistic模型的替代;最后是FI-STAR模型的非线性检验问题,即能否构造恰当的统计量使得FI-STAR模型的非线性检验较少地依赖模型设定,同时具有较高的检验功效。参考文献1 Granger C.W.J. and Joyeux F. (1980), An Introduction to Long Memory Time Series Models and Fractional Differencing. Journal of Time Series Analysis, 1980, 1: 15 -29.2 Geweke J.and S.Porter-Hudak. The Estimation and Application of Long Memory Time Series Models J, Journal of Time Series Analysis, 1983,4, 221-237.3 Granger, C.W.J. and T. Terasvirta (1993), Modelling Nonlinear Economic Relationships, Oxford:Oxford University Press.4 van Dijk, D. and P.H. Franses (1999), Modeling multiple regimes in the business cycle, Macroeconomic Dynamics 3, 311-340.5 Lundbergh, S., T. Terasvirta and D. van Dijk (2000), Time-varying smooth transition autoregressive models, Working Paper Series in Economics and Finance No. 376, Stockholm School ofEconomics.6 Granger, C.W.J. and N.R. Swanson (1996), Future developments in the study of cointegrated variables, Oxford Bulletin of Economics and Statistics 58, 537-5537 Luukkonen, R., P. Saikkonen and T. Terasvirta (1988a), Testing linearity against smooth transition autoregressive models, Biometrika 75, 491-499.8 van Dijk, D. and T. Terasvirtaz (2000), Smooth Transition Autoregressive Models -A Survey of Recent Developments9 Sarantis N. (1999), Modeling non-linearities in real effective exchange rates, Journal of International Money and Finance, Vol.18, 28-4510 David G. (2003), Non-linear Predictability of UK Stock Market Returns, Oxford Bulletin of Economics and Statistic, Vol.65, 557-57311 Rothman, P., D. van Dijk and P.H. Franses (1999), A multivariate STAR analysis of the relationship between money and output, Econometric Institute Report 9945/A, Erasmus University Rotterdam.12 van Dijk, D. and P.H. Franses (2000), Nonlinear error-correction models for interest rates in the Netherlands, in W. A. Barnett, D. F. Hendry, S. Hylleberg, T. Terasvirta, D. Tjstheim and A. H. Wurtz (eds.), Nonlinear Econometric Modeling in Time Series Analysis, Cambridge: Cambridge University Press.13 Diebold, F.X., and A. Inoue (2001), “Long memory and regime switching,” Journal of Econometrics, 105, 131-159.14 van Dijk, D., Franses, P.H., and R. Paap (2002), A nonlinear long memory model for US unemployment, Journal of Econometrics, 102, 135-165.15 Nelson, D. B. (1991). Conditional heteroskedasticity in asset returns: A new approach, Econometrica 59: 347-370. 16 Bollerslev, T., and Mikkelsen, H.O., 1996. Modeling and Pricing Long Memory in Stock Market Volatility. Journal of Econometrics 73, 151-184.17 Engle R F, Bollerslev T. Modeling the persistence of conditional variances. Econometric Reviews, 1986, 5(1): 1-50.18 Bollerslev T, Engle R F. Common persistence in conditional variances J . Econometrica, 1993, 61(1): 167-186.-