时间序列分析——ARMA模型实验(14页).doc
-基于ARMA模型的社会融资规模增长分析ARMA模型实验第一部分 实验分析目的及方法一般说来,若时间序列满足平稳随机过程的性质,则可用经典的ARMA模型进行建模和预则。但是, 由于金融时间序列随机波动较大,很少满足ARMA模型的适用条件,无法直接采用该模型进行处理。通过对数化及差分处理后,将原本非平稳的序列处理为近似平稳的序列,可以采用ARMA模型进行建模和分析。第二部分 实验数据2.1数据来源数据来源于中经网统计数据库。具体数据见附录表5.1 。2.2所选数据变量社会融资规模指一定时期内(每月、每季或每年)实体经济从金融体系获得的全部资金总额,为一增量概念,即期末余额减去期初余额的差额,或当期发行或发生额扣除当期兑付或偿还额的差额。社会融资规模作为重要的宏观监测指标,由实体经济需求所决定,反映金融体系对实体经济的资金量支持。本实验拟选取2005年11月到2014年9月我国以月为单位的社会融资规模的数据来构建ARMA模型,并利用该模型进行分析预测。第三部分 ARMA模型构建3.1判断序列的平稳性首先绘制出M的折线图,结果如下图:图3.1 社会融资规模M曲线图从图中可以看出,社会融资规模M序列具有一定的趋势性,由此可以初步判断该序列是非平稳的。此外,m在每年同时期出现相同的变动趋势,表明m还存在季节特征。下面对m的平稳性和季节性·进行进一步检验。为了减少m的变动趋势以及异方差性,先对m进行对数化处理,记为lm,其时序图如下:图3.2 lm曲线图 对数化后的趋势性减弱,但仍存在一定的趋势性,下面观察lm的自相关图表3.1 lm的自相关图上表可以看出,该lm序列的PACF只在滞后一期、二期和三期是显著的,ACF随着滞后结束的增加慢慢衰减至0,由此可以看出该序列表现出一定的平稳性。进一步进行单位根检验,由于存在较弱的趋势性且均值不为零,选择存在趋势项的形式,并根据AIC自动选择之后结束,单位根检验结果如下:表3.2 单位根输出结果Null Hypothesis: LM has a unit rootExogenous: Constant, Linear TrendLag Length: 0 (Automatic - based on SIC, maxlag=12)t-Statistic Prob.*Augmented Dickey-Fuller test statistic-8.674646 0.0000Test critical values:1% level-4.0469255% level-3.45276410% level-3.151911*MacKinnon (1996) one-sided p-values.单位根统计量ADF=-8.674646小于临界值,且P为0.0000,因此该序列不存在单位根,即该序列是平稳序列。由于趋势性会掩盖季节性,从lm图中可以看出,该序列有一定的季节性,为了分析季节性,对lm进行差分处理,进一步观察季节性:图3.3 dlm曲线图观察dlm 的自相关表:表3.3 dlm的自相关图Date: 11/02/14 Time: 22:35Sample: 2005M11 2014M09Included observations: 106AutocorrelationPartial CorrelationAC PAC Q-Stat Prob *|. | *|. |1-0.566-0.56634.9340.000 .|* | *|. |20.113-0.30536.3410.000 .|. | *|. |30.032-0.09336.4550.000 *|. | *|. |4-0.084-0.11437.2440.000 .|* | .|. |50.1050.01538.4940.000 *|. | *|. |6-0.182-0.18242.2960.000 .|* | *|. |70.105-0.15643.5630.000 .|. | *|. |8-0.058-0.17143.9540.000 .|. | *|. |9-0.019-0.19643.9960.000 .|* | .|. |100.110-0.04545.4290.000 *|. | *|. |11-0.242-0.32952.5010.000 .|* | .|. |120.3630.02368.5160.000 *|. | .|. |13-0.2020.03273.5340.000 .|* | .|* |140.1010.12574.8150.000 .|. | .|* |150.0040.14174.8170.000 *|. | *|. |16-0.161-0.08978.1100.000 .|* | .|. |170.2190.03784.2520.000 *|. | .|. |18-0.221-0.03690.6230.000 .|* | .|. |190.089-0.04691.6620.000 *|. | *|. |20-0.080-0.15892.5160.000 .|. | .|. |210.067-0.03993.1150.000 .|. | .|. |220.0680.05693.7490.000 *|. | *|. |23-0.231-0.130101.080.000 .|* | .|* |240.3590.116119.040.000 *|. | .|* |25-0.1890.123124.090.000 .|. | .|. |260.0320.034124.230.000 .|. | .|. |270.0590.037124.740.000 *|. | .|. |28-0.1260.044127.080.000 .|* | *|. |290.087-0.079128.210.000 .|. | .|* |30-0.0500.092128.580.000 .|. | .|. |31-0.037-0.019128.790.000 .|. | *|. |32-0.035-0.113128.970.000 .|. | .|. |330.041-0.056129.240.000 .|* | .|. |340.078-0.027130.210.000 *|. | *|. |35-0.215-0.197137.640.000 .|* | .|* |360.3800.130161.260.000由dlm的自相关图可知,dlm在滞后期为12、24、36等差的自相关系数均显著异于零。因此该序列为以12为周期呈现季节性,而且季节自相关系数并没有衰减至零,因此为了考虑这种季节性,进行季节性差分,得新变量sdlm:观察sdlm的自相关图:表3.4 sdlm的自相关图Date: 11/02/14 Time: 22:40Sample: 2005M11 2014M09Included observations: 94AutocorrelationPartial CorrelationAC PAC Q-Stat Prob *|. | *|. |1-0.505-0.50524.7670.000 . |. | *|. |2-0.057-0.41925.0820.000 . |. | *|. |30.073-0.29225.6090.000 . |* | . |. |40.1600.06728.1690.000 *|. | .*|. |5-0.264-0.12535.2520.000 . |* | .*|. |60.098-0.11036.2440.000 . |* | . |. |70.0980.01937.2430.000 . |. | . |* |8-0.0410.08237.4190.000 .*|. | . |. |9-0.132-0.03839.2750.000 . |* | .*|. |100.076-0.13939.9020.000 . |* | . |* |110.2270.24745.4850.000 *|. | *|. |12-0.459-0.25968.6470.000 . |* | *|. |130.193-0.25172.7770.000 . |* | .*|. |140.132-0.10174.7530.000 .*|. | .*|. |15-0.142-0.18977.0560.000 . |. | . |. |16-0.053-0.05677.3780.000 . |* | . |* |170.2330.09183.7510.000 *|. | .*|. |18-0.234-0.17990.2580.000 . |* | . |. |190.1020.05491.5050.000 . |. | . |. |20-0.052-0.03591.8410.000 . |* | . |. |210.123-0.00993.7140.000 . |. | . |* |22-0.0590.12094.1500.000 . |. | . |* |23-0.0110.21594.1660.000 . |. | .*|. |24-0.032-0.17094.3010.000 . |* | .*|. |250.088-0.13795.3030.000 .*|. | . |. |26-0.105-0.03496.7600.000 . |* | .*|. |270.077-0.11697.5620.000 . |. | .*|. |28-0.054-0.17897.9670.000 . |. | . |. |290.0100.03297.9820.000 . |* | . |. |300.1020.03999.4570.000 .*|. | .*|. |31-0.179-0.099104.060.000 . |. | . |. |320.071-0.058104.790.000 . |. | .*|. |330.031-0.066104.930.000 .*|. | .*|. |34-0.089-0.144106.130.000 . |. | . |* |350.0360.082106.320.000 . |* | .*|. |360.105-0.102108.050.000Sdlm在滞后期24之后的季节ACF和PACF已衰减至零,下面对sdlm建立SARMA模型。3.2模型参数识别由表3.4 sdlm的自相关图的自相关图可知,偏自相关系数在3阶后都落在两倍标准差的范围以内,即不显著异于零。自相关系数在1阶和12阶显著异于零。因此SARMA(p,q)模型中选择p、q均不超过3。此外,由于高阶移动平均模型估计较为困难而且自回归模型可以表示无穷阶的移动平均过程,因此Q尽可能取小。拟选择SARMA(1,0)(1,0)12、SARMA(1,0)(1,1)12、SARMA(1,1)(1,0)12、SARMA(1,1)(1,1)12、SARMA(2,0)(1,0)12、SARMA(2,0)(1,1)12、SARMA(3,0)(1,0)12、SARMA(3,0)(1,1)12八个模型来拟合sdlnm。3.3模型参数估计以SARMA(1,0)(1,0)12模型为例,分析该模型的估计及残差的检验,其他模型类似。回归结果为:表3.5 SARMA(1,0)(1,0)12模型估计结果Dependent Variable: SDLMMethod: Least SquaresDate: 11/02/14 Time: 22:50Sample (adjusted): 2008M01 2014M09Included observations: 81 after adjustmentsConvergence achieved after 6 iterationsVariableCoefficientStd. Errort-StatisticProb. C-0.0053050.023352-0.2271650.8209AR(1)-0.4908550.098580-4.9792560.0000SAR(12)-0.5485090.096987-5.6554710.0000R-squared0.448053 Mean dependent var-0.004983Adjusted R-squared0.433901 S.D. dependent var0.644876S.E. of regression0.485202 Akaike info criterion1.427829Sum squared resid18.36280 Schwarz criterion1.516512Log likelihood-54.82707 Hannan-Quinn criter.1.463410F-statistic31.65901 Durbin-Watson stat2.348799Prob(F-statistic)0.000000Inverted AR Roots .92+.25i .92-.25i .67+.67i .67-.67i .25-.92i .25+.92i -.25-.92i-.25+.92i -.49 -.67-.67i -.67-.67i-.92+.25i-.92-.25i由表3.3可知, AR(1)与sar(12))的P值均小于0.05,参数显著,可以通过检验。该模型AIC为1.427829,SC值为1.516512。回归结果的最后一部分表示该模型滞后多项式的反特征根,小于1,因此该模型是平稳的。下面对残差进行检验。观察残差的自相关图:表3.6 SARMA(1,0)(1,0)12模型的残差检验结果由表3.6可知, 由Q统计量可知残差存在自相关性,P值远小于0.05,因此残差不满足白噪声的假设。将八个模型的估计结果进行汇总如下:表3.7 不同SARMA模型的特征汇总表AICSC平稳性可逆性残差是否满足白噪声SARMA(1,0)(1,0)121.4278291.516512是是否SARMA(1,0)(1,1)121.0954341.095434是是否SARMA(1,1)(1,0)121.2061811.206181是是是SARMA(1,1)(1,1)120.8624961.010301是是是SARMA(2,0)(1,0)121.0103011.424354是是否SARMA(2,0)(1,1)121.0002481.149124是是否SARMA(3,0)(1,0)121.2417641.391729是是是SARMA(3,0)(1,1)121.3917290.959325是是是综合来看,根据信息准则,应选择SARMA(1,1)(1,1)12对数据进行拟合是最优的。拟合结果为:表3.8 SARMA(1,1)(1,1)12模型估计结果Dependent Variable: SDLMMethod: Least SquaresDate: 11/02/14 Time: 23:16Sample (adjusted): 2008M01 2014M09Included observations: 81 after adjustmentsConvergence achieved after 13 iterationsMA Backcast: 2006M12 2007M12VariableCoefficientStd. Errort-StatisticProb. C-0.0068210.002943-2.3177820.0232AR(1)0.0186630.1411680.1322030.8952SAR(12)-0.2016230.120638-1.6713130.0988MA(1)-0.8339470.080352-10.378650.0000SMA(12)-0.8603910.041002-20.984270.0000R-squared0.701510 Mean dependent var-0.004983Adjusted R-squared0.685800 S.D. dependent var0.644876S.E. of regression0.361475 Akaike info criterion0.862496Sum squared resid9.930500 Schwarz criterion1.010301Log likelihood-29.93107 Hannan-Quinn criter.0.921797F-statistic44.65381 Durbin-Watson stat2.003373Prob(F-statistic)0.000000Inverted AR Roots .85+.23i .85-.23i .62-.62i .62+.62i .23+.85i .23-.85i .02-.23-.85i-.23+.85i -.62+.62i -.62+.62i-.85-.23i-.85+.23iInverted MA Roots .99 .86+.49i .86-.49i .83 .49-.86i .49+.86i .00-.99i-.00+.99i-.49-.86i -.49+.86i -.86-.49i-.86+.49i -.993.2模型预测在 SARMA(1,1)(1,1)12估计方程下选择动态估计,预测2014年10月至12月的序列值,并将结果保存在sdlnmf中,预测情况如下:图中左边是预测值与置信区间,右边是预测的误差。Theil不等系数中bias proportion表示偏误,即预测均值与真实均值的偏离程度,本例中bias proportion的值为0.000107,预测均值与真实值偏离较小;variance proportion表示方差误,用来反映预测波动与真实波动之间的差异,本例variance proportion为0.649319,则说明预测波动与真实波动的差异较大;covariance proportion表示协方差误,反映残存非系统性预测误差,本例中该值为0.350574,该误差占比越大,预测效果越好。本例中的协方差误要小于方差误,因此预测效果较差。附录具体数据表5.1 社会融资规模M-第 14 页-指标社会融资规模地区全国频度月单位亿元2002-01-4722002-022892002-0331362002-0411512002-0517742002-0626212002-078132002-0815852002-0935072002-107952002-1118052002-1231092003-0133862003-029982003-0340412003-0426222003-0529712003-0658422003-0713442003-0833212003-0940402003-1012182003-1118322003-1224982004-0121142004-024382004-0365572004-0427312004-0524432004-0632292004-075902004-0815012004-0929812004-104832004-1119772004-1235862005-0136202005-028242005-0341892005-0419992005-0519682005-0647232005-076292005-0820972005-0960412005-10-9742005-1123682005-1225242006-0163232006-0217372006-0374722006-0433252006-0537852006-0638432006-0722542006-0833622006-0930772006-108942006-1127882006-1238372007-0169082007-0230832007-0363112007-0461032007-0538242007-0670422007-0731002007-0869612007-0952902007-1036882007-1130732007-1242812008-01108592008-0247312008-0363912008-0470762008-0556782008-0659762008-0748902008-0845752008-0956592008-1012882008-1145172008-1281642009-01139902009-02111312009-03220112009-0454522009-05149592009-06210672009-0773882009-0876502009-09118712009-1059852009-1195012009-1281002010-01205502010-02108772010-03138302010-04149192010-05108052010-06101962010-0772022010-08106462010-09112242010-1086082010-11105542010-12107802011-01175602011-0264682011-03182122011-04136732011-05108542011-06108732011-0753932011-08107412011-0942792011-1079082011-1195812011-12127442012-0197542012-02104312012-03187042012-0496372012-05114322012-06178022012-07105222012-08124752012-09164622012-10129062012-11112252012-12162822013-01254462013-02107052013-03255032013-04176292013-05118712013-06103752013-0781912013-08158412013-09141202013-1086452013-11123102013-12125322014-0126003.942014-029369.772014-0320934.492014-0415259.452014-0514013.272014-0619673.172014-072736.942014-089576.522014-0910522.06存在问题 本次应用ARMA模型分析数据的过程存在不少问题,在整个过程中感觉对模型的理解还不够深入,有一些细节没有理解清楚,具体问题如下:1、 数据的选取在收集数据时是否需要按照相关经济学知识判断该变量是否存在自相关性?在选取数据时只关注了原始数据的时序图,选择了大体呈现随机波动。然而具体进行分析的时候却遇到了很多问题,数据无法通过单位根检验,或者由自相关图可以看出数据不平稳。2、 遇到数据可以通过单位根检验,但是自相关图呈现如下情况:这样的自相关图该如何进行分析?在拟合时,之后q取12模型才能通过。3、 数据通过了自相关图的检验以及单位根的检验,但是在拟合模型的时候找不到合适的模型,即所有的模型的残差都不满足白噪声,这是什么原因?4、 单位根检验过程中,以表3.2为例,表3.2 单位根输出结果Null Hypothesis: LM has a unit rootExogenous: Constant, Linear TrendLag Length: 0 (Automatic - based on SIC, maxlag=12)t-Statistic Prob.*Augmented Dickey-Fuller test statistic-8.674646 0.0000Test critical values:1% level-4.0469255% level-3.45276410% level-3.151911*MacKinnon (1996) one-sided p-values.Lag Length: 0 (Automatic - based on SIC, maxlag=12)这个的意思是否是ADF检验中,p取了0呢?若在此P取0,单位根检验的结果还有效么?5、 关于季节性,做季节性差分的原因? 6、 预测是对历史数据进行的回测,如何操作才能预测下一期的呢?