中国人均GDP的时间序列模型的建立与分析.pdf
笫3 4 卷第6 期m m 舢u 咖w 西e s t 宅慧篡怒:曼。煞慧急蹦咖e 洲。nD e c 2 0 0 8文章编号:1 0 0 3-2 8 4 3(2 0 0 8)0 6-11 6 2-0 6中国人均G D P 的时间序列模型的建立与分析严天艳1 3,吕王勇2 j,朱丽萍3(1 四川大学数学学院,四川成都6 1 0 0 6 5;2 四J l l 师范大学数学学院,四川成都6 1 0 0 6 6;3 攀枝花学院计算机学院,四川攀枝花6 1 7 0 0 0)摘要:人均G D P 是人们了解和把握一个国家或地区宏观经济运行状况的有效工具本文在介绍时间序列模型的基础上,结合1 9 5 2-2 0 0 6 年的中国人均G D P 数据值,应用S P S S 软件对数据进行了分析,建立了中国人均G D P 的时间序列模型文章详细介绍了模型建立的整个过程,并由此模型对中国2 0 0 7-2 0 1 0 年中国人均G D P 的数值进行了预测这对我们从宏观上了解中国经济的发展状况,为国家制定科学合理的经济发展战略具有重要意义关键词:人均G D P;彳删(p,g);A m M A(p,d,g);白噪声序列中图分类号:0 2 1 1 9文献标识码:A人均G D P 是体现一个国家经济实力、发展水平和生活水准的综合指标它不仅考虑了经济总量的大小,而且结合了人口多少的因素,在国际上被广泛用于评价和比较一个国家和地区经济发展水平根据国家统计局提供的数据显示,2 0 0 0 年中国人均G D P 为7 0 7 8 元,按当年的汇率结算为8 5 6 美元【1 1 如果2 0 2 0 年实现翻两番,那么到时候人均G D P 应该达至1 J 3 5 0 0 美元左右世界银行发展指标数据库提供了2 0 0 7 年折算成美元后中国人均G D P 为2 2 8 0 美元到底在过去的七年内中国人均G D P 以比例计增长了多少,能否在2 0 2 0 年实现比2 0 0 0 翻两番的预期目标,需要用一个时间序列的模型来分析预报根据西方国家的经验,不同人均G D P 时期所面临的社会主要问题是不一样的人均G D P 的预报值不仅可以为国家领导人制定经济目标提供依据而且还有利于国家采取正确的方针来应对人民收入水平逐渐升高带来的一系列社会问题改革开放三十年来中国经济保持了每年两位数的增长,在经济高速增长的同时到底人民口袋里的钱增长了多少在未来的几年内可能增长到什么数字,很值得去研究对于预测人均G D P 有很多的方法,如回归预测法、时问序列分解法、趋势外推法、时间序列平滑预测法、自适应过滤法等【2。8 1 相对于这些方法而言,时间序列模型预测法是一种精度相当高的短期预测法,而且是一种从数据本身出发来寻找可以较好描述数据特征的方法本文应用S P S S 统计分析软件对1 9 5 2 年到2 0 0 6 年的中国人均G D P 时间序列数据进行了研究,并根据数据的特点构建了彳兄?=翻时问序列预测模型1时间序列分析方法简介1 1A R M A(p,g)模型1 4 1彳删模型是由A R(p)7 阳M A(q)的有效组合和搭配的结果,它的基本思想是:将预测对象随时问推移而形成的时间序列数据视为一个随机序列i 用一定的数学模型来近似描述这个序列,这个模型一旦被识别后就可以从时间序列数据的过去值及现在值来预测未来值。我们把具有如下结构的模型称为自回归移动平均模型,简记为A R M A(p,q):收稿日期:2 0 0 8 0 9 1 6作者简介:严天艳(1 9 6 9),女,I 囤)J I 大学硕士生,攀枝花学院计算机学院副教授,主要从事概率与数理统计研究万方数据第6 期严天艳等:中国人均G D P 的时间序列模型的建立与分析1 1 6 3f 薯=矽o+l 薯一l+2 t 一2+战一P+毛一目1 E 一。一8 2 s t 一:一一岛E 1,I 矽P 0,O q 0,IE(6 t)=o,V a r(6 t)=仃2 f,E(6 1 6,)=o,S t,lE(x s t r t)=0,V s t 若九=0,该模型称为中心化A R M A(p,g)模型缺损默认条件,中心化A R M A(p,g)模型在平稳的时间序列中它的一般形式可写为:薯=矽l 一l+2 一2+矽磁一p+乞一秒l t 一,一乡2 t 一:一一秒g t 一,A R M A(p,g)模型的_ 般形式表明时问序列数据薯既和滞后序列薯一,(i=1,2,p)有关,也和滞后序列的误差q 一,有关,毋是独立于誓一,和q 一,的白噪声序列在对原始数据平稳化处理后,可以通过分析数据的残差序列,得到A R M A 模型中的P 和g 的值以及模型中其它各个参数的值,其中P 和q 分别为偏自相关函数和自相关函数显著不为零的最高阶数1 2A R I M A(p,d,g)模型求和自回归移动平均(a u t o r e g r e s s i v ei n t e g r a t e dm o v i n ga v e r a g e)模型,简记为A R I M A(p,d,g)模型A R I M A(p,d,g)模型是用于一个国家或地区经济和商业预测中比较先进适用的时间序列模型之一它是一种精度相当高的短期预测方法,而且它不需要事先假定数据存在着一定的结构或模式,而是从数据本身出发来寻找可以较好描述数据的模式,从而可以保证模型与数据的拟合较好它的结构为:lO(B)V 口=O(B)8,E()=0,V a r(s,)=盯占2,E(e r 占。)=0,s,【E x,q=o,V S f式中:V d=(1 一B)d,差分运算;(B)=1 一l B 一九B p,为平稳可逆A R I M A(p,d,q)模型的自回归系数多项式;o(B)=1 一q B 一巳B。,为平稳可逆A R I M A(p,d,g)模型的移动平滑系数多项式;B 为延迟算子,B“X。=x 卜。彳尺,M 彳(P,d,g)模型的实质就是差分运算与A R M A(p,q)模型的组合这一关系意义重大,这说明任何非平稳序列只要通过适当阶数的差分实现差分后平稳,就可以对差分后序列进行A R M A 模型拟合,而其中d 的取值就是差分的阶数1 3A R I M A(p,d,q)模型具体建模步骤1)获得j!I l 察值序列根据相关的数据资料和信息网站得到所要分析的数据2)平稳性检验通过时序图、自相关系数图检验判断序列的平稳性3)数据白噪声检验利用Q L B 统计量检验4)拟合A R M A 模型利用序列样本自相关函数图和偏自相关函数图结合A R M A 模型的截尾性和拖尾性特征初步确定模型的形式,由最小的R e s i d u a lV a r i a n c e 对应的P,q 值拟合模型,并估计参数5)残差序列白噪声检验利用曰统计量检验残差序列是否是白噪声,若是白噪声,说明模型是有效的6)用所得模型进行预测根据预测值了解序列发展的趋势,从而指导我们控制和决策2 具体建立模型的过程万方数据1 1 6 4西南民族大学学报自然科学版第3 4 卷2 1 数据准备根据中国统计信息网得到了1 9 7 8-2 0 0 5 年的中国人均G D P 数据和2 0 0 7 年中国G D P 总额(2 4 6 6 1 9 亿元)以及2 0 0 7 年中国人口数(1 3 2 1 2 9 亿人)在(2 0 0 6 中国统计年鉴中列出了1 9 5 2 1 9 7 7 年和2 0 0 6 年的中国人均G D P 数据即数据来源:中国国家统计局官方网站,2 0 0 6 中国统计年鉴(计量单位:元)2 2 数据的平稳性检查根据1 9 5 2 2 0 0 6 年中国人均G D P 时间序列数据资料,下面绘制中国人均G D P 数据的时间序列图(见图1)从图1 可以看出,近5 5 年来中国人均G D P 呈现出明显的增长趋势,特别是在1 9 9 2 年以后呈现出强劲的增长势头1 9 5 2 1 9 7 7 中国人均G D P 年平均增长速度约为4 1,1 9 7 8-1 9 9 1 中国人均G D P 年平均增长速度为1 2 1,而1 9 9 2 2 0 0 6 中国人均G D P 年平均增长速度为1 3 7,呈加速增长趋势,从1 9 5 2 2 0 0 6 年整个时期来看,人均G D P呈现出指数增长趋势,具有明显的非平稳性非平稳的数据是不能用来建立时间序列模型的,我们需要对数据进行平稳化处理2 3 数据平稳化处理如果用非平稳序列来建立模型,就会出现虚假回归问题,即尽管基本序列不存在任何关系,也会得到回归模型当随机变量不平稳时,统计量的拒绝域远远超过了检验的正常值,由按照一般的检验方法得出的接受假设很可能是错误的因此,要建立模型,随机序列必须是平稳的对于含有指数趋势的时问序列,可以通过对序列取对数来消除指数趋势下面绘制取对数后的序列图(见图2)由图2 知取对数后的数据仍然不平稳具有线性趋势1 9 5 21 9 5 61 蛳l q H 脯8 妁咒1 9 7 6l 鲐l1 51 9 0 91 9 昭1 7 期1 撕1 9 5 坤铺l g 的1 9 酌1 9 阳1 9 7 4l 孵8l 3H 盯l 帕lI Nl 神9a 啪图l1 9 5 2 2 0 0 6 年中国人均G D P 时序图图2 经过自然对数变换后的序列图对于有线性趋势的时间序列我们常常通过差分处理来消除数据的线性趋势相距一期的两个序列值之问的减法运算称为1 阶差分运算表达式为:V x t=t x f-1 依此类推,对P 一1 阶差分后序列再进行一次1 阶差分运算称为P 阶差分表达式为:V P 一=V P-I X,一V p-I X r-1 经过1 阶差分处理后的数据在S P S S 5】中作图如图3 根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在个常数值附近随机波动,而且波动的范围有界的特点由图3 显示经过处理后的数据值始终围绕在0 1 附近随机波动没有明显的趋势或则周期,基本可以视为平稳序列为了稳妥起见,再利用了自相关图进一步辅助识别如图4 所示为了进一步的确定平稳性,我们考察差分后序列的自相关图(图4)自相关图显示随着延迟期数k 的增加平稳序列的自相关系数衰减向o 序列具有较强的短期相关性,所以初步认为l 阶差分后序列平稳并且自相关图具有拖尾性为了更好的确定A R M A 模型的参数再对数据用S P S S 作出了差分后序列的偏自相关图(图5)万方数据第6 期严天艳等:中国人均G D P 的时间序列模型的建,0-4 分析1 1 6 5由图知偏自相关图j f l 咱相关图一样都具有拖尾结构,我们初步估计应该建立A R M A 模型在建立模型前我们还要做白噪声检验,以确定序列具有研究的价值搦4l 嘲I 撇l 瞄1 9 7 01 9 Ml 啪l 啪I o A 71 9 9 1l 螨1 9 9 9 瑚3图3 一阶差分变换后的序列图L 稚c 嘶E f r?l。7 5 一5 2 59,帮矗j 鸭,tB-L j l 珥p r o b;14 7 9 j 3 42拍11 踅3 _ 0 0 513 I1 0 61 3 062 2 61 2 863 3 6J nf3 2 31 拍B1 4 31 H;0 7 8 1 2 3l O。1 1 31 2 ln1 0 4 I 1 20 8 71 墙1 31 2 81 l Tl t0 6 81 拍坫一0 2 1 M1 6 1 3 6“3P l o t 研岫o l 私:t o t a lc :蹦,I#l I“;f I,I _ 。1 辩-1 辑,卜I,I,l jl 抖,I。,1轴11 2 8 8 3l T 3 8 8lT 3 1 8 0 M2 1 t 22 s 1 5 5M 7 8 03 6 1 0 33 6 4 8 53 7 3 H3 8 1 0 93 8 6 d 83 9 8 0 34 0 1 5 I4 0 2 0 94 1 6 6 2 m o c o r t e z t i o r a T W oS t z r d a r dE r r【j l n c o 叩m 出hf i-:c tl 笔-:磁图4 一阶差分变换后的自相关图2 4 白噪声检验如果随机变量 五)满足如下性质:1)任取f T,有E(x。)2“;2)任取加吨枷)书旭t=S,F a r t i a ll b a t o c o r r e I a t i c m l;,L I I _ ID F FO J i,l,P r 一觚一S t-n dL 珥C“hE r r-以一布一5 一2 5 口蔬。i 7 51上4 7 1 3 T20 6 6 1 3 73 2 l I1 3 7哇2 2 4i,7B2 2 01 研6I I II 翦71 舛1 3 7矗-:0 9 l 一1 翦口,0 3 3 t 3 T1 01 3 9:1 3 71 1 一1 2 6I 孔1 2-o O 如1 3 T1 31 4 31 算1 4 一0 7 71 前1 5 一1 7 8 1 3 I 丘一I 凹J 珂P l o tS,曲o l,:T 口t d H:鲥f“-J#I1-l f,I l-,1 i 抖I“,1l。I1料叫r船t o c 靠r l I t i o 撼乳删d a r d r 缸L i i t t C O I p t l t i b l ef 扯l tl:略图5 一阶差分变换后的偏自相关图则称序列 薯)为白噪声序列(、v h i t en o i s e),简记为薯聊V(,仃2)从白噪声序列的定义知白噪声序列彼此之间没有任何的关联,过去的行为对将来的发展没有任何的关系当序列被确定为白噪声序列后,我们没必要再继续研究下去我们常用舛B 统计量来检验序列是否为白噪声序列用s P s s 算出的不同延迟期数的舛B 统计量咖潍鲫哪蛳咖咖咖咖咖啡咖咖咖咖咖万方数据1 1 6 6西南民族大学学报自然科学版第3 4 卷Q(6)=2 8 1 5 5(o o o o),Q(1 2)=3 8 6 4 8(0 o o o),Q(1 6)=4 1 6 6 2(0 o o o)括号中的数为对应检验统计量的P 值由此知在检验的显著性水平为0 0 5 的条件下,由于延迟6 阶的卡方检验统计量的尸值小于0 0 5,所以该差分序列不能视为白噪声序列,即差分后序列还蕴含着不容忽视的相关信息可供提取,那么我们可以建立模型了2 5 模型建立在对以上的数据进行处理后,我们可以用S P S S 软件对模型进行拟合以求得最优的模型为了确定模型的P,d,q 值,表2 给出了不同P,d,q 时的R e s i d u a lV a r i a n c e 值,满足R e s i d u a lV a r i a n c e 最小的P,d,q 值为我所求的模型的参数表1pZq 对应的R e s i d u a l V a r i a n c e 值表p。d,ql,l,01,1,12,l,02,1,12,l,23,l,03,l,1R e s i d u a l0 0 0 7 1 40 0 0 6 9 20 0 0 6 9 80 0 0 6 9 30 0 0 6 9 90 0 0 0 8 50 0 0 7 0 6V a r i a n c ep d,q3,1,23,l,34,1,04,1,14,1,24,l,34,l,4R e s i d u a l0 0 0 6 8 00 0 0 5 1 30 0 0 6 2 50 0 0 5 6 70 0 0 5 7 70 0 0 5 8 90 0 0 6 5 0V a r i a n c e由表1 可知当P=3,d=1,q=3 时,R e s i d u a lV a r i a n c e 的值达到最小此时模型为A R I M A(3,l,3),所拟合的模型为:只=1 3 5 6 2 6 y,一l 一0 1 1 1 7 9 y,-2+0 1 3 魄-3 0 3 7 8 9 1 只_ 4+q+O 2 5 3 1 5 6 t-l+0 0 5 8 3 6 4 2 一O 8 4 9 2 4 q 一3其中只一f=I n(x 一。),f _ 0,1,2,3,4,五一。表示不I 司年份的人均G D P 2 6 对拟合后的残差序列进行白噪声检验对模型拟合后的残差序列用S P S S 处理后得出的不同延迟期数Q L B 统计量为:Q(6)=5 4 6 9(0 4 8 5),Q(12)=6 7 41(0 8 7 4),Q(16)=7 9 0 4(0 9 5 2)括号中的数为对应检验统计量的P 值由此知在检验的显著性水平为0 0 5 的条件下,由于延迟6 阶的卡方检验统计量的尸值远远大于0 0 5,所以该差分序列是白噪声序列,即拟合后的残差序列不在蕴含信息可供提取这个序列值的变动是由于随机波动引起的为了验证模型的有效性用2 0 0 0,2 0 0 1,2 0 0 2,2 0 0 3 年的数据来模挖J 2 0 0 4,2 0 0 5,2 0 0 6 年的数据,得到如下的表:表2 模拟的数据和实际的数据比较表计量单位:元年份2 0 0 42 0 0 52 0 0 6模拟的数据1 2 2 6 81 4 0 8 01 6 6 0 7实际的数据1 2 3 3 61 4 0 4 01 5 9 3 l从以上的对比看拟合的效果好,没有出现太大的偏差,说明模型是有效的3由所得的模型进行预测表3 中国人均G D P 预测数据表计量单位:元年份2 0 0 72 0 0 82 0 0 92 0 1 0中国人均G D P 预测数据1 8 5 3 82 1 1 9 52 3 3 6 l2 6 4 6 74 结论根据中国统计告息网2 0 0 7 年中国G D P 总额为2 4 6 6 1 9 亿元、人口为1 3 2 1 2 9 亿A 得至1 J 2 0 0 7 年中国人均G D P 为万方数据第6 期严天艳等:中国人均G D P 的时间序列模型的建立与分析11 6 718 6 6 5 元。从预测结果来看,2 0 0 7 年的预测值与实际值比较误差小,说明模型有较好的预测能力从对以后三年的预测值可以看到中国人均G D P 有望在今后几年保持平稳高速增长并且我们可以|乐观的估计在2 0 2 0 年中国人均G D P 可以达到甚至超过3 5 0 0 美元尽管A R I M A 模型在短期内预测比较准确,但随着预测期的延长,会出现预测误差逐渐增大的情况,但是预测结果在一定程度上还是说明实现经济增长规划目标是完全可能的根据中国1 9 5 2 2 0 0 6 年的人均G D P 增长速度数据,我们不难看出,在1 9 5 2 1 9 7 8 问由于历史的原因中国经济始终在低位徘徊,增长速度缓慢自1 9 8 0 年后中国经济出现了持续快速的增长在实现人均G D P 持续稳步增长的同时,人均G D P 增长速度出现了两个高峰期,分别为1 9 9 2 1 9 9 6 年的1 3 7 增长速度和2 0 0 0 年以后的1 2 的增长速度,由于1 9 9 7 年亚洲金融危机的影响放缓了中国经济的增长,从人均G D P 上也可以体现出来中国人均G D P 增长的另一特征是在一定时期增长高峰后随之而来的是增速递减,这种增速递减明显地说明一个具体年份的经济增长是有增长极限的如果这种增长速度过快,超过了社会、经济和自然资源的承受能力,短期的高速度就要有更多年份白:低速度来弥补,若由于短期的高增长是以资源的过度投入和环境的破坏为代价,那么它的长期成本要高于正常的均衡增长由此说明,中国经济在高速增长的I 司时还会遇到很多不确定因素,因此不要一味地追求每年都达到较高的经济增长速度,而要综合考虑未来几年的发展环境,制定科学合理的经济发展战略但是影响经济增长的因素很多包括外部的和内部的,并且这些因素中有相当一部分是不可控的,例如在未来几年内出现大的自然灾害以及出现战争出现经济危机通货膨胀等特殊情况而现实中已经发生的比如:从2 0 0 7 年下半年起我国开始出现了通货膨胀的迹象对人均G D P 的影响不小;由于投资市场的疯狂,从2 0 0 7 年起中国实行了从紧的货币政策,一年之内数次提高存款准备金率,并且提高了股票交易中的印花税,降低了银行存款中的税率等;2 0 0 7 年美国的次信贷危机殃及全球,引发了人们对未来几年内世界经济市场的担忧,甚至有人认为世界经济增长会因此而放缓,势必会在一定程度上影响中国经济的增长做的这个预测只是在国际经济环境和中国内部的经济环境良好的前提下进行的,而这些经济目标只有在中国经济持续、稳定、高速增长的情况下才能实现参考文献:【l】林峰,葛新权经济统计分析方法【M 1 北京:社会科学文献出版社,2 0 0 3【2】张守一,葛新权中国宏:i 见经济理论模型预湖4 1 M I 北京:社会科学文献出版社,1 9 9 5【3 1 王燕应用H eJ 日I 序列分析j M】北京:中国人民大学出版社,2 0 0 5【4】薛薇统汁分析与S P S S f l r J 应用【M】北京:中国人民大学出版社,2 0 0 1【5 1 李朝鲜社会经济统计学【M】北京:经济科学出版社,2 0 0 2【6】吴海军A R I M A 在北京市全社会同定资产投资预测中的应用【J】经济研究导刊,2 0 0 7,(2):1 3 1 1 3 3【7】刘国光,王洛,李京文2 0 0 5 年:中国经济形势分析与预R O I M I 北京:社会科学文献出版社,2 0 0【8 l 杜志渊常用统计分析方法:S P S S 应用 M I 济南:山东人民出版社,2 0 0 6 T i m es e r i e sm o d e l Sc o n s t i t u t i o na n da n a l y s i so fp e rC h i n e s eG D PY A NT i a n Y a n l 3,L UW a n g Y o n 9 2 3,Z H UL i P i n 9 3(1 S c h o o lo f C o m p u t e rS c i e n c e,P a n z h i h u aU n i v e r s i t y,P a n z h i h u a 6 1 7 0 0 0,P R C;2 S c h o o lo f M a t h e m a t i c sa n dS o f t w a r e,S i c h u a nN o r m a lU n i v e r s i t y,C h c n g d u6 1 0 0 6 6,P R C;3 D e p a r t m e n to f M a t h e m a t i c s,S i c h u a nU n i v e r s i t y,C h e n g d u6 1 0 0 6 4,P R C)A b s t r a c t:P e rp e r s o nG D Pi Sa ne f f i c i e n tt o o lt ok n o wa n dh o l dm a c r o s c o p i c a l l ye c o n o m i c ss t a t u so fac o u n t r yo ra r e a B a s e do ni n t r o d u c i n gt i m es e r i e sm o d e l,c o m b i n e dp e rC h i n e s eG D Pd a t af r o ml9 5 2t o2 0 0 6,t h eP a p e ra p p l i e sS P S St oa n a l y z i n gd a t aa n dc o n s t i t u t e dt i m es e r i e sm o d e l T h ea r t i c l ep a r t i c u l a r l yi n t r o d u c e sw h o l ep r o c e s so fc o n s t i t u t i n gm o d e la n df o r e c a s t sp e rC h i n e s eG D Pd a t af r o m2 0 0 7t o2 0 1 0 T h i sh a si m p o r t a n tm e a n i n gf o rU St Ok n o wd e v e l o p i n gs t a t u so fC h i n e s ee c o n o m y t oi n s t i t u t es c i e n t i f i ca n dr e a s o n a b l ee c o n o m i cd e v e l o p m e n ts t r a t e g yf o ro u rc o u n t r y K e yw o r d s:p e rp e r s o nG D P;A R M A(p,g),A R I M A(p,d,q),w h i t en o i s e万方数据