2022年门限自回归模型在海洋冰情预测中的应用 .pdf
灾害学 990401灾害学 JOURNAL OF CATASTROPHOLOGY 1999年 第 14卷 第 4期 vol.14 No.4 1999门限自回归模型在海洋冰情预测中的应用*杨晓华金保明金菊良丁晶摘要给出了建立门限自回归模型(TAR) 的一套实用方法,用作者提出的改进遗传算法可同时优化门限值和自回归系数,成功地解决了TAR建模过程所涉及的大量复杂寻优工作这一难题。实例计算的结果说明了,这套方法在海洋冰情预测中是可行的和有效的,在各种自然灾害非线性时序动态预测中具有重要的理论意义和广泛的实用价值。 主题词冰情时间序列;门限自回归模型;非线性预测;遗传算法APPLICATION OF THRESHOLD AUTO-REGRESSIVE MODEL TO PREDICTING MARINE CONDITIONYang Xiaohua1 Jin Baoming2 Ding Jing31)Hohai University,Nanjing 210098 2)Water & Electricity Bureau of Nanping 3) Sichuan University Abstract A practical method is presented for establishing threshold auto-regressive (TAR) model. With the improved genetic algorithm by the author, both of the threshold values and auto-regressive coefficients can be optimized and the difficult problem of modeling of TAR is solved. The result of calculation example shows that predicting marine ice condition with this method is practical and efficient. As a general way, the scheme has major theoretical valve and wide-ranging application for predicting regime of nonlinear time series of different natural disasters. Key words Ice condition time series, Threshold auto-regressive model, Nonlinear prediction, Genetic algorithm1引言 海洋冰情时间序列是海洋灾害管理的基本资料之一,对其进行有效预测,可为减轻海洋冰灾损失提供重要的理论指导。因冰情序列受众多不确定性因素影响,在时序上常常表现出弱相依性、突变性和随机性等复杂非线性特征,至今对此进行有效描述的数学模型仍不很成熟 1。门限自回归(Threshold Auto-Regressive Model,简称 TAR)模型能有效地描述具有极限点、极限环( 准周期性) 、跳跃性、相依性、谐波等复杂现象的非线性时序动态系统 2,由于门限的控制作用,保证了TAR模型很强的稳健性和广泛的适用性。我们用TAR模型在预测黄河干流复杂径流中获得成功且广泛地应用,与多元线性回归、投影寻踪回归、模糊分析、人工神经网络、灰色模型、混沌分析等预测方法相比,TAR模型的预测精度高且稳健、适用性强、应用简便(1)。目前,TAR模型已成为工程分析计算中应用最广且技术较为成熟的非线性时序模型 2。 把 TAR模型用于海洋冰情预测的主要问题是TAR建模过程中需进行大量复杂的寻优工作。常规处理方法如 H.Tong 方法、 D.D.C 方法、局部区间搜索方法 2,计算量大且存在局部优化问题,尚无法较多地考虑具体的预测情况。基于生物进化过程中优胜劣汰规则与群体内部染色体信息交换机制的遗传算法(genetic algorithm,简称 GA) 3,只要求优化问题是可计算的,它直接在优化准则函数值的引导下,在搜索空间中进行自适应全局并行搜索,运行过程简单而计算结果丰富,是目前一类新的通用性强的优化方法,已在诸如函数优化、组合优化、神经网络优化、程序设计优化、机器学习等众多领域中得到广泛应用。 本文在上述成果的基础上,提出了一套实用的TAR建模实施方案,即:先用自相关分析技术 4确file:/F|/qikan_htm抽取 _2000before/kjqk(200810)/zhx/zhx99/zhx9904/990401.htm(第 1 5 页) 2010-1-1 21:30:10名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 6 页 - - - - - - - - - 灾害学 990401定海洋冰情时序的延迟特性,据此用点值图(Dot Figure) 2确定 TAR模型的门限区间个数和门限值的寻优范围,然后直接在模型拟合误差最小准则下用我们提出的改进遗传算法(Accelerating Genetic Algorithm,简称 AGA) 6同时优化门限值和TAR模型的自回归系数。TAR模型在实际海洋冰情预测中成功应用的结果表明,本文所提出的这套方案是可行的、有效的。由于这套基于遗传算法的TAR建模方法具有一般性,在各种自然灾害非线性时序预测中具有重要的理论意义和广泛的应用价值。2门限自回归模型的建立 TAR模型是由英籍华人H.Tong( 汤家豪 ) 博士于 1978 年首先提出的,其基本思路为 2:在观测时序x(i)的取值范围内引入L-1 个门限值(r(j),j=1,2,, L-1) ,将该范围分成L个区间,并根据延迟步数d将 x(i)按 x(i-d)值的大小分配到不同的门限区间内,再对不同区间内的x(i)采用不同的自回归(Auto-Regressive,简称 AR)模型来描述,这些AR模型的总和完成了对整个时序x(i)非线性动态系统的描述。它的一般形式为:当 x(i-d) (r(j-1),r(j) ,(j=1,2, ,L)(1)其中, r(0)=- ,r(L)=+ ,r(j)(j=1,2, ,L-1)为门限值;L为门限区间的个数;d为延迟步数;b(j,k)为第 j 个门限区间内的自回归系数;nj 为第 j 个门限区间AR模型的阶数;e(j,i)对每一固定的j 是固定方差的白噪声序列,各 e(j,i)(j=1,2, ,L) 之间相互独立。 式 (1) 表明,当x(i-d)落入第 j 个门限区间r(j-1), r(j)时, TAR对 x(i)至 x(i-nj)这 nj+1 个顺序数据建立AR(nj),其中 i 为跑标;若有mj个 x(i-d)落入第 j 个门限区间,就大致有mj组这样的nj+1 个顺序数据用于建立 AR(nj)模型。 由于TAR模型是分区间的AR模型, TAR常规的建模方法是沿用AR模型的参数估计方法和模型检验准则,如最小二乘法与AIC 准则 2。 TAR的建模过程,实质上是一个对模型参数d,L,r(1),r(2), ,r(L-1),n1,n2, ,nL 和 b(j,k)的高维寻优问题,常规方法的计算量相当大,从而在某种程度上限制了其实用价值。我们在前人研究成果的基础上,在这里给出基于遗传算法的一套简便实用的TAR建模实施方案,它包括如下 3大步骤: 用自相关分析技术确定TAR模型的延迟步数d和门限区间AR模型的阶数nj 时序 x(i)延迟 k步的自相关系数R(k) 为 5:其中, n为实测时序x(i)的容量,k=1,2, ,nk n/10 或 n/4 。 R(k) 的方差随k的增大而增大,R(nk)的估计精度随nk的增加而降低,因此nk应取较小的数值。 根据R(k) 的抽样分析理论,在置信水平1- 的情况下,当自相关系数值R(k) (-1-u /2.(n-k-1)0.5)/(n-k),(-1+u /2.(n-k-1)0.5/(n-k) (4) 时则推断时序x(i)延迟 k步相依性显著,其中的某个k就是 TAR模型的延迟步数d;否则时序x(i)延迟 k步相依性不显著 4。其中,分位值u /2可从正态分布表中查得。门限区间AR模型的阶数nj 应不大于相依性显著的最大延迟步数,它的自回归系数项应与这些相依性显著的延迟步数相对应。 用点值图确定TAR模型的门限区间个数L和门限值r(1) r(L-1)的寻优范围 2点值图是数理统计中最常用的非线性检验方法,常称为条件数学期望估计法。对时序x(i)(i=1,2, ,N) ,考虑数据对集合(x(i),x(i-d) i=1,2,3, ;d=1,2, , 把 x(i-d)轴作为横轴,将其分为均匀的s(s 远大于 L) 段。设共有Nj个 x(i-d)file:/F|/qikan_htm抽取 _2000before/kjqk(200810)/zhx/zhx99/zhx9904/990401.htm(第 2 5 页) 2010-1-1 21:30:10名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 6 页 - - - - - - - - - 灾害学 990401落在 j 段,这Nj个 x(i-d)所对应的x(i)值记为 x(i, j) ,则第 j 段内 x(i)对 x(i-d)的条件期望的估计值为 (j=1,2, ,s;d=1,2, )(5)以 x(i-d)轴作为横轴,E(x(i)/x(i-d)轴作为纵轴,在各段的中心位置上标出点E(x(i)/x(i-d)j,即得点值图。 可以证明 2,若 x(i)是正态的并可用线性模型描述的,则点值图中的点群呈线性分布。在实用中,当点值图中的点群大致呈线性分布时,可考虑采用线性模型来描述时序x(i);而当点值图中的点群大致呈分段线性分布时,就可考虑采用分段线性模型来描述时序x(i),这也正是TAR模型的基本思路。因此,用点值图不仅可以判断时序模型的性质,而且可根据分段线性的段数来确定门限区间的个数L,在分段线性的转折点附近确定各门限值r(1) r(L-1)的搜索范围,从而有效地减少了TAR的寻优工作量。 用改进遗传算法(AGA) 直接在模型拟合误差最小准则下同时优化各门限值r(1) r(L-1)和各门限区间内的自回归系数b(j,k)理论上,TAR建模所需的数据量要多于AR建模所需的数据量,而落在一个门限区间内的数据量应至少与AR建模所需的最少数据量相当。为控制大的拟合误差,这里取优化准则函数为 TAR模型的拟合误差平方和这一形式:(6)其中, x (i)为式 (1) 中除白噪声项以外的所有项( 即 TAR模型估计值) ,它是各门限值r(1) r(L-1)和各门限区间内 AR模型的自回归系数b(j,k)的函数;x(i)为观测值。作为一种通用的优化方法,AGA 显然可同时求解上述优化问题中的优化变量r(1) r(L-1)和 b(j,k)(j=1 L,k=0 nj) 。 AGA 的具体算法可参见文献5,限于篇幅,这里不再多述。3门限自回归模型在海洋冰情预测中的应用 现利用表1中 1966 1993 年度冰情等级资料序列x(i) i=1 27 1来建立 TAR冰情预测模型。表1中, 1966 表示 1966 1967 年度, 1993 表示 1993 1994 年度,余类推。表 1某海洋冰情等级序列实测值和TAR模型的拟合结果与预测结果( 单位:冰级)年度1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979实测值3.004.505.003.00 3.50 3.001.003.001.501.504.502.502.503.00TAR计算值3.05 2.60 1.772.652.451.652.932.632.873.62绝对误差0.45 0.40 -0.77 0.35 -0.95 -0.15 1.57 -0.13 -0.37 -0.62年度1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993实测值2.502.502.003.00 3.50 3.00 3.002.001.503.001.501.501.501.50TAR计算值1.872.662.792.33 2.78 2.763.132.802.222.532.422.072.831.87绝对误差0.63 -0.16 -0.79 0.67 0.72 0.24 -0.13 -0.80 -0.72 0.47 -0.92 -0.57 -1.33 -0.37计算该序列前6阶自相关系数值R(k) 和与之相应的式(4) 右边上、下限R2(k) 、 R1(k) 值,结果见表2,其中置信水平取70%。表 1显示,只有R(1) 、 R(3) 、 R(4) 的相依性在置信水平70%的条件下是显著的,故这里只取延迟1步、 3步、延迟4步作为门限区间AR模型的自回归系数项,TAR模型的延迟步数d取为 1。表 2某海洋冰情等级序列自相关系数及其上、下限值( 置信水平70%)file:/F|/qikan_htm抽取 _2000before/kjqk(200810)/zhx/zhx99/zhx9904/990401.htm(第 3 5 页) 2010-1-1 21:30:10名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 6 页 - - - - - - - - - 灾害学 990401k123456R1(k) -0.238 -0.244 -0.249 -0.256 -0.262 -0.269R(k)0.2510.105 0.217 -0.278 -0.100 -0.110R2(k)0.1620.164 0.1660.1690.1710.174把 x(i-1)轴、 x(i-3)轴或 x(i-4)轴作为横轴,将其分为均匀的6段,以 E(x(i)/x(i-1)轴、 E(x(i)/x(i-3)轴、或 E(x(i)/x(i-4)轴作为纵轴,在各段的中心位置上标出点E(x(i)/x(i-1)j、 E(x(i)/x(i-3)j或 E(x(i)/x(i-4)j,即得该冰情等级序列的点值图,参见图1中的 (a) 、 (b) 和 (c) 这 3个子图。根据图1,点值图中的点群可分为2段直线,据此确定门限区间的个数L=2, 分段线性的转折点在序列均值2.667 附近,从而可确定门限值r(1)的搜索范围。图 1冰情等级点值图a: E(x(i)/x(i-1) x(i-1), b: E(x(i)/x(i-3) x(i-3), c: E(x(i)/x(i-4) x(i-4) 总上, 可得该海洋冰情等级序列的TAR模型的结构形式为:为方便,式(7) 中序列 x值都去掉观测序列的均值2.667(中心化 ) 。把式 (7) 代入式 (6) ,即得此例的优化准则函数,用AGA 优化其中的TAR模型的参数,它们的初始变化区间和优化结果参见表3。表 3用 AGA 优化海洋冰情等级TAR模型的参数加速 次数优秀个体的变化区间最佳优化准则函数值Q1r(1)b(1,1)b(1,3)b(1,4)b(2,1)b(2,3)b(2,4)1-1.00 , 1.00-0.50 , 0.50-0.50 , 0.50-0.50 , 0.50-0.50 , 0.50-0.50 , 0.50-0.50 , 0.5012.4093-0.87 , 0.78-0.01 , 0.410.12 , 0.47-0.49 , -0.16-0.17 , 0.40-0.12 , 0.40-0.49 , 0.1511.7766-0.79 , 0.290.11 , 0.330.32 , 0.45-0.45 , -0.190.05 , 0.320.15 , 0.28-0.47 , -0.3411.422优化值-0.75580.18760.4361-0.20350.22320.2492-0.453911.422可见,表3的模型参数优化值与图1各子图的点群分布情况相一致。把表3所得的参数优化值代入式(7) ,即得海洋冰情等级时序的TAR预测模型。表4列出了 TAR模型拟合误差分析的结果。TAR模型 1970 1993 年度冰情等级的拟合结果和1993 1994 年度冰情等级的预测结果参见表1。表 4 TAR模型拟合绝对误差( 冰级 ) 落在下列区间的百分比file:/F|/qikan_htm抽取 _2000before/kjqk(200810)/zhx/zhx99/zhx9904/990401.htm(第 4 5 页) 2010-1-1 21:30:10名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 6 页 - - - - - - - - - 灾害学 990401 0, 0.5 0, 0.8 0, 1.0 43.5%82.6%91.3%表 4、表 1说明, TAR模型虽然仅利用海洋冰情等级时序延迟1步、延迟3步和延迟4步的分段相依信息,但由于有了门限的控制作用,已可以描述该时序非线性动态系统;TAR模型的拟合精度和预测精度都是令人满意的,显示出TAR模型稳健的性能。3结语 本文将已在许多工程中被广泛应用的门限自回归模型(TAR) 成功地用于海洋冰情等级时序动态预测中。为解决TAR建模过程所涉及的大量复杂寻优工作这一难题,本文给出了一套简便实用的具体方案,即:用自相关分析技术确定海洋冰情等级时序的延迟特性,据此确定门限区间AR模型的大致结构形式;用点值图确定TAR的门限区间个数和门限值的寻优范围;用我们提出的改进遗传算法直接在模型拟合误差最小准则下同时优化门限值和TAR模型的自回归系数。文中实例计算的结果表明,这套方案是可行的,通过门限值的控制作用,TAR模型可以有效地利用海洋冰情等级时序资料所隐含的分段相依性这一重要信息,限制了模型误差,从而保证了TAR模型预测性能的稳健性,提高了预测精度。显然,本文给出的这套基于遗传算法的TAR建模方法具有一般性,在各种自然灾害非线性时序动态预测中具有重要的理论意义和广泛的应用价值。 *本文为国家自然科学基金( 编号 49871018)和中国博士后科学基金资助项目 (1) 丁晶,邓育仁,等. 黄河干流中长期预报的研究,四川联合大学研究报告.1995 作者单位:杨晓华(河海大学,南京210098 ) 金保明(福建省南平市水电局) 金菊良丁晶(四川大学)参考文献 1余加艾,刘钦政. 利用灰色系统方法预测冰情.海洋环境科学, 1995,14(4):7075 2杨叔子,吴雅,等.时间序列分析的工程应用(下册 ).武汉:华中理工大学出版社,1992,309348 3Goldberg D E. Genetic Algorithms in Search,Optimization and Machine Leaming. MA:Addison-Wesley.1989:183 4丁晶,邓育仁 . 随机水文学 . 成都:成都科技大学出版社,1988,33226 5金菊良,储开凤,郦建强. 基因方法在海洋预报中的应用. 海洋预报 . 1997,14(1)916收稿日期1999-07-21file:/F|/qikan_htm抽取 _2000before/kjqk(200810)/zhx/zhx99/zhx9904/990401.htm(第 5 5 页) 2010-1-1 21:30:10名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 6 页 - - - - - - - - - 门限自回归模型在海洋冰情预测中的应用作者:杨晓华, 金保明, 金菊良作者单位:刊名:灾害学英文刊名:JOURNAL OF CATASTROPHOLOGY年,卷(期):1999 ,14(4)引用次数:7次引证文献(9条)1. 张愉. 谢飞. 金菊良 BP 神经网络非线性组合预测模型在海洋冰情预测中的应用期刊论文-运筹与管理 2006(03)2. 胡华科 55年来梅州市耕地数量变化分析与预测学位论文硕士 20063. 杨晓华 . 杨志峰 . 沈珍瑶 . 陆桂华 . 郦建强 水环境非线性时序预测的高精度 RBF 网络模型期刊论文-水科学进展 2005(06)4. 徐香坤 非线性时间序列组合预测模型研究学位论文硕士 20055. 杨晓华 . 杨志峰 . 郦建强 海洋冰情预测的径向基函数网络模型期刊论文-自然灾害学报 2004(04)6. 金菊良 . 魏一鸣 . 丁晶 用基于加速遗传算法的组合预测模型预测海洋冰情期刊论文-系统工程理论方法应用 2003(04)7. 覃光华 . 丁晶. 王文圣 门限人工神经网络模型及其在洪水预报中的应用期刊论文-四川水力发电 2002(04)8. 金菊良 . 魏一鸣 . 付强. 丁晶 投影寻踪门限自回归模型在海洋冰情预测中的应用期刊论文-海洋预报 2002(04)9. 金菊良 . 杨晓华 . 金保明 . 丁晶 遗传双线性模型在海洋冰情预测中的应用期刊论文-海洋环境科学 2000(04)本文链接: http:/ 年1月20日名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 6 页 - - - - - - - - -