神经网络模型预报湖北汛期降水量的应用研究①.pdf
第59卷 第6期2001年12月气象学报ACTA M ETEOROLOGICA SI N ICAVol.59,No.6Dec.,2001神经网络模型预报湖北汛期降水量的应用研究胡江林(武汉暴雨研究所,武汉,430074)张礼平(武汉中心气象台,武汉,430074)宇如聪(中国科学院大气物理研究所,LA SG,北京,100081)摘要使用人工神经网络方法建立了湖北省汛期(68月)总降水量的短期气候预测模型,该神经网络模型的输入是汛期前期(24月)的北半球月平均500 hPa高度场、海平面气压场和太平洋海温场的扩展自然正交展开(EEOF)的前几个主要模态的时间系数,输出了湖北汛期降水场的自然正交展开(EOF)的前2个主要模态的时间系数。41 a历史资料的交叉检验表明:样本试验的预报技巧评分平均为0.246,虽然该模型对各年的预报效果仍存在一定的不稳定性,但它可为湖北汛期降水的短期气候预测提供一种具有明显统计预报正技巧的预报方法。关键词:人工神经网络,短期气候预测,交叉检验,自然正交展开。1引言近年来短期气候预测方法发展较快1。目前,短期气候预测的统计方法主要有4种2:(1)线性回归方法或相关分析(LR),即寻找一对变量x和y之间的关系;(2)自然正交展开方法(EOF)及其扩展,即寻找一组变量X1,X2,Xn之间的相关型;(3)典型相关方法(CCA)或奇异值分解方法(SVD),即寻找一组变量X1,X2,Xn和另一组变量Y1,Y2,Ym之间的线性关系;(4)人工神经网络方法(ANN),即寻找一组变量X1,X2,Xn和另一组变量Y1,Y2,Ym之间的非线性关系。前3种方法是线性方法,其中CCA方法已成为美国气候预报中心(CPC)业务上使用的一种短期气候预测方法3,4,交叉检验显示该方法对北美大陆的温度和降水的季预测在某些季节具有明显的正技巧(主要是冬春季节,特别是EN SO信号强的年份),但CCA方法对夏季特别是夏季降水的预测效果并不理想。这3种方法在预测短期气候变化这种复杂的非线性系统时效果不理想是不足为奇的,因为它们只能揭示变量之间的线性关系。ANN模型是非线性的,它有可能克服前3种线性方法的弱点,因而被看作是最有应用前景的方法。上述4种方法的数值计算方法实现的时间分别是1885,1901,1936和1986年,从中也可看出ANN方法是较新的方法,但仍有许多问题值得研究。近10多年来,ANN模型在模式识别、图像处理、信号处理和自动控制等应用研究方 初稿时间:1999年12月30日;修改稿时间:2000年4月30日。资助课题:中国科学院大气物理研究所LASG实验室提供资助。1995-2006 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.面取得了重要成果5。近年来被引入非线性特性十分显著的气象科学和预报预测领域,并取得了一系列研究成果,有研究表明在处理混沌加随机的系统时使用ANN模型比一般的线性模型更优6。到目前为止,ANN模型已在EN SO预测7、印度季风降水预测8、南部非洲夏季降水预测9、月降水预测和月平均温度预测1012、中国东部汛期降水预测13、湖北省代表站1998年7月降水预测14等个例的短期气候预测试验中取得了一定的效果,但由于ANN模型的非线性特征,由小样本或几个独立样本试验的效果并不能预测该非线性模型的预测效果。美国气候预报中心已将交叉检验作为检验短期气候预测统计模型预测效果的方法,但到目前为止,使用ANN模型进行短期气候预测的大样本交叉试验结果还非常少见,ANN模型对汛期降水的预测效果仍有待进一步研究。湖北地处亚热带季风区,汛期(68月)降水不仅受中高纬西风环流影响,而且还受西太平洋副高、台风、东亚季风和印度西南季风环流的影响。由于这些因子之间的非线性作用十分复杂,汛期降水预报难度较大,至今尚未研制出一种预测技巧稳定又水平较高的业务预报方法15。和中国许多地方一样,湖北省多年平均的汛期降水的短期气候预测相对于随机预报的技巧评分仍为负技巧16。目前对降水总量的预测多采用相似法、回归方法以及多因子投票法等,但效果并不十分理想,这里用ANN模型对湖北省10个代表站汛期降水量进行预测,以寻求对汛期降水量预测的新途径。2人工神经网络模型简介及其特点2.1人工神经网络模型简介图1神经网络示意图ANN的种类很多,目前使用最多也是最有成效的是向后传播(back2propagation,简称BP)神经网络,本文使用的是最为常用的3层BP神经网络(图1),它的数学模型是:Y=f(1X+1)(1)Z=f(2Y+2)(2)这里X,Y,Z分别为输入层、隐含层和输出层矢量(节点向量),1,1和 2,2表示输入层与隐含层和隐含层与输出层之间的连接权和阈值,f(x)为网络激活函数,这里采用S型函数,即f(x)=11+e-x(3)通过对样本的学习和训练,不断调整各节点的连接权和阈值,进而得到样本的输入输出规律。在BP神经网络中,引入代价函数(也称能量函数)E=12(Z-Z0)2(4)这里Z0是期望输出矢量。BP神经网络通过代价函数的最小化过程来完成输入到输出映射。它的基本思想是如果利用已有连接权和阈值正向传播得不到期望的输出,则反向传7776期胡江林等:神经网络模型预报湖北汛期降水量的应用研究 1995-2006 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.播学习,反复修改(迭代)各节点的连接权和阈值,逐步减少代价函数,直到代价函数不再减少或反复振荡为止,此时完成输入与输出映射关系的确立。2.2BP神经网络的特点(1)具有较强的学习功能:神经网络的连接权和连接结构都是通过网络训练得到,并不需人们预先掌握两组变量之间的关系。(2)非线性:虽然回归模型中可通过因子之间的非线性变换来发现非线性关系,但非线性变换需人为地预先确定。神经网络的非线性是通过网络激活函数f(x)导入的,可自动解决非线性问题。例如数学上的“异或”问题是一简单的非线性问题,数学模型如表1。表1异或数学模型输入要求输出x1x2y000011101110对这样一个简单的非线性问题,若直接使用回归方法无法解决该问题,但用ANN模型即可自动完成建模工作,准确地解决该问题。(3)神经网络的容错性和冗余性:如果训练的样本足够多,则即使部分样本数据出错,神经网络可自动识别这种错误并更正这些错误。如果训练样本足够多,则即使网络的输入部分有相对独立的因子,也不会严重影响网络预报效果。3人工神经模型在短期气候预测应用中的障碍ANN模型具有上述如此多的优点,但它仍没有在短期气候预测中得到广泛应用,其原因可能是:(1)如何处理大量的场格点(或台站)资料:气候动力模式和线性方法(CCA)都使用大量的空间场资料才在短期气候预测中获得成功。如果将每个格点(或台站)序列都作为一个神经元,则计算量很大,且相对于短的样本来说肯定是病态条件问题。(2)由短样本资料导致的非线性不稳定:相对于短样本资料来说,BP神经网络模型有太多的自由参数(例如1个隐含层的BP网络的自由参数=隐含层节点数(输入输出节点数+1)+1),这在数学上很容易成为病态条件问题,结果是训练网络(拟合)时效果很好,但使用网络(预报)时效果极不稳定。或对某些个例预报效果很好,但总体效果与线性模型比较并没有明显的优越性。由于BP神经网络的大量参数导致的网络的可伸缩性太大,常常对训练样本资料造成过度拟合(overfitting),即网络在训练过程中学习样本中的“噪声”规律,网络在拟合时效果很好,但预报时很差。(3)由于BP神经网络的非线性,网络训练时不能保证得到代价函数全局最小。EOF方法提供了压缩空间场资料成为少数几个主要模态的方法,由于季节预测可能不但与某月的状况有关,还可能与该变量的随时间变化有联系,因此使用EEOF方法对ANN模型的输入因子前处理和使用EOF方法抓住输出变量的主要特征,有可能克服ANN模型的第一个障碍。同时对输入因子和输出变量的处理也使得ANN模型的输入节点数大大减少,如进一步限制隐含层节点数,则ANN模型的自由参数可望得到相对于样本长度来说较有限的网络自由参数,从而使ANN模型的非线性不稳定得到明显抑制,部877气象学报59卷 1995-2006 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.分地解决第2个障碍。至于第3个障碍,使用模拟退火法和遗传算法对这一问题将有所改进,但我们的工作中该问题不是很突出,本文也没有进行该方面的探讨。下面的工作将表明只要克服了上述几个障碍,神经网络模型在短期气候预测中的技巧是明显的。4选用资料及人工神经网络模型的建模4.1 选用资料本文所选用资料包括:(1)北半球月平均的500 hPa高度场格点资料(5 10,共576个格点);(2)北半球月平均的海平面气压场格点资料(5 10,共576个格点);(3)北太平洋海温资料(286个格点)。以上3种资料源自国家气候中心,作为预报因子场。(4)湖北省10个代表站68月的月降水量,源自武汉中心气象台,作为预报量。资料长度共41 a(19591999年)。考虑到影响各台站降水量的物理因子主要是大气环流和外界强迫,这里同时选用北半球500 hPa高度、海平面气压和太平洋海温(均为24月)作预报因子,对每个因子场利用EEOF方法,提取预报因子的主分量,取前若干个主分量的时间系数作候选预报因子。这样大大减少了ANN模型的输入节点数,同时又抓住了预报因子场的主要特征。由于单站降水量的不确定性较大,对湖北省10个代表站的68月总降水量作EOF分析,提取主分量时间序列作候选预报量。表2预报因子和预报量的前10个主分量解释的方差(已标准化)主分量序号预报因子降水预报量10.1410.2300.2210.64220.1020.1040.1100.08530.0880.0820.0770.08040.0650.0710.0530.04850.0580.0580.0430.04060.0540.0460.0400.03270.0440.0450.0320.03080.0420.0320.0310.02190.0370.0320.0270.013100.0330.0290.0250.001交叉检验中降水的样本是40 a,在随检验年份的不同表中该列的数据略有不同。表2给出了预报因子和预报量的前10个主分量解释的方差。从表2可见,各预报因子的主分量解释的方差收敛较快,前5个主分量解释的方差和已超过50%,前10个主分量解释达70%左右。而预报量的前2个主分量解释方差已超过70%。4.2人工神经网络模型的建模输入神经网络进行训练的所有样本的输入输出因子Xi均作如下标准化(0,1)处理:ai=Xi-Xm ind(5)9776期胡江林等:神经网络模型预报湖北汛期降水量的应用研究 1995-2006 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.其中d=1.05(Xmax-Xm in),这里Xi是输入或输出因子,Xmax和Xm in为因子Xi的最大值和最小值,ai即为标准化因子。考虑到大气状态和边界强迫对降水都有影响,模型预报因子中应包括高度场、气压场和海温场的前若干个主分量,考虑到这些场的收敛特征和网络非线性特征,从每个场的主分量中选取的预报因子不宜过多,本文的BP神经网络训练过程中考虑了930个预报因子的情况。考虑到降水场的稳定性和现在可能达到的预报效果,只取前14个主分量作预报量。神经网络的隐含层节点数从网络训练实际效果中选取,这里取14。5人工神经网络模型的模型实例及其稳定性5.1人工神经网络模型的实例及交叉检验效果分析这里给出人工神经网络模型进行预测的一个实例。选取500 hPa高度场的前5个主分量、海平面气压场的前4个分量和海温场的前4个主分量作预报因子(输入),降水量场的前2个主分量作预报量(输出),隐含层节点数取2,训练时迭代次数为5000次时已基本稳定,这里训练的迭代次数取为10000次(输入节点数、输出节点数、隐含层节点数和迭代次数对模型预测效果的影响参见5.2节)。交叉检验方法已成为检验短期气候预测统计模型预测效果的常用方法。本文使用的交叉检验方法即从41个样本中取40个样本作训练来预测另1个样本(例如用19601999年的样本作训练来预测1959年,循环往复,直至作出41 a的预测),上述模型所作的41 a交叉检验(19591999年)结果(图2)表明,对降水预测的距平符号正确率为62.3%,使用技巧评分公式:S=N-N0N-N0(6)式中S为预测技巧得分,N为参加评分的总站数(N=4110=410),N 为预测与实况距平符号一致(零为正距平)的站数,N0为随机预报可预测正确的站数,N0=N?2=210,相对于随机预报的技巧评分S为0.246,具有明显的预报正技巧。图2实例交叉检验的结果进一步分析交叉检验的结果显示:虽然根据该方法存在明显的预报技巧,任何5 a及5 a以上的滑动平均也是正的预报技巧,但在41个独立样本试验中也有10个样本是负的预报技巧,占24.4%,若加上6个预报技巧为0的个例,无预报技巧的个例占总数的39%,特别是有5个个例几乎完全相反(报对站数2),占12%。因此该网络模型的预报效果也存在一定的不稳定性。087气象学报59卷 1995-2006 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.5.2该实例人工神经网络模型的稳定性检验ANN模型用于短期气候预测的最大障碍是模型的不稳定性,这里从以下几个方面检验该模型的稳定性(表34和图3技巧中评分均为41 a的交叉检验结果):(1)预报因子(输入节点数)变化对模型预报效果的影响:表3显示随着输入节点数的增加,S增加,但输入节点超过一定数目后,S反而下降,说明这时非线性的不稳定导致的预测效果下降超过了输入因子所引入的信息的改进效果。表3预报因子(输入节点数)变化对模型预报效果的影响输入节点数91213151830技巧评分0.1740.2240.2460.2100.1000.100(2)预报量因子(输出节点数)变化对模型预报效果的影响:图3显示了预报技巧评分S对输出节点较敏感,这时因为影响降水场的随机因素较多,对10个代表站来说,前2个图3预报量因子(输出节点数)和隐含层节点数变化对模型预报效果的影响主分量可能已描述了其主要大尺度特征。(3)隐含层节点数变化对模型预报效果的影响:图3表明预报技巧评分S对隐含层节点数也较敏感,这是因为对短样本的ANN模型,隐含层节点数小于或等于输出节点数时ANN模型效果较好,否则,ANN模型的非线性不稳定将随隐含节点的增加越来越明显。(4)模型迭代次数对预报效果的影响:表4表明该ANN模型对迭代次数并不十分敏感,一般迭代500010000次时网络模型就已十分稳定,再大量增加迭代次数,对预测效果不会有明显改变(实际迭代过程中迭代500010000次能量函数就开始振荡)。表4模型迭代次数对预测效果的影响迭代次数(万次)0.10.20.40.60.81.02.03.05.0技巧评分0.2240.2300.2460.2460.2440.2460.2340.2300.258通过41 a的交叉检验表明,该ANN模型的预测效果随网络输入节点数、输出节点数及隐含层节点数的不同而略有不同,其中输出节点数和隐含层节点数对模型预测效果有较大影响,而模型对迭代次数不敏感。总的说来只要既充分考虑尽可能地输入神经网络模型较多信息,又同时避免过多的网络参数个数,则神经网络模型应有正的预报技巧,且模型是基本稳定的。1876期胡江林等:神经网络模型预报湖北汛期降水量的应用研究 1995-2006 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.6结语本文使用人工神经网络方法建立了湖北省汛期(68月)降水的短期气候预测模型,该ANN模型的输入是汛期前期(24月)的北半球月平均500 hPa场、海平面气压场和太平洋海温场的扩展自然正交展开(EEOF)的前几个主要模态的时间系数,输出是湖北汛期降水场的自然正交展开(EOF)的前2个主要模态的时间系数。通过41 a历史资料的交叉检验表明:样本试验的预报技巧评分平均为0.246,可为湖北省汛期降水预报提供一种有明显预报技巧的预报方法,但对每年的预报效果仍存在不稳定性。对该模型的研究表明,较少参数的ANN模型(限制节点数)在汛期降水预测中较稳定,初步克服了神经网络模型用于短期气候预测的障碍,虽然该方法对其它地区汛期降水的预报效果和其它短期气候预测的项目的预报效果有待进一步证实,但从上述工作的效果和该法的客观性(可用计算机自动实现)来看,它有望成为短期气候预测可客观自动实现的业务预报方法之一。以上工作的不足是未对输入神经网络模型的因子在模型预测中所起的作用进行探讨,模型结构也有待进一步改进优化。除500 hPa高度、海平面气压和太平洋海温外,影响短期气候预测的因子还很多,进一步引入其它因子从理论上说可改善该方法的预报效果。参考文献1M ason S J,Goddard L M,Grabam N E,et al.The IR I seasonal cli mate prediction system and the 1997?98 ElN inoevent.BullAmerM eteor Soc,1999,80:185318732Hsieh W W,Tang B.Applying neural network models to prediction and data analysis in meteorology andoceanography.BullAmerM eteor Soc,1998,79:185518703Shabbar A.Skill of seasonal cli mate forecasts in Canada using canonical correlation analysis.MonW ea Rev,1996,124:237023854Barnston A G.L inear statistical short2term cli mate predictive skill in the northern hem isphere.J Cli mate,1994,7:151315645李学桥,马莉.神经网络工程应用.重庆:重庆大学出版社,1996.37416Elsner J B,Tsonis A A.Nonlinear prediction,chaos,and noise.BullAmerM eteor Soc,1992,13:49607Tangang F T,Tang B,Monahan A H,el al.Forecasting ENSO events.J Cli mate,1998,11:29418Navone H D,Ceccatto H A.Predicting Indian monsoon rainfall-a neural network approach.Cli mate Dyn,1994,10:3053129Hastenrath S,Greischar L,Heerden J van.Prediction of summer rainfall over south Africa.J Cli mate.1995,8:1511151810陈辉,金龙,陈宁等.两种定性天气预报模型的对比分析.灾害学,1999,14(3):121611严绍瑾,彭永清,郭光.月平均温度的神经网络BP型多映射模式.大气科学进展(英文版),1995,12(2):22523212严绍瑾,彭永清,郭光.神经网络BP模型用于月降水预报的研究.大气科学进展(英文版),1995,12(3):33534213郭光,严绍瑾,尹树新.人工神经网络用于我国东部汛期降水预测的研究.南京气象学院学报,1996,19(3):35435714胡江林.神经网络模型用于湖北省月降水量预报的探讨.暴雨灾害,1999,(1):364115陈桂英,赵振国.短期气候预测评估方法和业务初估.应用气象学报,1998,9:17818516张礼平,熊安元,胡宗海.短期气候预测评估方法与湖北省短期气候预测业务水平评估.暴雨灾害,1999,(2):3235287气象学报59卷 1995-2006 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.THE STUDY ON APPLY ING NEURAL NET WORKMODELSTO PRED ICTI ON OF SUMM ER PRECIPITATI ONIN HUBEI PROVINCEHu Jianglin(W uhan H eavy R ain Institute,W uhan430074)Zhang L iping(W uhan CentralW eather S ervice,W uhan430074)Yu Rucong(LA SG,Institute of A tm ospheric,Chinese A cademy of S ciences,B eijing100029)AbstractThe authors constructed artificial neural network(ANN)models of short2termcli mate forecasting to predict summer(June-A ugust)precipitation in Hubei Province.The inputs of the model w ere the extended empirical orthogonal functions(EEOF)ofthe 500 hPa height field,the sea level pressure field in the Northern Hem isphere and seasurface temperature field over the Pacific before summer flood season(February-April),and the outputs w ere the empirical orthogonal functions of the summerprecipitation totals of representative stations.The cross2validation over 41 years hasshow n that the forecasting skill score of ANN models is 0.246.Though the forecastingskills year by year are still unstable,positive skills exist obviously statistically forsummer precipitation forecasting in Hubei Province.Key words:A rtificial neural network,Short2termcli mate forecasting,Cross2validation,Empirical orthogonal functions.3876期胡江林等:神经网络模型预报湖北汛期降水量的应用研究 1995-2006 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.