日最高温度统计降尺度方法的比较研究_徐振亚.pdf
《日最高温度统计降尺度方法的比较研究_徐振亚.pdf》由会员分享,可在线阅读,更多相关《日最高温度统计降尺度方法的比较研究_徐振亚.pdf(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 32 卷第 4 期气象科学Vol 32,No 42012 年 8 月Journal of the Meteorological SciencesAug,2012徐振亚,任福民,杨修群,等 日最高温度统计降尺度方法的比较研究 气象科学,2012,32(4):395-402XU Zhenya,REN Fumin,YANG Xiuqun,et al A comparison study on statistical downscaling methods indaily maximum temperatures Journal of the Meteorological Sciences,201
2、2,32(4):395-402日最高温度统计降尺度方法的比较研究徐振亚1,2任福民2杨修群1曹经福2,3(1 南京大学大气科学学院,南京 210093;2 国家气候中心,北京 100081;3 南京信息工程大学,南京 210044)摘要针对日最高温度的降尺度问题,发展了一种统计降尺度的新方法 优选格点回归法(OPR)。利用该方法与双线性插值法(BI)对平原(山东)和高原(云南)的日最高温度进行降尺度对比分析,结果表明:无论对于平原(山东)还是高原(云南)地区以及夏季(7 月)还是冬季(1 月),OPR 方法都明显优于 BI 方法,特别是从高原地区的均方根误差来看,降尺度效果优势更加明显。进一步
3、对 OPR 方法降尺度过程中所做的方差放大对比分析显示,方差放大后对日最高温度的降尺度效果不但没有改进,在某些方面如均方根误差和极端误差等还有变差的表现。关键词日最高温度;统计降尺度;双线性插值;优选格点回归;比较研究分类号:P434.4doi:10.3969/2012jms 0091文献标识码:A收稿日期(Received):2011-12-12;修改稿日期(Revised):2012-04-19基金项目:全球变化研究国家重大科学研究计划资助项目(2010CB950501);国家自然科学基金资助项目(41175075)通讯作者(Corresponding author):任福民(REN Fu
4、min)fmren163 comA comparison study on statistical downscaling methods indaily maximum temperaturesXU Zhenya1,2REN Fumin2YANG Xiuqun1CAO Jingfu2,3(1 School of Atmospheric Sciences,Nanjing University,Nanjing 210093,China;2 National Climate Center,China Meteorological Administration,Beijing 100081,Chin
5、a3 Nanjing University of Information Science Technology,Nanjing 210044,China)AbstractFor the downscaling problem in daily maximum temperatures,a new statistical downscal-ing method named Optimal Points Regression(OPR)has been developed A comparison study on down-scaling in daily maximum temperatures
6、 in the plain area(Shandong province)and the plateau area(Yunnan province)of OPR and another downscaling method(the Bilinear Interpolation,BI)was carriedout Results show that both for plain area or plateau area in summer(July)or in winter(January),theOPR method is obviously better than the BI method
7、 Especially for the root mean square error in the plat-eau area,the superiority of OPR method is more obvious Then a further research on variance amplifica-tion of OPR method shows that variance amplification did not improve the results,but it led to worse re-sults in some aspects such as RMS error
8、and extreme errorKey wordsDaily maximum temperatures;Statistical downscaling;Bilinear interpolation;Opti-mal point regression;Comparative study引言为了提高区域气候的模拟精度,通过降尺度方法将 GCM 信息转化为区域尺度的地面信息非常必要。目前常用的降尺度方法主要有两种:一种是动力降尺度方法,另一种是统计降尺度方法1-3。动力降尺度采用区域模式或者有限域模拟嵌套预报,这种方法需要较好的资源以及计算机条件,通过嵌套的区域模拟可以获得较高分辨率的局地气候变量
9、,从而达到时间和空间上的降尺度。而统计降尺度方法则相对简单,利用多年的观测资料建立大尺度气候状况(如大气环流)和区域气候要素之间的统计关系,并用独立的观测资料检验这种关系,最后再把这种关系应用于 GCM 输出的大尺度气候信息从而得到区域的气候信息。对于温度的统计降尺度,这些年来,国内外已做了许多研究。Kostopoulou,et al4 用 ANN,MLR,CCA 三种统计降尺度方法模拟了年尺度上的希腊最高最低温度。刘兆飞等5-6 利用统计降尺度模型SDSM(Statistical Downscaling Model)对塔里木河流域渭河流域未来年和月最高气温和最低气温进行分析。王山旗等7 也利
10、用 SDSM 在季节尺度上对江苏地区最高,最低气温进行了模拟。范丽军等 8-9 利用主分量分析,EOF 与逐步回归分析相结合的多元线性回归模型,对华北华东的月平均温度进行了研究。而在逐日温度的降尺度方面,Huth 用典型相关分析,主分量分析、奇异值分解和多元线性回归方法模拟中欧地区日平均温度10。Paulin Coulibaly 在研究加拿大东南部逐日极端气温时比较了 GeneticProgramming(GP)和 SDSM 方法11。GP 方法是基于建立大尺度因子与模拟值的联系这样一种思想,但是与传统方法不一样的是,GP 方法建立模型时并未确定模型的形式,而是通过反复试验迭代计算得到最终模型
11、。该方法的好处在于模型更加精确,但是相应的,反复试验导致计算量比较大。曾晓青等12 在研究青海省日最高最低温度时,比较了单隐层神经网格和多元回归这两种方法。可见,对于逐日温度的统计降尺度,前人的研究主要是利用某类统计学方法针对较小区域的,这对于大范围的降尺度问题,计算较为繁琐;而 SDSM 方法主要是针对一段时间内服从于某一分布特征的要素的随机再现,而对于某日气温之具体降尺度问题,则不是一个合适的方法。因此,能否发展一种简洁而有效的降尺度方法就显得十分重要。插值方法无疑是最简单的降尺度方法,国外学者也应用不同的插值方法进行了一些降尺度研究13-14,但由于它将所有相邻信息毫无区别地完全同等对待
12、,使其难以成为一个十分有效的降尺度方法。因此,一个很自然的问题是我们能否针对上述问题改进插值方法,使其不仅简洁,而更加有效呢?本文正是在这方面所进行的改进尝试,并由此提出了一种新的统计降尺度方法 优选格点回归(Optimal Points Regres-sion,OPR)方法。1资料与方法介绍1.1资料观测资料来自国家气象信息中心提供的中国均一性历史气温数据集,为 19602004 年 1 月和 7 月山东 14 站以及云南 21 站的逐日最高温度资料。采用 19602004 年 NCEP 再分析 2 m 逐日最高温度资料用于降尺度分析,网格为 T62 高斯格点,全球192 94 个格点,最粗
13、分辨率为 210 km。1.2两种方法图 1双线性插值示意图Fig 1Diagram of bilinear interpolation1.2.1双线性插值(Bilinear Interpolation,BI)图 1 是双线性插值示意图,点 P(x,y)是要插值的点,已知 Q11(x1,y1)、Q12(x1,y2)、Q21(x2,y1)、Q22(x2,y2)四个点的值 F(Q11)、F(Q12)、F(Q21)、F(Q22)。首先在 x 方向进行线性插值,得到F(R1)x2 xx2 x1F(Q11)+x x1x2 x1F(Q21),R1=(x,y1),(1)F(R2)x2 xx2 x1F(Q12
14、)+x x1x2 x1F(Q22),R2=(x,y2)(2)然后 y 方向进行线性插值,得到F(P)y2 yy2 y1F(R1)+y y1y2 y1F(R2),P=(x,y)(3)其中 F 为某点的要素值,x 为经度,y 为纬度。1.2.2优选格点回归(OPR)在反复试验基础上发现,当将所有相邻格点资料都参与插值时,由于各格点资料与所关注台站资料的相关性存在较大差异,相关性差的格点资料必693气象科学32 卷将影响到插值结果;而且,单纯的插值技术是不能有效地从模式的大尺度格点数据降尺度到所需站点上的。因而提出了优选格点回归方法,该方法是通过优选相邻格点从而建立台站数据与模式的大尺度格点数据之间
15、的回归关系来实现降尺度的。该方法包括以下技术步骤:(1)确定相邻格点为了便于描述,首先给出几个概念:基站定义为需要降尺度的台站;格点定义为大尺度资料所对应的网格点。在此基础上,某一基站的相邻格点可定义为与该基站相距不超过指定距离的格点。为了确保每个基站都有一定数量的相邻格点数,可以将指定距离 D 与大尺度资料所对应的网格分辨率挂钩,其数学定义如下d D,D=2R(4)其中 d 为格点与该基站之间的距离,R 为大尺度资料所对应的网格分辨率,两者的单位均为 km。当网格分辨率在不同方向上(如经纬度方向)不一致时,通常取大值者(本文最粗分辨率为 210 km,故 D 设置为 420 km)。不难理解
16、,上述取法所得到的相邻格点数一般大于 10。图 2 为相邻格点选取示意图图 2相邻格点选取示意图Fig 2Diagram of selection of neighboring grid points(2)优选相邻格点经反复试验,确定优选相邻格点原则如下:(1)根据基站与相邻格点之间的逐日要素(本文为日最高温度)序列相关性由高到低的顺序进行优选;(2)确保有一定数量的相邻格点入选,且按照入选数量多选优先(后面有进一步解释)的原则进行;(3)入选相邻格点数量越多,相关性要求越高。制作了优选格点入选条件顺序表(表 1)。针对某一基站,假定该基站拥有的相邻格点数为 N 个,按照上述原则优选过程如下:
17、(1)计算基站与相邻格点之间逐日要素序列的相关系数,N 个相关系数由高到低依次为 r1,r2,rN。(2)将上述顺序排列之 N 个相邻格点进行 6 等分,依次得到 5 个等分点(含)之前所拥有的格点数依次为 N1/6,N2/6,N3/6,N4/6和 N5/6,其中各数值为向上取整(如“2.2”向上取整为“3”)所得之数值,容易理解这些数值满足 0 N1/6N2/6N3/6N4/6N5/6 N。(3)按照入选相邻格点数量多选优先的原则,依次比较第 N5/6,N4/6,N3/6,N2/6和 N1/6这5 个相关系数 rN5/6,rN4/6,rN3/6,rN2/6和 rN1/6,假定相关系数 rNj
18、/6(j=1,或 5)首次满足了表 1 的要求,则前 Nj/6个相邻格点即为所选之优选格点。表 1优选格点入选条件顺序表Table 1The order list of selected conditions inselecting neighboring points条件入选格点数rN5/60.7相关系数最大的前 N5/6个相邻格点0.6rN4/60.7相关系数最大的前 N4/6个相邻格点0.5rN3/60.6相关系数最大的前 N3/6个相邻格点0.3rN2/60.5相关系数最大的前 N2/6个相邻格点rN1/60.3相关系数最大的前 N1/6个相邻格点(3)多元线性回归模型建立多元线性回归
19、15:假设一个基站,某日的观测值为 Y,对于它的 P(在此 P=Nj/6)个优选相邻格点,在该日的模拟值分别为 X1,X2,Xp 1,Xp,则多元线性回归模型为Y=0+1X1+2X2+pXp,(5)其中,0,1,p为回归系数,对 Y 和 X1,X2,Xp 1,Xp取 n 天不同的值,则有Y1=0+1X11+2X12+pX1p,Y2=0+1X21+2X22+pX2p,Yn=0+1Xn1+2Xn2+pXnp(6)用最小二乘法求得上述回归系数,代回方程组,则得到模拟值序列。1.3方差放大技术在用多元线性回归方法数据模拟时,模拟序列的方差通常远小于实际值序列的方差。而对模拟数据进行方差放大技术处理后,
20、常常可以改善模拟效果。方差放大技术思路16 如下:7934 期徐振亚,等:日最高温度统计降尺度方法的比较研究假设已知实际值序列 T,模拟值序列 T1。则方差放大序列 T2为T2=珔T1+VAR(T槡)VAR(T1槡)(T1珔T1),(7)其中珔T1为序列 T1的均值,VAR(T),VAR(T1)分别为序列 T,T1的方差。2降尺度结果对比分析考虑到中国地形复杂,台站的海拔高度差异较大,本文选择的代表站为山东济南站(36.68 N,119.98 E,海拔:57.8 m)和云南楚雄站(25.02 N,101.52 E,海拔:1 773.4 m),相应的区域则是山东省以及云南省,其中山东省共 14
21、站,海拔高度普遍小于 100 m,属于比较典型的平原地区,云南省共 21站,海拔高度都超过 1 000 m,最高可达 3 000 m,属于云贵高原地区。图 3两种方法对代表站 7 月份逐日最高温度降尺度的误差序列(a)济南站;(b)楚雄站(横坐标表示从 19602004 年 7 月份所有天数按顺序排列)Fig3Maximum temperature error series of the two statistical downscaling methods for representative stations in July at(a)Jinan station and(a)Chuxion
22、g station(Abscissa shows all days in July from 1960 to 2004 in time order)2.1代表站降尺度结果对比图 3 是两种方法对代表站 7 月份逐日最高温度降尺度的误差序列。可以看出,相对而言,两种方法对济南站的降尺度结果比较接近;而两者对楚雄站的降尺度结果则相差非常明显,两条误差序列甚至没有重合的值域。从效果上看,对于楚雄站,OPR方法的误差序列始终在零值附近,而 BI 的结果远离零值,表明 OPR 显著优于 BI 方法;对于济南站,OPR 方法和 BI 方法的误差序列均在零值附近,但看上去 OPR 方法的结果似乎更接近零值。
23、为了进一步比较济南站的降尺度效果,制作了图 4。图 4 给出了 19602004 年 7 月份济南站观测、OPR 和 BI 最高温度的概率密度函数分布。可以发现,OPR 方法降尺度后模拟值的分布与观测值较为接近,峰值都在33 附近,但对24 30 的模拟偏多,而对 31 35 的模拟偏少。BI 方法模拟值的峰值(28 左右)则显著小于观测,对日最高温度模拟总体上明显偏低。为了更清楚地了解两种方法降尺度效果的具体差别,表 2 给出了两种降尺度方法对代表站 7 月份逐日最高温度降尺度的效果统计。从相关系数来看,OPR 方法优于 BI 方法:对于济南站,OPR 方法回归样本拟合阶段的 0.75 高于
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最高温度 统计 尺度 方法 比较 研究 徐振亚
限制150内