(2.5.1)--水文频率计算中参数估计方法的统计试验研究.pdf
《(2.5.1)--水文频率计算中参数估计方法的统计试验研究.pdf》由会员分享,可在线阅读,更多相关《(2.5.1)--水文频率计算中参数估计方法的统计试验研究.pdf(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、水利1950年6月SHU IL I学报XUEBA第3期水文频率计算中参数估计方法的统计试验研究2)提要本文采用统计试验 方法,对于p一丁 型曲线分析对比了矩法、极大似然法和适 线法.在适线法中分析比较了七种不 同的适线准则,并着重比较了其中的平方准则甲,和绝对值准则甲:,同时也分析比较了各种不同的 经验频率公式.另外,还研究了历史洪水的作用.大量计算结果表明:矩法所得的设计值X,其期望值EX,比总体真值心偏小较多,不够安全,极大似然法虽具有较好性质,但由于P一l 曲线在C.2时似然方程无解,因此无 法普遍使用;在适线法中发现适线准则对结果的影响很大,中2准则配合期望值公式(简记为中:-万)一般
2、能使EX,稍大于;,二,=了1可了不二萝于厂较小(与矩法接近),因此,2一w适线法是较好的一种估计方法,应予采用考虑 历史洪水一般使EX,增 大、二,降低,因此是提高计算成果质量的重要措施给 出了历史 洪水折算长度的参照数值,计算了历史洪水误差的影响.并修正了计算设 计洪 水安全改正值用的B值图。引言(一)研究目的在各种水利工 程的规划设 计中,都需要 进行水文频率计算工 作,以确定某种暴 雨、洪水特征的概率分布函数(或称频率曲线),从而 进一步定 出有关的设计值.在根据 某 些理由选定概率分布函数的型式以后,确定分布函数的问题就变成估计分 布中所含的参 数.这就是本文所要研究的问题.参数估计
3、的方 法,在数理统计 中常用 的有矩法、极 大似然法等.但在我国水文计 算工作 中,由于认为矩法算得的C:抽样误差较大,极大似 然法对求解的精度要求过高,以致使用不便,因此 这两种方法都很 少使用.主要 是使用 图解适线法.但是 从参数估计的标准来看,这三种方法究竟哪种最好?由于问题比较复杂,所以长期没有得到解决.2中对此曾做了部 分研究,但由于所用的几”he r一T ippe t七分布只含有二个参数,因此对我 国广泛使用的、包含三参数的尸一l型曲线,其结论未 必适用.其次,在适线法中又有许多不 同的经验频率公式,究竟哪种公式才 是最好?这一问题虽曾做过不少研究,但是都没有以参数估计 的基本标
4、准为依据,所以问题没有真正解决.最后,在我国设计 洪水工作中,广 泛地*本文为参 加飞979年9月 列宁 格 勒国际 水文计算学术讨 论会的论文.1)华东水 利 学 院,2)南 京水文研究所,3)水利水 电科学研 究院;4)电力工业部西 北 勘 测设计 院。DOI:10.13243/ki.slxb.1980.03.001水利学报9081年使用历史洪水,根据初步 分析”,这种作法对于提高成果的可靠性是有帮助的.但还有必要做进一 步探讨,以明确其正确使用的条件并对其效果做出定量估计.这些就是本 项研究所要解决的主要问题.(二)总体及样本设X 为某种水文随 机变量,由于目前我国广泛使用P一l 型曲线
5、,因此在本文中,总体就采用尸一l型分布,其密度函数如下:、。、1/劣一“、7【了劣一“、飞(J介 气从为一不不瓦.万气一万一/已砂飞一、一下一-夕f,(1)其中二。,下0,分布函数如下:,一“、?一丁,(,;。、”、,d,一,;“、”、,(2)其中a,月,下为三个未知参数,它们与常用的三个数字特征E了,C。,C:(以下也称 为参数)的关系 如下:El一“+脚;c。一侧万(/,十“/脚;C,一2/侧亨,(3)、,_,、。1一、,_.,。或“二石人 以一2“。八户“了石人V。V,一4/;,(4)其中E了为了的数学期望,口。=。/刀万为X 的变差系数,。为X 的均方差,C:为了 的偏态系数.根据水文
6、变量 的物理性质,容易推知月o,夕o,“)0.下面,为简单起见,对于随机变数和普通变数,除个别情况外,一律用小写字母表示。参数估计需要根据样本来估计总体的a,月,下,或E了,C。,C,。们我考虑 两种样本.1.简单样本设有X 的。个独立观测值,在按大小排列后 得到以下简记为2。非简单样本气势劣2)劣。,多.,饥=1,2,肠。(5)(6)也称为 不完全样本.在设 计洪水 中考虑历史洪水时,一个 样 本在按大小排列后可表示如下:a项男1(N)必2(N)牛。(万),。一 1项/一-一一一一一一 一一一-一一劣1(。)公:(,)一劣,一;(。),(7)其中N表示非简单随机样本的长度,“为实测系列 的长
7、度;前面杯项表示特大值,一般系通过历史考证和野外调查而得,但也可能包括实测系列中子项特大值(。不夯O),统称历史洪水;姿,(N)为在N年中由大 至小排列的第s项;,(,为实测系 列中其余。一l年中按由大至小排列 的第项.所以一个一般的非简单样本,共有三个特征数N,。,a,乙为随样本而变的随机变数.为简单记,下用劣耐仍=1,2,“,a+1,“十2,“十.一了(8)统一表示样本中的前后两部分显然,式(6)是式(8)的一种特例.(三)评价估计方 法好坏的签 本标 准给定一个样本后,就可使用某种参数估计方法估计出三个参 数.为 了区分,以“。,第3期水文频率计算中参数估计方法的统计试验研究月。,下。(
8、或,。,c。,C:。)表示总体的参数值,亦 即参数的真值;以a,刀,7(或云,c。,C,)表示估计 值.将a,刀,代入式(2),再根据指定 的夕,即可由下式求得 相应 于少的设计值男,:丁,劣;。,“,d劣一,(p;议,“,一,山p(9)为 了与估计值二,区分,以畔表示二p的真值,即川 满足丁,(:;。,“。,。,d一夕“;。,”。,。,一,(10)二芸设 以g(,)表示二,的抽样分布的密度函数,则评价估计方 法好坏的基本标准,应是 期望损失“L(:,二;)一工L(二,。(,d,(11)为最小.其中L(二,畔)为损失函数,表示 当设计值劣p不等于畔时所引起 的经济损失.但由于L(二p,二吕)的
9、影响因素十分复杂,难以可靠地确定.因此 我们仍采用抽样分布的前二阶矩进行比较.设以夕代表历,C。,C,劣,中的任一个.口。代表相应 的总体真值。如能求出夕的数学期望E 夕及夕对真值0。的均方误差。0侧牛百i万二瓦弃一则比较两种估计方法的E夕及时就可鉴别好坏:即要求E O尽可能接近夕。,。0尽可能小.这就 是不偏性和有效性的标准.由于我们在工程中实际使用 的 是留,而不是参数本身,因此比较时应以E劣。和。劣,作为主要 指 标.如图1所示,就应选用A法.当然,比刀0和。夕更全面的标准,应是比较两种估计方法所得0的抽样分布,并结合工程规划设 计要求加以选择.如从工程安全考虑,可要求E O稍大于0。,
10、使80。的可能性小一些。尔甲似只,此丸。尤冰乙.P,“之,。、之户图IA、丑两种估计方法所得r,的抽样分布示 意图(四)MonteCa rlo方法及其精度 控制由于要用分析方法确定刀 0,a0(特别是刃二p与,二p)比较困难.因此本文采用Mon t。a Clro(以下简记为万一C)方法来确定玉,C”,C,肠 的期望值与均方误 差的近似值,记 为仍0与刃,以区别 于理论值刃口与。.0关于万一C方法的一般内容,可参看6,7,8.这里 只指出,所用计算机中生成伪随机数的子程序系采用乘同余法,对所生成的伪随机数曾做了专门的统计检验,结果是满意的.下 面简要说明M一C方法的精度控制.设刀为被模拟的随机变
11、量,刃刀、-o勺为其期望值与均方差,M一C方法是用刀的样本平均数1仍刀“面艺刀来估计刀刀.当K、c o时,不论刀的分布如何,、刀一刀,趋于 N(0,水利1980年。可斌万)分布.于是有8犷了厅叮P哪,一刃叫。二一里三.扮了2二t2。:dt设采用月9 5.5%的置信水平,则。侧了/。刀2.假定允许的相对误差 为。%,即。/刃,e%,于是可得二钊警)。:,(12)其中O,二,刀/E刀.例如,对于”=二p,O,=。二p/刃二,在本文所有计算方案中,其最大值约为。.6 3.当。=5时,要求 了)6 40.在本文中,在多种不同的刀当中,以,二(劣p一畔).对了的要求最高。这时,经过推导可得D刀一,刀一种
12、,。,一灿受,+4(日”种:,p+小挤,p),(1 3)其中刁一加p一冲,二,为p的,阶中心矩,可由万一叮计算给出其近似值,于是可以进而算出,。及。,一。:/二。.在本文所有计算方案中,c。,一般不超过1.4,故以仍。一资又g艺(娜一畔)逼近E刀二E(二,一川)盆,二,要满足。二 5的误差 限时,K)3 2。,由于我们实际使用的是。二p,所以应对,二,要求5%的误 差限,这时o 二p的误差限应为1 0%,于是了80 0.事实上,同一个。所要求的K,不仅与统计量,的 内容有关,且与估计方法,总体参数、样本特征以及设计频率P等因素有关.但为便于比较和简单起见,本文对矩法和极大 似然法,一般取了二1
13、00 0;对于计算时间较长 的适线法,一般取了二5 0。,这时在各种方案中,对f要求最高的描p,其相对误差一般不超过6。5%。二、估计方法及其 计 算以下只对非简单样本(8)给出有关算式,简单样本可由N“,a弓=O得到。(一)矩法在(8)中,由于在N项当中有N一(。一忍十司 项是 未知的,考虑 到抽样的随机性,我们采用常用的作法,即以。一l项实测系列的一、二、三阶矩来估计除妞项特大值外的N一。项 系列的同阶矩这样即可得出估计。,久。,O,。的公式如 下:二1/万二二二二二在刀习公。十门丝二聋省二、-(14)命,万一!郭令一 1)登辈二茸(令一,)朴%,c s一丽最刃不点冷一1)嵘矛二或(令一l
14、)(二)极大似然法(以下简记 为万一L法).万一L法是求似然函数达到极大的一组参数作为估计值,和矩法计算一样,由于在非第3期水文频率计算中参数估计方 法的统计试验研究简 单样本中存在未 知项,我们令二一乙项实测系列 的似然函数的几何平均等于除去特大值外的N一a项系列的似然函数的几何平 均.于是对非简单样本(8),其似然函数为:L一nf(二翩InL一艺Inf(二,)+压气生二亡,、1二上巴11_J又劣.)l几 一,刃肠肠+IJ(1 7)N一a%一l任+件一正艺刀 玉 任+1Inf(二二)。(18)对于P一l型曲线(1),容易验证,当a二。,。一:,(二。*。一为样本中的最小项,以下简记为劣,。)
15、,且下2)时,不论 月取何值,L”c o.故极 大似然 法的解不包括这种情况。在求使n IL达 到极大 的“,月,邓寸,一般根据刃nL/9“一。,决nL/9月二 o及决nL/9下一。三公式联立求解,如仁4.但对于a,由于(1)的性质,不满足 用功nL/无一。求解所需的条件:f(二;。,月,为的变域与a无关(或对所有。,f(二;“,召,均在曲线 的二个端点皆为。)仁。,因此采用 以下求解方法.由刃nL/9尽一O,可得_,_1二,五人一月7十a-下犷一!么劣,+工VL仍二lN一a几一乙住十路 一不叉二。(19)与式(14)比较,可知对E了的极 大似 然估计与 矩法估计相 同,故 上式右 端亦 记为
16、历.由glnL一百于一 O,得到r,(犷)1上_N一a匡竺了1_-书,一一l l lr=二二l;lf l(劣一一以)+In助_一g)卜In(一以).(2 0)f(犷)一万卜班少,一“一仍一了几一乙_三 尸,、仍声!“一、一/.、自.产在有了一个样本(8)之 后,先由(19)算出云.再 假定一a值,则 由(2啊解得下,再 由(19)可算出相应的 刀.进而可求出L或InL.在(o,二。)中假定不 同的a,求出 n IL局部极 大值所相应的a,月,下.比即为极 大似然法的解.具体计算时,采用0.6 18法优 选a值.当a在(o,公。,)中n IL无局部极大时,表 示似然方程无解.这时采用以下估计方法
17、:由式(19)计算云,由式(15)计算C、,a一二。,这等价 于c,一 2一二生-一一c。.(21)必一劣斑汤将a的优选范围限于(。,二:。),这是 由于考虑水 文变量的物理 性质,一般必须“)。,至于a劣二,、,则是 由于 当“一劣.,二时,由(2 0)解得 的下一 o,即C:二o o,C。二c o.即这组解无意义.(三)适线 法1.适线法 的解析表示适线法本是一种图解方法.为上机计算,必须用解析形式表达出来。采用某种 经验频 率公式,对(8)中的每一。都规定一个夕.与之对应,将各对数值(尹。,%),哪一1,.2二,”十a一l,逐个点绘在机率格纸上,共得。十口一l个“经验点据”.如图2所示。
18、先由(14)算出云.可以证 明对于期望值的这个估计具有不偏性而且方差最小,因此不需要通过适线法来确定.再假定一组O,C,就可以求出相应 于这一组牙,C。,认的频率曲线:夕一尸(二;厉,C。,C:),如 图2中的虚线所示.求出这条曲线与经验点据的纵向离差d劣。及横向离差刁夕。,这 里口劣一劣一劣(尹.),哪=1,2,肠+a一乙(2 2)9108年其中州夕砂为满足下式的二值:“二;,叮t,!,“二一,一(23)刃(p仍)刁尹。一 夕一夕(劣璐),(24)其中,(!二)一丁,(另;云,C。,言)d二一,(,.;,C。,c吕)(25)劣祝式(24)计算的刁,.,柑当于在均 匀分格 的格纸上点据与曲线的
19、横向离差.也可采用在海森 机率格纸上点据与曲线的横向离差,记为刁夕击,可由刁夕。经适 当变换而得。(1)适线准则.作为拟合曲线与经验点据忿t笼(氏j-礼爪六丈,)图2适线法 示意 图间离差的量度可有多种不 同的指 标,如中;=召刁劣孟,尹2万1刁劣。I,价3一另1刁劣。/,尹二另刁夕孟,尹。习夕.,尹。另刁夕柔,尹7“另1刁夕川,尹。一另1刁二矿刁尹.等.取不同 的指标达到最小.来求解C。,C:,就构成不 同的适线准则,如根据沪1万二孟,俪来求解C。,C:就称为尹,准则,余类推.一般,对于 同一样本,不 同的准则,所p得的结果也就 不 同.由于2中 的Gumbe l方法相 当于采用尹:准则,其
20、回归方法相当于采用尹,准 则,而2中结果表明Gumbe l法不如回归法,因此尹。准则我们 不予考 虑.对其余准则都做了计算比较,并着重比较了叭(下称平方)准则和少:(下称绝对值)准则.(2)经验频率公式.适线 法中使用的经验 频率公式,有很多种类,10中列出了8种,本文使用的公式如 下.I)简单样本.对简单样本二。,一1.2,”.经验频率公式的一般形式为夕,一(、一b)/(二十。),二一1,2,。.(2 6)为了使由上式所确定的“个尹,对于夕一5 0%能成为对 称的,可以证明乙,“必须满足Zb+e=1。(27)于是经验公式 的一般形式可进 而写成:仍一b尹。不不万二百犷,饥一1,2,.,叭(2
21、8)常用的公式有三种,即b一。时 的Weibul l公式,b0.5时的Chegoda了ev公式及b=0.5,时的H“en公式.本文主要计算这三种公式.至于10中的Tuk ey、l Bom,Gri ngo te n三个公式分别相 应于b=1/3,0.3 75,0.4 4。因介于吞一 0.3和0.5之 间,故不作考虑。l)非简单样本.对二.中前面 的a项特大值,其夕.显然应为:饥一b甄一了石下获,那一1,2,”,“(2 9)对于二.中后面。+。一了项实测值,其夕.的确定在我 国曾使用两种不 同公式,本文计算绪果表 明,其中以下式12较好:第3期水文频率计算中参数估计方法的统计试验研究a一N+1N一
22、a十1十一一,丽户价丁-一.二y十上刃Z一a朴一乙+l;哪一。十 1,a+2,“+肠一乙.(3 0)一种适线准则结合一种经验频率公 式,就构成一种适线方法.于是上述 的7种准则、3种公式就 可组合成2 1种不 同的适 线方法,如尹一万,叭一C,沪一H,1,2,7,分别表示以尹准则结合Weibull公式,Chegoda了ev公式,Ha:en公式.2.适线法 的求解方法由于不 论采用何种指标作为离差 的度量,它 们做为C”,O,的函数,都非常复杂,故要求使尹、,感1,2,一,7,达到 最小的C。;,Cs、,只能用 数值方法.解此问题可用 的数值方法很多,由于指标的函数形式多样,我们统一采用模型搜索
23、法“.通 过验算,此法对于适 线法优 选参数是准确可靠的.三、成果 综 合 与分析(一)计算方案与成果表为便于对成果进行分析比较,将计算方案统一编号.一种计算方案包括三项内容:1.总体参数.所有方案中,总体期望值二。一100 0,二组基本的参数为:(1)O。一 0.5,C:。一2.。;(2)C:。二 1.0,C:。一 3.5.其余方案的参数详见各表.2.样本特征.三种基本情形为(1)N一扑一2 0,a一。;(2)N。一5 0,a一。,(3)N10 0,外2 0,a“1,其余情形 详见各表.3.估计方法.比较 的主要方法为矩法,M一L法以及 适线法中的中,一W,尹,一C,中,一H,尹2一W,尹2
24、一C,中2一H.其它适线 方法见表1.评价估计方 法的主要指标为,二p和“,设计频率夕主要考虑两种:夕,1%,夕:-0.1%.表2给出了6种尹值的相应结果。本文共 计算了14 0个方案以上.(二)三种估计方法 的分析比较1。矩 法成果表明,矩法所得的参 数的平 均值二C。,、C:比总体真值都要偏小,特别是“C,比C:。偏小更多,从而导 致“,也较真值偏小.N,”,a,夕愈小,c。,C,。愈大,偏小愈多如呱9所示,o:。一 35,”C,22,偏小37%,哪斗2偏小2 3%当有历史洪水时,偏离值有所减小,但仍然偏小.因此在设计 工作中,当采用包含三阶矩参数的线 型时,使 用矩 法计算,对于工程安全
25、是 不利的.2中得 出矩法估计基本上不偏,是 由于所使用 的F 抬he r一i Tpp“t分布,只包含EX,o 工两个参数,不存在估计C:的问题(C,。114)3中“娜 也比夕。偏小,不过偏小较 少,是由于使用的是 两参数Gam m“分布,o:。三2。,也不需要估计C。的缘故.4中c:需要估计(C,。一1),因此,稀 偏小程度与本文基本相 当我们研 究矩 法的 目的,除为了和其它方法进行比较外,主要是为了研究历史洪水 的作用,特别是历 史洪水误差的影响,这将在下 面说 明.2极 大似然法(1)将酝1与 瓦1 2进行对比,可 以看出M一L法的结果 的确优于矩法,其“肠 较接近真值,“娜 又小对丸
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2.5 水文 频率 计算 参数估计 方法 统计 试验 研究
限制150内