最新B0资源短缺风险综合评价模型及其应用-Logistic回归方法-马氏距离.doc
《最新B0资源短缺风险综合评价模型及其应用-Logistic回归方法-马氏距离.doc》由会员分享,可在线阅读,更多相关《最新B0资源短缺风险综合评价模型及其应用-Logistic回归方法-马氏距离.doc(62页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-dateB0资源短缺风险综合评价模型及其应用-Logistic回归方法-马氏距离基于模糊概率的水资源短缺风险综合评价模型及其应用基于模糊概率的水资源短缺风险综合评价模型及其应用摘要: 本文基于模糊概率理论建立了水资源短缺风险评价模型,可对水资源短缺风险发生的概率和缺水影响程度给予综合评价。首先构造隶属函数以评价水资源系统的模糊性;其次利用Logistic回归模型模拟和预测水资
2、源短缺风险发生的概率;而后建立了基于模糊概率的水资源短缺风险评价模型;最后利用判别分析识别出水资源短缺风险敏感因子。作为实例对北京市19792008年的水资源短缺风险研究表明,水资源总量、污水排放总量、农业用水量以及生活用水量是北京市水资源短缺的主要致险因子。再生水回用和南水北调工程可使北京地区2010和2020年各种情景下的水资源短缺均降至低风险水平。关键词:模糊概率;Logistic回归模型;判别分析;水资源短缺风险;敏感因子;北京一1.研究背景近年来,受气候变化和经济社会不断发展的影响,水资源短缺问题日趋严重,对水资源短缺风险的研究已引起了广泛的重视。国外的许多学者开展了这一方面的研究,
3、如探讨优化调度模型中参数的模糊不确定性引起的水资源短缺风险问题,以及有关河流水质管理、水库灌溉等引起的短缺风险问题。北京位于华北平原西部,属暖温带半干旱半湿润性季风气候,由于受季风影响,雨量年际季节分配极不均匀,夏季降水量约占全年的70%以上,全市多年平均降水量575mm。属海河流域,从东到西分布有蓟运河、潮白河、北运河、永定河、大清河五大水系。北京是世界上严重缺水的大城市之一当地自产水资源量仅3999亿m3,多年平均入境水量1650亿m3,多年平均出境水量1160亿m3,当地水资源的人均占有量约300m3,是世界人均的1/30,远远低于国际公认的人均1000m3的下限,属重度缺水地区。水资源
4、短缺已成为影响和制约首都社会和经济发展的主要因素。为此我们大力研究水资源短缺这个问题。我们要解答的问题是:1 以北京为例,评价判定北京市水资源短缺风险的主要风险因子是什么?影响水资源的因素很多,例如:气候条件、水利工程设施、工业污染、农业用水、管理制度,人口规模等。2建立一个数学模型对北京市水资源短缺风险进行综合评价, 作出风险等级划分并陈述理由。对主要风险因子,如何进行调控,使得风险降低? 3 对北京市未来两年水资源的短缺风险进行预测,并提出应对措施。4 以北京市水行政主管部门为报告对象,写一份建议报告。(1) 北京市水资源短缺风险影响因子分析北京市水资源开发利用中存在的问题主要有:(1)上
5、游来水衰减趋势十分明显;(2)长期超采地下水导致地下水位下降;(3)水污染加重了水危机;(4)人口膨胀和城市化发展加大了生活用水需求等。因此,导致北京水资源短缺的主要原因有资源型缺水和水质型缺水等。影响北京水资源短缺风险的因素可归纳为以下两个方面:(1)自然因素:人口数;入境水量;水资源总量;地下水位埋深;(2)社会经济环境因素:工业用水量;污水排放量;COD排放总量;第三产业及生活用水量;农业用水量。1.水资源短缺风险评价指标11风险率根据风险理论,荷载是使系统“失事”的驱动力,而抗力则是对象抵御“失事”的能力。如果把水资源系统的失事状态记为F(),正常状态记为S() =P XtF ( 1
6、)式中:Xt为水资源系统状态变量如果水资源系统的工作状态有长期的记录,风险率也可以定义为水资源系统不能正常工作的时间与整个工作历时之比,即 ( 2 )式中:NS为水资源系统工作的总历时;It是水资源系统的状态变量。It= 水资源系统工作正常()水资源系统不正常工作()12风险度用概率分布的数学特征,如标准差或半标准差-,可以说明风险的大小。和-越大,则风险越大,反之越小。这是因为概率分布越分散,实际结果远离期望值的概率就越大。 (3)或 (4)用、-比较风险大小虽简单,概念明确,但-为某一物理量的绝对量,当两个比较方案的期望值相差很大时,则可比性差,同时比较结果可能不准确。为了克服用-可比性差
7、的不足,可用其相对量作为比较参数,该相对量定义为风险度FDi,即标准差与期望值的比值(也称变差系数) (5)风险度不同于风险率,前者的值可大于1,而后者只能小于或等于1。根据表1及公式(2)(3)(5)得出如下表 : 风险率a0.466670.466670.533330.50.46667期望40.45667 19.35067 11.45820 9.65390 29.33267 方差27.7660437.5264810.2372416.6952989.27041标准差5.18078 6.02292 3.14579 4.01731 9.28950 风险度0.12806 0.31125 0.2745
8、4 0.41613 0.31669 (2)水资源短缺影响因子分析。根据32中提出的水资源短缺风险影响因子,利用Mahalanobis距离法筛选出水资源短缺风险敏感因子,见表5。从表5中第3栏可以看出,水资源总量、污水排放总量、农业用水量、生活用水量在步骤1至步骤4中移出模型的概率均小于01,同时在每步中这4个变量均使得最近的两类间的Mahalanobis距离最大因此,这4个变量是影响北京地区水资源短缺风险的敏感因子。步骤影响因素容许度移出概率最小马氏距离的平方组间1工业排放总量1.000 0.0892工业排放总量0.6820.020 0.1842,5水资源总量0.6820.000 0.2361
9、,4工业排放总量0.3910.0280.8471,53水资源总量0.6780.000 0.7222,4农业用水量0.460 0.0341.2272,5工业排放总量0.2510.0356.550 1,54水资源总量0.3280.000 1.3852,4农业用水量0.1230.0031.2422,5第三产业用水量0.1020.0232.9632,5表5 敏感因子筛选二2基于模糊概率的水资源短缺风险评价模型的建立最具代表性的风险定义是由Kaplan提出的,并得到国际社会广泛的认可,即 (6)(1) 式中:si为第i个有害事件;i表示第i个事件发生的频率;pi(i)表示第i个有害事件发生的可能性为i的
10、概率;xi表示第i个事件的结果;pi(xi)表示第i个事件结果为xi的概率,风险模型采用了向量的表示形式。借鉴Kaplan的定义,本文认为水资源短缺风险是指在特定的环境条件下,由于来水和用水存在模糊与随机不确定性,使区域水资源系统发生供水短缺的概率以及相应的缺水影响程度。基于上述理由设计了基于模糊概率的水资源短缺风险评价模型。21基于模糊概率的水资源短缺风险 对于一个供水系统来说,所谓失事主要是供水量Ws小于需水量Wn,从而使供水系统处于失事状态。基于水资源系统的模糊不确定性,构造一个合适的隶属函数来描述供水失事带来的损失。定义模糊集Wc如下: ( 7 )式中:x为缺水量,x=Wn-Ws;w(
11、x)为缺水量在模糊集Wc上的隶属函数,构造如下0, , 1, : (8)式中:Ws、Wn分别为供水量和需水量;Wa为缺水系列中最小缺水量;Wm为缺水系列中最大缺水量;为大于1的正整数。将水资源短缺风险定义为模糊事件Af发生的概率,即模糊概率为 ( 9 )式中:Rn为n维欧氏空间;Af为模糊事件Af的隶属函数;P为概率测定。如果dP=f(y)dy,则 (10)其中f(y)是随机变量y的概率密度函数。水资源短缺风险的定义可表示为 (11)从式(8)(11)可知:上述风险定义将水资源短缺风险存在的模糊性和随机性联系在一起,其中,随机不确定性体现了水资源短缺风险发生的概率,而模糊不确定性则体现了水资源
12、短缺风险的影响程度依据概率密度函数f(x)和隶属函数的形式计算水资源短缺风险R。22水资源短缺风险的模拟概率分布Logistic回归方法具有对因变量数据要求低、计算结果唯一、模型精度高等优点,所以采用Logistic回归模型来模拟缺水量系列的概率分布。一个自变量的Logistic回归模型可写为: (12)式中:b0和b1分别为自变量的系数和常数;e为自然对数。包含一个以上自变量的模型可表示为 (13)其中:z=b0+b1x1+b2x2+bpxp(p为自变量的数量),b0、b1、bp分别为Logistic回归系数。23Logistic回归模型拟合度检验和系数检验建立Logistic回归模型后,常
13、用Hosmer-Losmer2统计量进行模型的拟合度检验,其表达式为 (14)其中:xs和xy分别是实际观测量和预测数量。检验的原假设和备择假设为:H0为方程对数据的拟合良好,H1为方程对数据的拟合不好。对于较大样本的系数检验,常用基于2分布的Wald统计量进行检验,当自由度为1时,Wald值为变量系数与其标准误差比值的平方,对于两类以上的分类变量来说,其式如下: (15)式中:B为极大似然估计分类变量系数的向量值;V-1为变量系数渐近方差-协方差矩阵的逆矩阵;B为B的转置阵。其检验的原假设和备择假设为:H0为回归模型的系数等于0,H1为回归模型的系数不等于0。24基于聚类分析的水资源短缺风险
14、分类为了直观的说明水资源短缺风险程度,利用Quick Clust过程(快速样本聚类)对风险进行聚类。快速样本聚类需要确定类数,利用k均值分类方法对观测量进行聚类,根据设定的收敛判据和迭代次数结束聚类过程,计算观测量与各类中心的距离,根据距离最小的原则把各观测量分派到各类中心所在的类中去。事先选定初始类中心,根据组成每一类的观测量计算各变量均值,每一类中的均值组成第二代迭代的类中心,按照这种方法迭代下去,直到达到迭代次数或达到中止迭代的数据要求时,迭代停止,聚类过程结束。对于等间隔测度的变量,一般用Euclidean distance(欧式距离)计算,而对于计数变量一般用Chsquaremeas
15、ure(2测度)来表征变量之间的不相似性,其表达式如下所示: (16) (17)25判别分析判别分析可用于识别影响水资源短缺风险的敏感因子,能够从诸多表明观测对象特征的自变量中筛选出提供较多信息的变量,且使这些变量之间的相关程度较低。线性判别函数的一般形式如下: (18)其中y为判别分数,x1,x2,xn为反映研究对象特征的变量,a1,a2,an为各变量的系数,也称判别系数。常用的判别分析方法是距离判别法(Mahalanobis距离法),即每步都使得相距最近的两类间的Mahalanobis距离最大的变量进入判别函数,其计算公式如下: (19)其中x是某一类中的观测量,Y是另一类,式(14)可以
16、求出x与Y的Mahalanobis距离。(2) 水资源短缺风险分类。 利用Quick Cluster对19792008年北京市的水资源短缺风险进行聚类,各类风险最终的类中心和特征如表4所示。分类结果如图4所示,图4中横坐标表示年降雨量,纵坐标表示历年水资源短缺风险值,图中的虚线表示拟合线,5种标记表示5种风险等级。由图4所示,高风险、较高风险以及中风险基本都集中发生在降雨量少的年份,较低风险以及低风险都集中在降雨量大的年份。以1999年和1994年为例,1999年的降雨量是历年中最少的,风险值也是最大的,属于高风险;1994年的降雨量是历年中最大的,风险值接近于0,属于低风险。进一步,从图4中
17、的拟合线可以看出,水资源短缺风险与降雨量是高度负相关的。3 (1)水资源短缺风险计算分析。根据式(8)、式(11)以及式(12)建立水资源短缺风险评价模型,得到北京市19792005年水资源短缺风险的计算结果如图3所示。其中缺水发生的概率,是由Logistic回归模型计算得到,水资源短缺风险值是由基于模糊概率的水资源短缺风险评价模型计算出来的。图3 北京市19792008年得水资源短缺风险由图3可以看出,1987、1991和1996年均没有发生水资源短缺风险,且水资源短缺风险模拟值均为0,其中1987、1996年风险发生的概率均不到70%,这和实际情形是吻合的,以1991年为例,该年风险发生的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 B0 资源 短缺 风险 综合 评价 模型 及其 应用 Logistic 回归 方法 距离
限制150内