最新B0资源短缺风险综合评价模型及其应用-Logistic回归方法-马氏距离.doc
Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-dateB0资源短缺风险综合评价模型及其应用-Logistic回归方法-马氏距离基于模糊概率的水资源短缺风险综合评价模型及其应用基于模糊概率的水资源短缺风险综合评价模型及其应用摘要: 本文基于模糊概率理论建立了水资源短缺风险评价模型,可对水资源短缺风险发生的概率和缺水影响程度给予综合评价。首先构造隶属函数以评价水资源系统的模糊性;其次利用Logistic回归模型模拟和预测水资源短缺风险发生的概率;而后建立了基于模糊概率的水资源短缺风险评价模型;最后利用判别分析识别出水资源短缺风险敏感因子。作为实例对北京市19792008年的水资源短缺风险研究表明,水资源总量、污水排放总量、农业用水量以及生活用水量是北京市水资源短缺的主要致险因子。再生水回用和南水北调工程可使北京地区2010和2020年各种情景下的水资源短缺均降至低风险水平。关键词:模糊概率;Logistic回归模型;判别分析;水资源短缺风险;敏感因子;北京一1.研究背景近年来,受气候变化和经济社会不断发展的影响,水资源短缺问题日趋严重,对水资源短缺风险的研究已引起了广泛的重视。国外的许多学者开展了这一方面的研究,如探讨优化调度模型中参数的模糊不确定性引起的水资源短缺风险问题,以及有关河流水质管理、水库灌溉等引起的短缺风险问题。北京位于华北平原西部,属暖温带半干旱半湿润性季风气候,由于受季风影响,雨量年际季节分配极不均匀,夏季降水量约占全年的70%以上,全市多年平均降水量575mm。属海河流域,从东到西分布有蓟运河、潮白河、北运河、永定河、大清河五大水系。北京是世界上严重缺水的大城市之一当地自产水资源量仅39·99亿m3,多年平均入境水量16·50亿m3,多年平均出境水量11·60亿m3,当地水资源的人均占有量约300m3,是世界人均的1/30,远远低于国际公认的人均1000m3的下限,属重度缺水地区。水资源短缺已成为影响和制约首都社会和经济发展的主要因素。为此我们大力研究水资源短缺这个问题。我们要解答的问题是:1 以北京为例,评价判定北京市水资源短缺风险的主要风险因子是什么?影响水资源的因素很多,例如:气候条件、水利工程设施、工业污染、农业用水、管理制度,人口规模等。2建立一个数学模型对北京市水资源短缺风险进行综合评价, 作出风险等级划分并陈述理由。对主要风险因子,如何进行调控,使得风险降低? 3 对北京市未来两年水资源的短缺风险进行预测,并提出应对措施。4 以北京市水行政主管部门为报告对象,写一份建议报告。(1) 北京市水资源短缺风险影响因子分析北京市水资源开发利用中存在的问题主要有:(1)上游来水衰减趋势十分明显;(2)长期超采地下水导致地下水位下降;(3)水污染加重了水危机;(4)人口膨胀和城市化发展加大了生活用水需求等。因此,导致北京水资源短缺的主要原因有资源型缺水和水质型缺水等。影响北京水资源短缺风险的因素可归纳为以下两个方面:(1)自然因素:人口数;入境水量;水资源总量;地下水位埋深;(2)社会经济环境因素:工业用水量;污水排放量;COD排放总量;第三产业及生活用水量;农业用水量。1.水资源短缺风险评价指标1·1风险率根据风险理论,荷载是使系统“失事”的驱动力,而抗力则是对象抵御“失事”的能力。如果把水资源系统的失事状态记为F(>),正常状态记为S(<),那么水资源系统的风险率为1 r=P(>) =P XtF ( 1 )式中:Xt为水资源系统状态变量如果水资源系统的工作状态有长期的记录,风险率也可以定义为水资源系统不能正常工作的时间与整个工作历时之比,即 ( 2 )式中:NS为水资源系统工作的总历时;It是水资源系统的状态变量。It= 水资源系统工作正常()水资源系统不正常工作()1·2风险度用概率分布的数学特征,如标准差或半标准差-,可以说明风险的大小。和-越大,则风险越大,反之越小。这是因为概率分布越分散,实际结果远离期望值的概率就越大。 (3)或 (4)用、-比较风险大小虽简单,概念明确,但-为某一物理量的绝对量,当两个比较方案的期望值相差很大时,则可比性差,同时比较结果可能不准确。为了克服用-可比性差的不足,可用其相对量作为比较参数,该相对量定义为风险度FDi,即标准差与期望值的比值(也称变差系数) (5)风险度不同于风险率,前者的值可大于1,而后者只能小于或等于1。根据表1及公式(2)(3)(5)得出如下表 : 风险率a0.466670.466670.533330.50.46667期望40.45667 19.35067 11.45820 9.65390 29.33267 方差27.7660437.5264810.2372416.6952989.27041标准差5.18078 6.02292 3.14579 4.01731 9.28950 风险度0.12806 0.31125 0.27454 0.41613 0.31669 (2)水资源短缺影响因子分析。根据3·2中提出的水资源短缺风险影响因子,利用Mahalanobis距离法筛选出水资源短缺风险敏感因子,见表5。从表5中第3栏可以看出,水资源总量、污水排放总量、农业用水量、生活用水量在步骤1至步骤4中移出模型的概率均小于0·1,同时在每步中这4个变量均使得最近的两类间的Mahalanobis距离最大因此,这4个变量是影响北京地区水资源短缺风险的敏感因子。步骤影响因素容许度移出概率最小马氏距离的平方组间1工业排放总量1.000 0.0892工业排放总量0.6820.020 0.1842,5水资源总量0.6820.000 0.2361,4工业排放总量0.3910.0280.8471,53水资源总量0.6780.000 0.7222,4农业用水量0.460 0.0341.2272,5工业排放总量0.2510.0356.550 1,54水资源总量0.3280.000 1.3852,4农业用水量0.1230.0031.2422,5第三产业用水量0.1020.0232.9632,5表5 敏感因子筛选二2基于模糊概率的水资源短缺风险评价模型的建立最具代表性的风险定义是由Kaplan提出的,并得到国际社会广泛的认可,即 (6)(1) 式中:si为第i个有害事件;i表示第i个事件发生的频率;pi(i)表示第i个有害事件发生的可能性为i的概率;xi表示第i个事件的结果;pi(xi)表示第i个事件结果为xi的概率,风险模型采用了向量的表示形式。借鉴Kaplan的定义,本文认为水资源短缺风险是指在特定的环境条件下,由于来水和用水存在模糊与随机不确定性,使区域水资源系统发生供水短缺的概率以及相应的缺水影响程度。基于上述理由设计了基于模糊概率的水资源短缺风险评价模型。2·1基于模糊概率的水资源短缺风险 对于一个供水系统来说,所谓失事主要是供水量Ws小于需水量Wn,从而使供水系统处于失事状态。基于水资源系统的模糊不确定性,构造一个合适的隶属函数来描述供水失事带来的损失。定义模糊集Wc如下: ( 7 )式中:x为缺水量,x=Wn-Ws;w(x)为缺水量在模糊集Wc上的隶属函数,构造如下0, , 1, : (8)式中:Ws、Wn分别为供水量和需水量;Wa为缺水系列中最小缺水量;Wm为缺水系列中最大缺水量;为大于1的正整数。将水资源短缺风险定义为模糊事件Af发生的概率,即模糊概率为 ( 9 )式中:Rn为n维欧氏空间;Af为模糊事件Af的隶属函数;P为概率测定。如果dP=f(y)dy,则 (10)其中f(y)是随机变量y的概率密度函数。水资源短缺风险的定义可表示为 (11)从式(8)(11)可知:上述风险定义将水资源短缺风险存在的模糊性和随机性联系在一起,其中,随机不确定性体现了水资源短缺风险发生的概率,而模糊不确定性则体现了水资源短缺风险的影响程度依据概率密度函数f(x)和隶属函数的形式计算水资源短缺风险R。2·2水资源短缺风险的模拟概率分布Logistic回归方法具有对因变量数据要求低、计算结果唯一、模型精度高等优点,所以采用Logistic回归模型来模拟缺水量系列的概率分布。一个自变量的Logistic回归模型可写为: (12)式中:b0和b1分别为自变量的系数和常数;e为自然对数。包含一个以上自变量的模型可表示为 (13)其中:z=b0+b1x1+b2x2+bpxp(p为自变量的数量),b0、b1、bp分别为Logistic回归系数。2·3Logistic回归模型拟合度检验和系数检验建立Logistic回归模型后,常用Hosmer-Losmer2统计量进行模型的拟合度检验,其表达式为 (14)其中:xs和xy分别是实际观测量和预测数量。检验的原假设和备择假设为:H0为方程对数据的拟合良好,H1为方程对数据的拟合不好。对于较大样本的系数检验,常用基于2分布的Wald统计量进行检验,当自由度为1时,Wald值为变量系数与其标准误差比值的平方,对于两类以上的分类变量来说,其式如下: (15)式中:B为极大似然估计分类变量系数的向量值;V-1为变量系数渐近方差-协方差矩阵的逆矩阵;B为B的转置阵。其检验的原假设和备择假设为:H0为回归模型的系数等于0,H1为回归模型的系数不等于0。2·4基于聚类分析的水资源短缺风险分类为了直观的说明水资源短缺风险程度,利用Quick Clust过程(快速样本聚类)对风险进行聚类。快速样本聚类需要确定类数,利用k均值分类方法对观测量进行聚类,根据设定的收敛判据和迭代次数结束聚类过程,计算观测量与各类中心的距离,根据距离最小的原则把各观测量分派到各类中心所在的类中去。事先选定初始类中心,根据组成每一类的观测量计算各变量均值,每一类中的均值组成第二代迭代的类中心,按照这种方法迭代下去,直到达到迭代次数或达到中止迭代的数据要求时,迭代停止,聚类过程结束。对于等间隔测度的变量,一般用Euclidean distance(欧式距离)计算,而对于计数变量一般用Chsquaremeasure(2测度)来表征变量之间的不相似性,其表达式如下所示: (16) (17)2·5判别分析判别分析可用于识别影响水资源短缺风险的敏感因子,能够从诸多表明观测对象特征的自变量中筛选出提供较多信息的变量,且使这些变量之间的相关程度较低。线性判别函数的一般形式如下: (18)其中y为判别分数,x1,x2,xn为反映研究对象特征的变量,a1,a2,an为各变量的系数,也称判别系数。常用的判别分析方法是距离判别法(Mahalanobis距离法),即每步都使得相距最近的两类间的Mahalanobis距离最大的变量进入判别函数,其计算公式如下: (19)其中x是某一类中的观测量,Y是另一类,式(14)可以求出x与Y的Mahalanobis距离。(2) 水资源短缺风险分类。 利用Quick Cluster对19792008年北京市的水资源短缺风险进行聚类,各类风险最终的类中心和特征如表4所示。分类结果如图4所示,图4中横坐标表示年降雨量,纵坐标表示历年水资源短缺风险值,图中的虚线表示拟合线,5种标记表示5种风险等级。由图4所示,高风险、较高风险以及中风险基本都集中发生在降雨量少的年份,较低风险以及低风险都集中在降雨量大的年份。以1999年和1994年为例,1999年的降雨量是历年中最少的,风险值也是最大的,属于高风险;1994年的降雨量是历年中最大的,风险值接近于0,属于低风险。进一步,从图4中的拟合线可以看出,水资源短缺风险与降雨量是高度负相关的。3 (1)水资源短缺风险计算分析。根据式(8)、式(11)以及式(12)建立水资源短缺风险评价模型,得到北京市19792005年水资源短缺风险的计算结果如图3所示。其中缺水发生的概率,是由Logistic回归模型计算得到,水资源短缺风险值是由基于模糊概率的水资源短缺风险评价模型计算出来的。图3 北京市19792008年得水资源短缺风险由图3可以看出,1987、1991和1996年均没有发生水资源短缺风险,且水资源短缺风险模拟值均为0,其中1987、1996年风险发生的概率均不到70%,这和实际情形是吻合的,以1991年为例,该年风险发生的计算概率为58%,这一年的实际情况是水资源总量仅为42·29亿m3,但实际总用水量已达到42·03亿m3,已处于风险的边缘状态。虽然1982、1984、1985、1994、1998年等缺水计算概率较高,但由于其缺水影响程度较小,所以由模糊概率计算其相应的水资源短缺风险综合评价值较小。图3的进一步分析可知,只要真实风险存在(缺水发生),描述风险发生的概率均超过了70%,以1999年为例说明,1999年是枯水年,水资源短缺风险模拟计算值最大,描述风险发生的概率接近100%。以上分析说明模型的计算结果与实际情形是吻合的,可以付诸应用。水资源短缺风险类别类中心风险特性低风险0.03可忽略风险较低风险0.33可接受风险中风险0.54边缘风险较高风险0.72较严重风险高风险0.82巨大风险表4 水资源短缺风险类别与特征图4北京市19792008年的水资源短缺风险分类结果综上所述,水资源短缺风险评价模型的建模与计算步骤如图1所示。水资源供需平衡分析水资源短缺风险综合评价模型的建立规划水平年不同来水保证率下水资源短缺风险评价水资源短缺风险影响因子分析yiQuick cluster过程聚类确定风险类别判别分析历年水资源短缺风险模糊概率数据处理Hosmer-lemeshow模型检验Logistic回归模型的建立规划水平年不同来水保证率下的缺水量 隶属函数的构建图1图1 水资源短缺风险评价的算法流程三3·北京市2010、2020水平年水资源短缺风险评价根据上述水资源短缺风险评价模型,对2010和2020水平年分3种情景讨论,分别是平水年(50%)、偏枯年(75%)、枯水年(95%),得出2010、2020水平年北京市水资源短缺风险评价结果如表6所示。表6北京市2010、2020水平年水资源短缺风险评价结果规划由表6可知,在3种情景下,2010水平年的水资源短缺风险都处于中等以上风险水平,而2020水平年在3种情景下都处于高风险水平。近年来,北京市一直在加大再生水利用量,这在一定程度上缓解了北京市水资源短缺的紧张局面,北京市再生水利用和规划情况见图5所示,其中2010和2020年再生水利用量是根据现有的趋势预测的。由此计算2010和2020年北京地区水资源短缺风险,结果如表7所示。规划水平年风险低风险性风险等级再生水回用前再生水回用水百分率%再生水回用前再生水回用水50%0.440.2543中风险较低风险201075%0.640.5711较高风险中风险95%0.730.6412较高风险较高风险50%0.950.8313高风险高风险202075%0.980.8612高风险高风险95%0.990.8811高风险高风险表7 再生水回用对北京市水资源短缺风险情况分析由表7可以看出,再生水回用后,2010与2020不同规划水平年北京市水资源短缺风险呈现不同幅度的降低,个别规划年份的降低幅度可达43%,可见再生水回用不失为降低北京地区水资源风险的有效途径之一。但是即便如此,2020各规划水平年北京市水资源短缺风险仍均处于高风险水平。图5北京市逐年再生水利用量规划水平年风险低风险性风险等级再生水回用前再生水回用水百分率%再生水回用前再生水回用水50%0.440.2543中风险较低风险201075%0.640.5711较高风险中风险95%0.730.6412较高风险较高风险50%0.950.8313高风险高风险202075%0.980.8612高风险高风险95%0.990.8811高风险高风险表7再生水回用对北京市水资源短缺风险的情景分析四4.南水北调对北京市水资源保障的情景分析南水北调中线调水工程,是从资源性角度缓解北京市水资源不足的重大举措,目前京石段已通水,年调水量3亿m3。在此设计3种情景:一是南水北调工程调水为零,即无南水北调工程条件;二是南水北调工程源水端汉江流域发生连续干旱,调水量为设计调水量的80%,即8·4亿m3;三是按南水北调工程规划调水,即2010年调水10·5亿m3,2020年10·5亿m3,2030年来水14亿m3,见表8。2010、2020年分别调水10·5亿m3后北京市水资源短缺风险评价结果如表9所示。规划水平年无调水规划调水量80%规划调水量增加调水量201008.410.512.0 202008.410.512.0 2030011.214.0 14.0 表8南水北调中线调水量方案设置(单位:亿m3)规划水平年风险低风险性风险等级 调水前调水后百分率%再生水回用前再生水回用水50%0.440.1957中风险较低风险201075%0.640.4825较高风险中风险95%0.730.5623较高风险中风险50%0.950.7917高风险较高风险202075%0.980.8216高风险高风险95%0.990.8415高风险高风险表9南水北调对北京市水资源短缺风险的情景分析由表9可以看出,调水10·5亿m3后,各规划水平年的风险水平均有不同程度的降低,以50%的保证率为例,2010年北京市水资源短缺风险由调水前的0·44降低至0·19,降低幅度达57%,在75%和95%保证率下水资源短缺可降低至中等风险水平,缓解作用比较明显。但对2020各规划水平年,可能的风险虽有不同程度降低,但面临的风险仍处于很高的水平。同时采用利用再生水和外源水的措施后,规划水平年北京市水资源短缺风险计算结果如表10所示。表10同时利用外源水和再生水后北京市水资源短缺风险的情景分析由表10可知,采取再生水回用和调水措施后,各种保证率下的2010和2020年北京市水资源短缺风险均由措施前的中高风险降至低风险水平,所以,再生水回用和南水北调是解决北京市水资源总量不足的根本措施。3·4讨论模型优缺点由表5可知,水资源总量、污水排放总量、农业用水量、生活用水量是北京水资源短缺的主要致险因子,其中生活用水是不可压缩的,随着北京都市化进程的不断加快,人口增长与人民生活水平的不断提高,生活用水量会进一步加大。2007年北京市污水处理率已达76·2%,2010、2020年的污水处理率会进一步增加,污水排放总量会进一步减少,扩大再生水利用和南水北调工程均扩大了北京地区的水资源总量。北京农业用水量占北京总用水量的40%左右,采用文献中提出的节水措施可进一步降低北京农业用水量,但由于受到基本农田保护制度的政策的制约,进一步大幅度压缩农业用水的可能性不大。近年来北京年均农产品虚拟水输入量为2·37亿m3,这相当于北京市年产水资源总量的5·93%25。虚拟水战略不失为间接缓解北京地区水资源短缺风险的途径,但还需要进一步探讨与研究。4结论(1)本文基于模糊概率建立了水资源短缺风险评价模型,同时考虑到水资源系统的随机不确定性和模糊不确定性,可对水资源短缺风险发生的概率和影响程度给予综合评价,19792000年的北京市水资源短缺风险的实例分析,表明了模型的适用性;(2)水资源总量、污水排放总量、农业用水量以及生活用水量是北京市水资源短缺的主要致险因子;(3)再生水回用和南水北调工程可使北京地区2010和20年各类规划水平年的水资源短缺均降至低风险水平。所以,在加快南水北调进京工程的同时,大力发展再生水回用,是解决北京地区水资源短缺风险的根本措施。参考文献: 1 Hashimoto T, Stedinger J R, Loucks D P. Reliability, resiliency and vulnerability criteria for water resources systemperformance evaluationJ. Water Resour. Res.,1982,18(1):14-20. 2 Bagel MS, Das Gupta A, Nayak DK. Amodel for optimal allocation ofwaterto competing demandsJ.WaterResourcesManagement,2005,19(6):693-712. 3 阮本清,梁瑞驹,陈韶君.一种供用水系统的风险分析与评价方法J.水利学报,2000(9):1-7. 4 衷平,沈珍瑶,杨志峰,等.石羊河流域水资源短缺风险敏感因子的确定J.干旱区资源与环境,2005,19(2):81-86. 5 Bardossy A, Disse M. Fuzzy rule based models for infiltrationJ.Water Resour. Res.,1993,29(2),373-382. 6 Bogardi I, Bordossy A, Duckstein L. Regional management of an aqifer for mining under fuzzy environmental objectivesJ.Water Resour. Res.,1983,19(6):1394-1402. 7 Mujumdar P P, Sasikumar K. A fuzzy risk approach for seasonal water quality management of a river systemJ.WaterResour. Res.,2002,38(1):1-9. 8 Sasi Kumar K, Mujumdar P P. Application of fuzzy probability in water quality management of a river systemJ.Int. J.Syst.Sci.,2000,30(5):575-591. 9 Ghosh S, Mujumdar P P. Risk minimization in water quality control problems of a river systemJ.Advances in WaterResources,2006,29(3):458-470.10Suresh K R, Mujumdar P P. A fuzzy risk approach for performance evaluation of an irrigation reservoir systemJ.820Agriculture WaterManagement,2004,69(2004):159-177.11Kaplan, Garrick J. On the quantitative definition of riskJ.Risk Analysis,1981,1(1):11-37.12阮本清,韩宇平,王浩,等.水资源短缺风险的模糊综合评价J.水利学报,2005,36(8):906-912.13刘涛,邵东国,顾文权.基于层次分析法的供水风险综合评价模型J.武汉大学学报(工学版),2006,39(4):25-28.14黄明聪,解建仓,阮本清,等.基于支持向量机的水资源短缺风险评价模型及应用J.水利学报,2007,38(3):255-259.15左其亭,吴泽宁,赵伟.水资源系统中的不确定性风险分析方法J.干旱区地理,2003,26(2):116-121.16刘涛,邵东国.水资源系统风险评估方法研究J.武汉大学学报(工学版),2005,38(6):66-71.17王栋,朱元.最大熵原理在水文水资源科学中的应用J.水科学进展,2001,12(3):424-430.18邹志红,云逸,王惠文,等.基于Logistic回归的水质预测研究J.数学的实践与认识,2008,38(1):82-87.19卢纹岱.SPSS For Windows统计分析(第3版)M.北京:电子工业出版社,2006:315-476.20刘静楠,顾颖.判别分析在农业旱情识别中的应用J.水文,2007,27(2):60-67.21王红瑞,刘昌明,张继伟,等.水资源短缺对北京市工业经济的影响与对策J.人口资源与环境,2004,(14):88-91.22王红瑞,刘昌明,毛广全,等.水资源短缺对北京市农业的影响与对策J.自然资源学报,2004,19(2):160-169.23吴玉成.缓解和解决京津唐地区水资源供需矛盾探讨J.高原气象,1999,18(4):625-631.24王红瑞,董艳艳,王军红,等.北京市农作物虚拟水含量分布J.环境科学,2007,28(11):2432-2437.25王红瑞,王岩,王军红,等.北京农业虚拟水结构变化及贸易研究J.环境科学,2007,28(12):2877-2884. -