多元统计分析在河流污染状况综合评价中的应用.pdf
《多元统计分析在河流污染状况综合评价中的应用.pdf》由会员分享,可在线阅读,更多相关《多元统计分析在河流污染状况综合评价中的应用.pdf(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2001年9月系统工程理论与实践第9期文章编号:100026788(2001)0920118206多元统计分析在河流污染状况综合评价中的应用王晓鹏(青海师范大学数学系,青海 西宁810008)摘要:以湟水流域为例,针对流域内具有代表性的断面,运用因子分析方法和聚类分析方法就各断面水质污染程度和污染相似性进行定量化的综合评价,并以判别分析方法对相关结果加以校验,为河流治污工作的开展提供一定的科学依据关键词:河流水质污染;因子分析;聚类分析;判别分析中图分类号:O212;C8文献标识码:AApplication ofM ultivariate StatisticalA nalysisto A ss
2、essing Synthetically Polluting Status of R iversWAN G Xiao2peng(Department ofM athematics,Q inghaiNormalU niversity,Xining 810008,China)Abstract:U sing the methods of factor analysis and cluster analysis,the paper makesquantitative analysis and comprehensive assessment of the polluting status in deg
3、reesand in si m ilarities for representative sections in Huangshui basin,the paper also givesthe results verifiedw ith discri m inant analysismethod,which can provide some scientificbases to control the pollution of the rivers.Keywords:river polluting status;factor analysis;cluster analysis;discri m
4、 inantanalysis1引言在当代社会生活中,水环境污染已成为威胁人类生存的重要因素,如何在科学准确地对污染状况作出综合评价的基础上,具体开展针对水环境的治污工作,已成为环保科学的重要课题,而水质评价作为水环境评价的核心内容,其重要性更是毋庸置疑 无论从理论研究还是从实际治污工作的角度出发,水质评价都包含两方面工作:一是就水质污染程度的评价、分级;二是就水质污染相似性的分类研究水质系统是由多种因子构成的复杂系统,水质质量受到诸多指标(污染物含量或指数)的影响,每项指标从不同角度反映水质污染状况,但依据它们作综合评价却有一定难度,多元统计分析正是将多维因子纳入同一体系加以综合研究的定量化方
5、法,随着计算机的普及和软件开发,已在很多领域得以广泛应用本文选定河流(水环境污染的主要载体)为研究对象,运用因子分析方法将所取断面进行水质污染程度的综合评价、分析、排序,并在分析过程中利用国家有关水质污染标准给出分级处理结果;以聚类分析方法对各断面水质污染相似性进行研究,给出分类处理结果;以判别分析方法对相关结果加以校验,再结合对实际情况的分析和与传统评价方法所得结果之对比,说明上述多元统计分析的数学模型和方法完全适用于对河流水质污染状况的综合评价,对其它类型的水质评价亦有一定参考价值(篇幅所限,中间计算结果不再逐一列出,具体数学原理及公式推导可参阅文献1-3)收稿日期:2000201211
6、1995-2005 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.2样点(段面)和指标的选取湟水是黄河在上游的一级支流,对其流域内水质污染状况作出科学分析评价的意义不言而喻遵循科学性和可比性原则,本文在此选取流域内具有代表性的十七个断面、水质评价常用的十项指标及指标在断面上的具体观测值,另参照国家GB3838-88水环境质量标准,列出三类标准样点(段面)的十项指标值,以便于准确地对各断面污染程度给以分级处理,这里将标准化数据列于表1:表1湟水流域各断面及水质标准样点在主要污染指标上的标准化数据表(单位:mg?l)河流名称段
7、面指标X1(高锰酸盐指数)X2(生化需氧量)X3(氨氮)X4(亚硝酸盐氮)X5(硝酸盐)X6(挥发酚)X7(总氰化物)X8(总砷)X9(六价铬)X10(石油类)湟水干流1扎马隆-0.857-0.454-0.464-0.497-1.279-0.029-0.363-0.486-0.804-0.5962西钢桥-0.547-0.314-0.379-0.439-0.527-0.0290.605-0.486-0.633-0.5763新宁桥-0.392-0.035-0.114-0.3620.4610.263-0.363-0.486-0.804-0.1964报社桥1.5470.9431.673-0.091-0
8、.0560.8480.363-0.4000.2622.3885小峡口0.4620.3840.003-0.0080.6490.5560.848-0.187-0.249-0.1866民和桥-0.6630.384-0.4990.0352.131-1.199-0.848-0.486-0.846-0.576北川河7峡门桥-0.857-0.593-0.680-0.439-0.880-1.199-0.848-0.3150.731-0.3168桥头桥-0.547-0.593-0.457-0.401-0.174-1.199-0.848-0.3591.584-0.2269长宁桥-0.392-0.454-0.170
9、-0.323-0.597-1.199-0.848-0.3151.967-0.32610润泽-0.353-0.5930.283-0.342-0.715-1.199-0.848-0.1872.138-0.19611润泽桥-0.120-0.4540.102-0.187-1.350-0.029-0.121-0.400-0.633-0.55612塔尔桥-1.051-0.593-0.681-0.420-0.433-1.199-0.848-0.4430.902-0.23613朝阳桥-0.081-0.1750.5420.0110.9550.5560.363-0.400-0.633-0.376南川河14老幼堡-
10、1.051-0.454-0.470-0.4340.367-0.029-0.605-0.443-0.931-0.61615七一桥3.2154.0153.6950.2531.1661.7260.121-0.315-0.0792.448沙塘川河16三其桥0.384-0.035-0.420-0.299-0.9971.433-0.363-0.443-0.676-0.59617沙塘桥0.617-0.175-0.383-0.357-1.0911.4330.121-0.400-0.6762.198标准样点18第 类-0.547-0.454-0.594-0.100-0.386-0.907-0.1211.474-
11、0.846-0.63619第 类0.229-0.314-0.4930.1420.790-0.0291.0901.474-0.846-0.63620第?类1.004-0.035-0.4934.2581.9661.4333.5123.6041.072-0.186原始数据为年均值,摘自 1998年青海省环境质量监测报告书(1999.5)3 因子分析法在湟水流域水质污染程度综合评价中的应用3.1关于因子分析法及水质污染程度评价的正交因子模型因子分析法是一种通过对样本相关阵的内部依赖关系的研究,将多个指标归结为少数几个不可观测的综合指标以简化观测系统,并最终对各样点施行定量化评价的多元统计分析方法其关键
12、在于正交因子模型的建立和分析应用设xi(i=1,2,p)为水质污染评价指标随机变量,其中某些随机变量之间具有不同程度的相关性,假定每个变量已经过标准化,笔者在此提出的所谓水质污染程度评价正交因子模型,指的是:存在m(mp)个综合指标(又称主因子)fi(i=1,2,m),使xi可用它们的线性组合表示为:X=A F+式中X=(x1,xp);F=(f1,fm);=(1,p);A=(aij)pm(aij称为第i个指标在第j个主因子上911第9期多元统计分析在河流污染状况综合评价中的应用 1995-2005 Tsinghua Tongfang Optical Disc Co.,Ltd.All right
13、s reserved.的载荷);且满足条件:E(F)=0,cov(F)=I,E()=0,cov()=diag(21,2p),cov(,F)=0,m=p时=0上述模型在具体应用时,可合理选定主因子个数m,略去线性表达式中的(特殊因子),于是式中的A(因子载荷矩阵)的估计及计算对最终的评价至关重要 下面就本文所涉及的实际问题,以主成分法具体确定主因子、计算有实际统计分析意义的因子载荷矩阵,展开相关讨论分析3.2湟水流域各断面水质污染程度之因子分析3.2.1确定初始主因子和初始因子载荷矩阵1)对原始数据xij(第j个指标xj在第i个样点上的原始观测值)进行标准化变换,以消除量纲及数据的显著差异,变换
14、后数据不妨仍记作xij,于是得2010阶的标准化数据矩阵X;2)计算样本相关系数矩阵R=(rjk),其中rjk=6ni=1xijxik?(n-1)(j,k=1,2,10;n为样点数20);3)以Jacobi法求出样本相关系数矩阵R的特征值 12100(特征值依次为4.3936,2.7857,1.2381,0.8553,0.2622,)以及相应单位特征向量e1,e2,e10;4)主因子个数m的确定以主成分思想进行:比较理想的情况是只有少数几个主因子对评价指标变量的“贡献”很大,指标变量的总方差为tr(R)=p=10,第j个主因子的“贡献”为 j,于是 j?tr(R)为反映第j个主因子的“贡献”大
15、小的所谓方差贡献率,由此计算得主因子的方差贡献率依次为43.94%,27.68%,12.38%,8.55%由于前四个主因子的累积方差贡献率 2j?tr(R)=92.73%,即能够用前四个综合指标来反映原始数据表中的绝大部分信息,故确定出m=4为主因子个数;5)在上述结果基础上建立初始因子载荷矩阵A(1)=(1e1,2e2,3e3,4e4),由A(1)所确定的主因子f(1)j(j=1,2,3,4)称为初始主因子3.2.2因子轴的旋转及最终主因子的实际意义分析通过对A(1)的观察,发现有指标变量同时在几个初始主因子上都有相当程度的载荷值的现象,初始主因子的实际意义难以得到合理解释,为此须对A(1)
16、进行适当变换,这里将其进行最大方差正交旋转得有实际统计分析意义的因子载荷矩阵A(具体数据见表2),建立最终正交因子模型,并对各fj给以合理解释:指标x1、x2、x3、x6、x10(均为有机污染物指标)在第一主因子f1上的载荷值相对其它指标而言要大得多,故f1被解释为这五项指标的综合,即f1可理解成“有机污染因子”;同样道理,f2可理解成“无机污染因子”(是x4、x5、x7、x8的综合);f3则主要体现x9(属无机污染物)的信息;f4主要体现x10(属有机污染物)的信息f1方差贡献率高达43.94%,可见湟水流域水质污染现状主要是由有机污染所造成表2十项水质污染评价指标变量在四个主因子上的载荷值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 河流 污染 状况 综合 评价 中的 应用
限制150内