基于多元统计分析的水质综合评价.pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《基于多元统计分析的水质综合评价.pdf》由会员分享,可在线阅读,更多相关《基于多元统计分析的水质综合评价.pdf(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第17卷 第4期2006年8月水 资 源 与 水 工 程 学 报Journal of Water Resources&WaterEngineeringVol.17 No.4Aug.,2006基于多元统计分析的水质综合评价李传哲1,于福亮1,刘 佳1,鲍卫锋2,杜子芳3(1.中国水利水电科学研究院水资源所,北京100044;2.武汉大学 水资源与水电工程科学国家重点实验室,武汉430072;3.中国人民大学 统计学院,北京100872)摘要:以延河为例,运用因子分析方法和聚类分析方法就各监测断面水质污染程度和污染相似性进行定量化的综合评价。提出水质污染的逐步回归分析方法,并以年水质综合污染指数为
2、例,对其进行逐步回归分析。为合理评价延河水环境状况提供一定的科学依据。关键词:水质污染;因子分析;聚类分析;逐步回归分析中图分类号:X824文献标识码:A文章编号:16722643X(2006)0420036205Comprehensive evaluation of water quality based onmultivariate statistical analysisLI Chuan-zhe1,YU Fu-liang1,LIU Jia1,BAOWei-feng2,Du Zi-fang3(1.Departmentof WaterResources,China Instituteof W
3、aterResources and HydropowerResearch,Beijing100044,China;2.StateKey Laboratoryof WaterResources and HydropowerEngineeringScience,WuhanUniversity,Wuhan430072,China;3.School of Statistics,Renmin Universityof China,Beijing100872,China)Abstract:Using the methods of factor analysis and cluster analysis,t
4、he paper has made the quan2titative analysis and comprehensiveassessmentfor the pollutingstatus in degrees and in similari2ties of monitoringsections in Yanhe River.A methodof stepwise regressionanalysis on waterpollutingis discussed with examples of the comprehensive water pollutingindex.It can be
5、pro2vided some scientific bases to assess the water environmentsituation of Yanhe River.Key words:water pollution;factor analysis;cluster analysis;stepwise regression analysis0引言延安市的水资源问题制约着整个城市的发展,影响着整个市区的环境景观和人民的健康。如何科学准确评价母亲河延河的水质状况,已成为延安市环保和水利等部门的重要课题。水质评价包含两方面内容:一是水质污染相似性的分类研究;二是水质污染程度的评价。水质系统是
6、由多种因子构成的复杂系统,水质质量受到诸多指标(污染物含量或指数)的影响,每项指标从不同角度反映水质污染状况。本文运用因子分析方法将所取断面进行水质污染程度的综合评价、分析,确定影响水质质量状况的综合因子;以聚类分析方法对各断面水质污染相似性进行研究,给出分类处理结果;应用逐步回归的数理统计方法,寻求主要污染指标与水质综合污染指数间的关系。1断面和指标的选取延安市地面水常规监测的主要河流为延河。根据 水环境监测技术规范 的要求,设1号杨家湾断面、2号柳树店断面、3号点四联队断面、4号点七里村断面、5号点王家川断面,共5个断面,均为省控断面,监测河段长80 km。本文选取的监测指标为悬浮物、总硬
7、度、高锰酸盐指数、生化需氧量、非离子氨、亚硝酸盐氨、硝酸盐氨、挥发酚、砷、六价铬、石油类等11项。数据资料为2002年这5个监测断面11项监测指标的年平均值,见表1。收稿日期:2006202215;修稿日期:2006203216基金项目:延安市水资源综合规划项目;全国水资源综合规划专题(01-06-02)作者简介:李传哲(19832),男(汉族),湖北荆州人,硕士研究生,主要从事水资源合理配置、规划评价等方面的研究。1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http:/表12
8、002年延河各监测断面水质监测结果统计表(综合污染指数除外)mg?L指标悬浮物总硬度高锰酸盐指数生化需氧量非离子氨亚硝酸盐氨硝酸盐氨挥发酚砷六价铬石油类综合污染指数断面150.7164.32.532.00.0130.0820.360.0010.0050.0130.1897.18断面247.5141.94.126.00.1330.1340.370.0020.0080.0140.18314.65断面356.7154.94.464.40.1670.1540.360.0030.0100.0140.24717.74断面464.8175.54.204.10.0270.1700.380.0020.0120.
9、0131.26231.01断面573.0187.63.964.00.0470.1820.380.0020.0130.0180.28212.68数据来源:延安市环境保护局2002年水环境保护质量报告书。2因子分析法在延河水质污染程度综合评价中的应用2.1因子分析基本原理因子分析(Factor Analysis)是主成分分析的推广,它是通过原始变量的线性组合,把多个原始指标简化为有代表意义的少数几个指标,以使原始指标能更集中、更典型地表明研究对象特征的一种统计分析方法。研究变量之间的相互关系的因子分析称为R型因子分析,研究样品之间的相互关系的因子分析称为Q型因子分析,本文采用研究各变量间相互关系的
10、Q型因子分析1。其基本步骤为:设有n个样品,每个样品观测p个变量。为了对变量进行比较,并消除由观测量纲的差异及数量级所造成的影响,将样本观测数据进行无量纲化或标准化处理,使标准化后的变量的均值为0,方差为1。计算变量的相关系数矩阵,求出特征值,得到贡献率和累积贡献率,选取前m(mp)个主因子,使得累积贡献率mj=1j?pj=1j85%,然后进行具体分析。随着多元统计分析理论的逐步完善及相关软件的商品化,越来越多的人应用统计分析技术研究水环境污染相关问题28。本文数据分析借助SPSS for Windows软件完成9。2.2计算结果根据断面及各实测指标值(表1)建立511的原始指标矩阵x=(xi
11、j)np。由于所选指标数据过分悬殊,为消除因此而导致的噪音影响,对原始数据进行标准化处理。根据相关矩阵可知,各因子间的相关性较好,适合用因子分析法提取综合因子。旋转前后各因子的特征值、贡献率和累积贡献率见表2。因子分析中选取因子的两个原则:特征值大于1的因子;因子的累积贡献率大于或等于85%,即mi=1ip85%。从表2和图1(因子碎石图)看出,选取前3个因子满足3j=1j?11j=1j=93.442%85%,可以作为综合因子充分反映各污染指标及水环境要素的变化情况。表2总方差分解因子旋转前初始的特征值变量贡献率?%累积贡献率?%提取的特征值变量贡献率?%累积贡献率?%旋转后提取的特征值变量贡
12、献率?%累积贡献率?%15.28648.05148.0515.28648.05148.0514.59041.72841.72823.58532.58980.6403.58532.58980.6403.93735.79177.51931.40812.80393.4421.40812.80393.4421.75215.92393.44240.7216.558100.00053.54510-163.22310-15100.00061.75910-161.59910-15100.00077.94610-177.22310-16100.0008-1.37410-17-1.24910-16100.0009
13、-1.32310-16-1.20310-15100.00010-2.18310-16-1.98510-15100.00011-4.09010-16-3.71810-15100.00073第4期李传哲,等:基于多元统计分析的水质综合评价 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http:/提取的3个因子代表了11个因子的综合信息,因而很难命名。为此需对其旋转,使因子载荷值向两极端趋近,以明确各因子代表的含义。采用Varimaxwith Kaiser Normalization
14、因子旋转法对初始因子载荷矩阵施以25次的正交旋转。计算结果(表3)表明旋转后因子分类极其明确。同时由表2可知旋转前后综合因子代表的信息量始终满足大于或等于85%的要求,可认为旋转前后信息量没有损失。表3旋转因子载荷矩阵指标因子123旋转因子123悬浮物0.855-0.453-0.1740.972-1.7910-20.146总硬度0.579-0.779-0.1550.868-0.4330.160砷0.997-2.3010-28.1410-30.8540.4400.267六价铬0.612-0.145-0.7550.8220.104-0.527亚硝酸盐氨0.9900.1397.3110-30.781
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 多元 统计分析 水质 综合 评价
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内