《环境质量评价的主成分因子分析的可视化方法.pdf》由会员分享,可在线阅读,更多相关《环境质量评价的主成分因子分析的可视化方法.pdf(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 3 2 卷第7期 2 0 0 7年 7月 环境科学与管理 ENVm 0NM哐NTAL SCm NCE AND I ANAGEM哐NT V0 1 3 2 No 7 J u l y 2 0 0 7 文章编号:1 6 7 31 2 1 2(2 0 0 7)0 7-0 1 8 7-0 4 环境质量评价的主成分因子分析的可视化方法 朱纯,曾明智,韩波(1 北海市环境监测中心站,广西 北海 5 3 6 0 0 0;2 北海市环境监察支队,广西 北海 5 3 6 0 0 0)摘要:环境质量评价的主成分因子分析涉及十分复杂的矩阵运算和评价成果图绘制,用E x c e l 加 V i s u a l B a
2、 s i c 强有力的界面设计功能和 MA T L A B的强大的计算和图形处理功能,通过在 M A T L A B中提供的一个E x c e l L i n k 插件,*q-c A 直接在 E x c e l 环境下实现环境质量评价中复杂的数据处理和图表的制作功能。关键词:环境质量评价;主成分因子分析;可视化 中图分 类号:X 8 2 0 2 X 8 3 0 2 文献标识码:A P r i n c i p a l Co mp o n e n t F a c t o r An a l y s i s Ev a l u a t i O n o f t h e E n v i r o n me n
3、 t a l Q u a l i t y o f V i s u a l i z a t i o n Me t h o d s Z h u Ch u n ,Z e n g Mi n g z h i ,Ha n B o (1 B e i h a i E n v i r o n me n t a l Mo n i t o ri n g C e n t r a l S t a ti o n,B e i h a i 5 3 6 0 0 0,C h i n a;2 B e i h a i E n v i r o nm e n t a l Mo n i t o ri n g D e t a c h me
4、n t,B e i h a i 5 3 6 0 0 0,C h i n a)Ab s t r a c t:P rin c i p a l c o mp o n e n t f a c t o r a n aly s i s o f t h e e n v i ronm e n t a l q u a l i t y a s s e s s me n t i s a c o mp l e x ma t r i x c alc u l a ti o n a n d e v a l u a t i o n r e s u l t s d r a w i n g,E x c e l a p p l i
5、 c a ti o n o f t h i s s t r o n g i n c r e a s e i n Vi s u al Ba s i c i n t e r f a c e d e s i g n a n d f u n c ti o n o f the s t r o n g MAT L AB t h e c alc ula t i o n a n d g r a p h i c p r o c e s s i n g f u n c ti o n,I n MA TL AB b y p rov i d i n g a P l u gE x c e l L i n k,Ex c e
6、 l e n v i ronm e n t c a n a c h i e v e e n v i r o n me n t al q u a l i t y e v alu a ti o n o f c o mp l e x d a t a p roc e s s i n g a n d c h a r t p r o d u c t i o n f u n c ti o n s Ke y wo r d s:e n v i r o n me n t a l q u a l i t y a s s e s s me n t;p rin c i p al c o mpon e n t f a c
7、 t o r a n a l y s i s;v i s u ali z a ti o n 主成分因子分析是在一组变量中找出其方差和 协方差矩阵的特征量,将多个变量通过降维转化为少 数几个综合变量的统计分析方法。由于其在对高维 变量系统进行最佳的综合与简化、客观地确定各个指 标的权数以及依据前两个主成分因子能绘制出评价 图的突出特点,已经在环境质量评价中得到了广泛应 用-2 J。主成分因子分析的数学计算比较复杂,如果 不借助于计算机,其计算问题很难解决。E x c e l 作为 微软公司 O f f i c e 套件 中一种标准的数据处理和管理 工具,虽然有丰富E x c e l 函数,但并不
8、能满足环境质量 评价数学方法的所有需要,为此,本文利用 M A T L A B 提供的E x c e l L i n k插件,借助于E x c e l 内核心V A B 宏 语言与 E x c e l Lin k函数可更方便地实现主成分因子 分析计算与图形可视化的目的。1 主成分 因子分析 的主要方法和步骤 1 1 主成分因子分析方法和评价模型 主成分因子分析是将多个指标化为少数指标且 收稿 日期:2 0 0 7-0 3 3 0 作者简介:朱纯(1 9 7 4 一),女,工程师,主要研究方向:环境监测与科研。能保持最大原始数据的相关性的一种方法。在主成 分分析中较为重要的方差贡献(=1,2,k
9、),表 示第 个公因子在消除 i 一1 个公因子影响后,使方 差贡献取到的最大值。用它主要衡量第 个公因子 的重要程度。因此我们可以以 为权重,建立相应的 评价模型:F=卢 l F l+卢 2 F 2+-fl I F I,其中 F l,为相应的用来综合描述原始指标的 个公因 子,计算综合得分并排序。1 2 主成分因子分析步骤 设有 n 个样本,每个样本有 m个数据,记为 X=l m、1,、:I L l,2,m,l (1)对 X 的 夕 IJ 迓 仃 标 准 化 变 抉(一 )i=1,2,n;=1,2,m,其中匆=耋 ,=(一 刁 得 标 准 化 矩 阵 ,仍 记 为:IX 为 =I :f 维普
10、资讯 http:/ 期 朱纯等环境质量评价的主成分因子分析的可视化方法 V 0 L 3 2 N 仉7 J u l y 2 0 0 7 (2)用计算机计算指标变量的相关系数矩阵 尺 =:,其 中 =n =札 ,k=1,2,m (3)用相关系数矩阵进行主成分分析,计算 尺 的特征值 A 和特征向量(=1,2,n)。p (4)确 定主 成 分个 数j,A k (A i)为 第j 个 主 成 分 的 信 息 贡 献 率,记 为,称 P (A i)(A i)为 前k 个主成分的累 计信 息贡 献 率。我们选取主成分的原则是:当前 k 个主成分的累 计贡献率超过8 5 时,取前个 k 主成分代替原来的 m
11、个指标。(5)求因 子载荷o =A ,计算因子载荷矩 阵,再计算各因子得分 F =O i=1,2,k。(6)按因子得分 及贡献率的大小,计算综合 得分F=F +F 2+再根据综合得分进 行排序。2 环境需求与主成分因子模型制作 2 1 可视化制作工具选择 E x c e l L i n k l 3 是 一 个软 件插 件,它 将 E x c e l和 M A T L A B在微软视 窗环境下进行集成。通过链接 E x c e l 和 MA T L A B可 以从 E x c e l 工作表 和宏 编程工 具中获得 M A T L A B的数值计算和图形绘制功能,能 够在两个环境之间交换数据。E
12、 x c e l L i n k在 E x c e l 工作空间和 MA T L A B工作 空间之间进行通信。它把 E x c e l 作为 MA T L A B的前 端,在 E x c e l 的工作表或宏中使用 E x c e l L in k函数,而不必离开 E x c e l 环境,E x c e l L i n k用少量 的函数实 现链接管理和数据操作,以简便取胜。为 了简便和 实用起见,以下介绍 E x c e l Lin k数据管理 函数,连接 管理函数见有关文献,在此不再赘述。E x c e l L i n k提供 了 9个数据管理 函数在 E x c e l 和 MA T
13、L A B之间传递数据并在 E x c e l 运行 M A T L A B 命令。(1)Ma t l a b f c n对于给定的 E x c e l 数据运行 M A T-L A B命令。(2)M a t l a b s u b对 于 给 定 的 E x c e l数 据 运 行 MA T LA B命令并指定输 出位置。(3)M LAp p e n d M a t r i x 将 E x c e l 工作表中的数据 创建或添加到 M A T LA B矩阵。(4)ML D e l e t e Ma t r i x删除 M A T L A B矩阵。1 88 (5)M L E v a l S t
14、r i n g 运行 M A T LAB命令。(6)ML G e t Ma t r i x把 MA T L A B矩阵 的内容 写到 E x c e l 工作表。(7)ML G e t V a r 把 MA T L A B矩阵 的内容写到 E x c e l V B A变量 中。(8)ML P u t Ma t r i x用 E x c e l 工作表 中的数据创建 或覆盖 M A T LA B矩阵。(9)ML P u t V a r 用 E x c e l V B A变量的数据创建或 覆盖 MA T L A B矩阵。2 2 系统需求 E x c e l L i n k占用近 2 0 2 K
15、B的磁盘空 间,操作 系 统 可 以 是Wi n d o w s 9 8,Wi n d o w N T 4 0 或Wi n d o w s 2 0 0 0。E x c e l Lin k还需要 E x c e l 9 7或 E x c e l 2 0 0 0 和 5 1以上版本 MA T LA B。2 3 计算程序 将上述建模过程和模型精度分析用 V B A与 MA T L A B语言编制成一段通用程序如下:S u b主成分()获取数据区域行数和列数 D i m a d a t a,n,P A s O b j e c t I T=R a n g e(”A 1”)C u iT e n t R e
16、 g i o n Ro ws C o u n t C C=R a n g e(”A 1”)C u r r e n t R e g i o n C o l u mn s C o u n t t=6 4+c c 定义数据区域对象 S e t a d a t a=S h e e t 1 R a n g e(”B 2:”&C h r (t)&r r&”)S e t P=S h e e t 1 R a n g e(”B 1:”&C h r(t)&1&”S e t n=S h e e t 1 R a n g e(”A 2:”&C h r(6 5)&I T&”将数据区域对象送到 m a t la b 工作区
17、 Ml e v a l s t r i n g”c l e a r,c l f Ml p ut ma t r i x”da t a”,a d a t a Ml p ut ma t r i x”n”,n Ml p ut ma t r i x”P”,P 计算协方差和主成分等参数 M l e v a l s t r i n g”s r=c o r r c o e f(d a t a)”M l e v a l s tr i n g”p c s,n e w d a t a,v a r i a n c e s=p c a c o v(s t)”Ml e v a l s t r i n g”Y=d a t
18、a p c s”M l e v a l s t r i n g”p l o t(Y(:,1),Y(:,2),b ,);x l a b e l(主成份 1,;y l a b e l(主成份2 M l e v a l s t r i n g”t e x t(Y(:,1),Y(:,2),n u m 2 s t r (1:2 1)”维普资讯 http:/ 期 朱纯等 环境质量评价的主成分因子分折的可视化方法 V 0 L 3 2 N 7 J u l y2 0 0 7 将 m a t l a b的计算结果送到e x c e l 工作表 Ml g e t m a t r i x”Y”,C h r(6 6)&
19、(r r+3)&“”M l g e t m a t r i x”n”,C h r(6 5)&(r r+3)&”Ml g e t m a t r i x”p c s”,C h r(t+2)2&”Ml g e t ma t r i x”v a r i a n c e s”L1 2”MATLABRe qu e s t En d S u b 只需在 E x c e l 工作表中输入原始数据,调用该 程序就可以立即得到主成分因子分析的计算结果和 以“湿地水环境质量 的模糊综合评价”为例H j,实例选择 B O D 5、C O D、D O、T N、N H 3 一 N及 s s等6 项 监测指标作为评价因子
20、。评价数据见表 1。环境质量 评价 E x c e l L i n k 主成分因子分析模型操作步骤如下:(1)打开已建好的上述程序的 E x c e l 软件。(2)按图 1 输入待评价的水质监测数据。(3)在 工具 菜单上选择列表 宏,在打开宏 窗体中的选择框中单击“主成分”然后按 运行 按钮。主成分分布图。按上述三个步骤操作后,分别显示水质评价模型 3 应用实例主成分因子计算结果(贼2)和水质评价分类图1。表 1 水质监测数据输入界面 1 8 9 维普资讯 http:/ 期 朱纯等环境质量评价的主成分因子分析 的可视化方法 V o L 3 2 N n 7 J u l y 2 0 0 7 图
21、 1 用前两个主成分形成的水质评价分类图 4结论 结果表明,通过 E x c e l L i n k 可将在 E x c e l 开发平 台上利用 M a fl a b强大 的数据处理和图形绘制功 能,为复杂的主成分因子分析模型的计算和图形绘制提 供了极大的方便,通过V B A和 M a fl a b 开发语言的集 成的应用程序,将有助 于实现多元 统计方法及更多 的复杂计算方法在环境质量评价 中的应用。参考文献:1 韩波,林华荣 主成分分析在水质监测优化布点中 的应用 J 中国环境监测,1 9 9 1,7(1):1 21 4 2 姚焕玫,黄仁涛 用改进的主成分分析方法对东源 的水质污染进行评价 J 武汉大学学报,2 0 0 5,3 3(8):1 4 3 苏金明,阮沈勇,王永刚 MA T L A B工程数学 M 北 京:电子工业出版社,2 o 0 5 4 曾得峰,喻元秀,寇学礼 湿地水环境质量的模糊综 合评价一 以贵州省草海高原湿地为例 J 贵州环保科技,2 0 0 6,(2):2 1 2 6 1 9 0 维普资讯 http:/
限制150内