2022年数学建模A题国家一等奖 .pdf
2011高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料) ,必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从A/B/C/D 中选择一项填写):A 我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名) :参赛队员(打印并签名 ) :1. 2. 3. 指导教师或指导教师组负责人(打印并签名 ):日期: 2011 年 09 月 12 日赛区评阅编号(由赛区组委会评阅前进行编号):名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 28 页 - - - - - - - - - 2011高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 28 页 - - - - - - - - - 1 城市表层土壤重金属污染分析摘要本文针对城市表层土壤受重金属污染问题进行综合分析。首先运用Matlab软件求解8 种主要重金属元素在城区空间分布,土壤受污染主要原因,传播特征以及为今后如何更好研究地质演变问题分别建立了相应的数学模型,并对其求解结果作出了分析。针对问题 1,根据各种污染物浓度在不同区域内分布的随机性,利用空间内插值法,以城市位置为平面“横纵向” ,污染物浓度为“竖向”建立三维空间模型,得到这8 种重金属元素的空间分布图,直观反映出污染物浓度的等值线,得到污染物浓度的分布规律和各种重金属元素的污染浓度范围区块。然后通过建立污染负荷指数法模型算出各区的)(PLI值,生活区)(PLI为 1.8336,工业区)(PLI为 2.1573,山区)(PLI为 1.0602,交通区)(PLI为 1.9209,公园绿地区)(PLI为 1.5780;结果表明工业区的污染程度最高为 2 级强污染,其他区为1 级中等污染。针对问题 2,根据问题1 中不同功能区重金属的污染程度与附件2 的数据,利用Pearson相关性分析和主成分分析法,建立了相关性模型与主成分模型,对应找出各区重金属污染的主要因子,得到该城区的重金属污染主要元素为:ugCdCHPb、,污染主要原因为冶炼、化物生产等工业废水、污泥,汽车尾气排放。针对问题 3,根据重金属污染物的圆型传播特征,利用物理热力学第二定理,分别建立了一维土壤迁移模型、沉降模型和最优解模型,确定了生活区有3 个污染源:分别为样本点 20、306、259;工业区的污染源为样本点261 ;山区的污染源为样本点62 ;交通区有 2 个污染源:分别为样本点245、292 ;公园绿地区的污染源为样本点315 。其结果与重金属元素在该城区的空间分布图作对比,吻合得很好。针对问题 4,通过对问题 1,2,3所建模型优缺点的分析, 为更好地研究城市地质环境的演变模式,还应收集城区每年生活、工业等重要污染源的垃圾排放放量、每年的生物降解量、排污企业个数的增减值、PH值、河流所经区域等信息。根据这些信息建立时间序列模型,用此模型预测未来时间段该城区的土壤中重金属含量变化情况,结合问题1,2,3 所建模型可以更好地为今后如何使用专业降浓剂保证土壤良好性的用剂量提供参考依据。关键词: 重金属空间分布污染负荷指数主成份分析最优解名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 28 页 - - - - - - - - - 2 一、问题重述随着城市经济的快速发展和城市人口的不断增加,人类活动对城市环境质量的影响日显突出。对城市土壤地质环境异常的查证,以及如何应用查证获得的海量数据资料开展城市环境质量评价,研究人类活动影响下城市地质环境的演变模式,日益成为人们关注的焦点。按照功能划分,城区一般可分为生活区、工业区、山区、主干道路区及公园绿地区等,分别记为1 类区、 2 类区、5 类区,不同的区域环境受人类活动影响的程度不同。现对某城市城区土壤地质环境进行调查。为此,将所考察的城区划分为间距1 公里左右的网格子区域,按照每平方公里1 个采样点对表层土( 010 厘米深度)进行取样、编号,并用GPS 记录采样点的位置。应用专门仪器测试分析,获得了每个样本所含的多种化学元素的浓度数据。另一方面,按照2 公里的间距在那些远离人群及工业活动的自然区取样,将其作为该城区表层土壤中元素的背景值。附件 1 列出了采样点的位置、海拔高度及其所属功能区等信息,附件2 列出了 8 种主要重金属元素在采样点处的浓度,附件3 列出了 8 种主要重金属元素的背景值。通过数学建模来完成以下任务:(1) 给出 8 种主要重金属元素在该城区的空间分布,并分析该城区内不同区域重金属的污染程度。(2) 通过数据分析,说明重金属污染的主要原因。(3) 分析重金属污染物的传播特征,由此建立模型,确定污染源的位置。(4) 分析你所建立模型的优缺点,为更好地研究城市地质环境的演变模式,还应收集什么信息?有了这些信息,如何建立模型解决问题?二、问题分析2.1 问题一的分析通过对附件 1 的数据进行处理求出该城区的城区状貌,并对该城区利用三维插值法求出 8 种主要重金属元素在该城区的空间分布。并对 8 种金属分别进行查找出各自范围区块。利用最高污染系数)(CF分别求出 8 种重金属的各自污染系数,然后利用污染负荷指数法)(PLI求出 319 个地点的重金属污染程度。根据这些地点的污染程度对5 个不同区域进去综合评价得出不同区域的污染程度。2.2 问题二的分析研究重金属污染的主要原因既为研究重金属污染的主要来源,而同一活动可以产生许多污染物,同一种污染物的来源也不尽相同。因此利用Pearson相关分析和主成份分析方法解析重金属污染的元素和分析土壤重金属污染物的来源和类别。通过对附件 2、3的数据进行分析综合运用这些统计分析方法来分析5个不同区域的 8种重金属污染物的来源,并对 5 个不同区域查找相关性比较强的区域。最后综合5 个不同区域的来源分析出该城区的重金属污染的主要原因。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 28 页 - - - - - - - - - 3 2.3 问题三的分析对于重金属的传播特征形式, 利用生物学基础对各种金属在该城区的传播形式进行假设分析出三种传播特征:圆型传播、条型传播、散点传播。结合前两问求出的结果和8 种主要金属元素浓度含量的空间分布图分别求出属于圆型传播、条型传播、散点传播的金属元素,由此可对这8 种重金属元素综合归类为那种传播特征。由于污染源在不同区域的位置对各个区域的影响有一个直接影响值,在污染源数目较多的场合下,要确定最优解的模型污染源是很困难的,而且在处理数据时还有考虑该地区的地势情况中的地下金属传播途径的迁移形式和大气中大气降沉形式,则综合考虑该城区的污染源就更困难。因此通过对模型的研究,建立迁移模型、沉降模型对土壤金属流动进行分析,再结合最优解模型找出该城区5个不同区域的污染源。2.4 问题四的分析对于前三问建立的模型和结果进行分析查找出所建立的模型对该城区和不同区域的优缺点。由于该城区的城市布局和降水量,PH值等不知道,因此需要去完善模型并预测地质的演变,就得收集城区每年生活工业等重要污染源的垃圾排放放量以及每年的生物降解量,降雨量,PH值,河流所经区域等。通过这些数据建立起各重金属元素与时间有关的时间预测模型,由此可预测出未来时间段内的土壤重金属浓度,即知道该城区地质环境的演变模式。且根据不同功能区的不同安全浓度指标,以及考虑大气压降和地势海拔等因素,制定出未来时间段内如何使用专业降浓剂保证土壤良好性的用剂量,这样,既达保证了经济效益又保护了土壤环境。三、问题假设1.该城区城市布局合理;2.该城区土壤重金属元素来源不受其他城区影响,数据采样都是可靠准确;3.假设每个样本点都能很好的反映该平方公里的实际情况;4.污染物的排放瞬时完成,且排放速率恒定;5.气体的传播服从扩散定律,非稳态;6.污染物的沉降速率恒定;四、符号说明iCF:元素的最高污染系数;iC:元素 i 的实测含量;iC0:元素 i 的评价标准,既背景值。P L I:污染负荷指数 ; c:土壤重金属在液相的浓度;s:土壤重金属在固相中的浓度;ijM:在区域点, i j重金属浓度;M :总重金属的浓度;tQ:土壤重某金属在 t 年后的含量;t :预测年限;n:评价元素的个数;名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 28 页 - - - - - - - - - 4 z o n eP L I为区域污染负荷指数;m为评价点的个数(采样点的个数) 。五、问题一的解答5.1 空间分布对附件 1的 319个随机地点中的)海拔( mmymx),(),(做一个三维曲线拟合得该城区的城区状貌。如图1. 0123x 10400.511.52x 104-200-1000100200300400图 1 该城区状貌由图 1 可以得到该城区的城区状貌, 然后利用附件 2 的 8 种金属元素浓度代替海拔()m就可以得出 8 种金属元素在该地区的空间分布图如图2 所示。00.511.522.5x 104020004000600080001000012000140001600018000-15-10-5051015202530As00.511.522.5x 104020004000600080001000012000140001600018000-1500-1000-500050010001500Cd名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 28 页 - - - - - - - - - 5 00.511.522.5x 104020004000600080001000012000140001600018000-1000-800-600-400-2000200400600800Cr00.511.522.5x 104020004000600080001000012000140001600018000-1000-50005001000150020002500Cu00.511.522.5x 104020004000600080001000012000140001600018000-5000050001000015000Hg00.511.522.5x 104020004000600080001000012000140001600018000-100-50050100Ni00.511.522.5x 104020004000600080001000012000140001600018000-1500-1000-5000500100015002000250030003500Zn00.511.522.5x 1040200040006000800010000120001400016000180000100200300400500Pb图 2 8 种主要金属元素浓度的空间分布由图 2 的 8 种主要金属元素浓度空间分布图可对比出每种元素的浓度高涵盖点区,再结合附件 1、2 对数据进行处理,则可以得出该种元素的污染浓度范围区域,其具体情况如表 1 所示。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 28 页 - - - - - - - - - 6 表 1 8 种元素的污染浓度范围元素区域数污染浓度范围As3 交通区 95 号;交通区 22 号和生活区 1 号地点组合;工业区29 号Cd4 交通区 95 号;工业区 223号;交通区 22 号和生活区 1 号组合;工业区 6、8 号和交通区的 9 号组合Cr1 生活区 20 号和交通区 22 号组合Cu1 工业区 8 号和交通区 22 号组合Hg3 工业区 8 号和交通区 9 号组合;交通区 182 号;交通区 257 号Ni2 交通区 22 号;山区 135 号Pb2 生活区 16、20 号和公园绿地区 143 号组合;工业区 6、8 号组合Zn2 生活区 36 号;交通区 61 号5.2 污染程度污染负荷指数法模型污染负荷指数法是Tomlinson等人从事重金属污染水平的分级研究中提出来的一种评价方法。该指数又评价区域所包含的多种重金属成分共同构成,并使用了求积的统计法,通过这种方法能对整个区域各个点位各种重金属进行定量评价,并对各点的污染程度进行分级,能直观反映对环境污染最严重的元素和各种元素对环境污染的贡献程度,以及重金属在时间、空间上的变化趋势,应用比较方便 1。能避免污染指数加和关系造成的对评价结果歪曲的现象,并能对任意给定的区域进行定量的判断。他也采用研究区土壤背景值为评价标准,因此它能很好的判断土壤的综合人为污染情况。首先根据某一点的测量金属含量,进行最高污染系数(CF)的计算2: iiiCCCF0(1)某一点的污染负荷指数(PLI)为:nnCFCFCFCFPLI321(2)某一区域的污染负荷指数(zonePLI)为:mmz o n eP L IP L IP L IP L IP L I321(3)表 2 污染负荷指数与污染程度之间的关系PLI值121323污染等级0 1 2 3 污染程度无污染中等污染强污染极强污染名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 28 页 - - - - - - - - - 7 通过Matlab程序可以计算出各个地点的最高污染系数和污染负荷指数(程序见附录1) , 并结合这些点的数据综合评价得出如表3所示的五个区域的污染负荷指数 (zonePLI) 。表 3 五个区域的污染负荷指数(zonePLI)生活区工业区山区交通区公园绿地区PLI值1.8336 2.1573 1.0602 1.9209 1.5780 污染级数1 2 1 1 1 污染程度中等污染强污染中等污染中等污染中等污染由上表可知该城区内不同区域重金属的污染程度为中等污染的区域有生活区、山区、交通区、公园绿地区。强污染的区域有工业区。六、问题二的解答研究土壤重金属污染的主要原因需要调查污染土壤中各种污染物的影响因素。土壤重金属污染影响因素主要指产生重金属污染物的设备、位置、场所等污染源 3。这些污染源产生的重金属污染有的直接进入土壤,有的则是通过大气和水体再沉降进入土壤,造成城区土壤的重金属污染。按重金属污染物产生的部门,土壤重金属污染源主要分为工业污染源、交通污染源、生活污染源、农药和肥料等。具体来源参见表4 中国土壤重金属的主要来源4。表 4 中国土壤重金属的主要来源重金属来源As硫酸、农药、医药、化肥、玻璃等工业废水、废气、农药Cd冶炼、电镀、燃料等工业废水、污泥和废气、肥料杂质Cr冶炼、电镀、制革、印染等工业废水和污泥Cu冶炼、铜制品生产等废水、废渣和污泥,含铜农药Hg制烧碱、 Hg 化物生产等工业废水和污泥、含Hg 农药、 Hg 蒸Ni冶炼、电镀、炼油、染料等工业废水和污泥Pb颜料、冶炼等工业废水,汽车防爆燃料尾气,农药Zn冶炼、镀锌、纺织等工业废水和污泥、废渣,含锌农药同一区域可以产生许多污染物,同一种污染物的来源也不尽相同。相关分析和主成分分析等常规统计方法常用于污染物源解析中。为了更好地分析土壤重金属污染物的来源和类别,综合运用这些统计分析方法来分析5个不同区域的 8种重金属污染物的来源。最后综合 5 个不同区域的来源分析出该城区的重金属污染的主要因素。6.1 相关分析模型相关分析就是研究两个或两个以上变量之间相互关系的统计分析方法。在环境研究中常用来定性的分析研究各环境变量之间的相互关系,而变量之间的相互关系用相关系数和相关系数的显著水平来表示6。 相关分析法有多种,环境研究中最常用的是Pearson相关分析法。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 9 页,共 28 页 - - - - - - - - - 8 相关系数:考察两个事物(在数据里我们称之为变量)之间的相关程度。如果有两个变量: X、Y,最终计算出的相关系数的含义可以有如下理解:(1) 、当相关系数为 0 时,X和 Y两变量无关系。(2) 、当 X的值增大(减小), Y值增大(减小),两个变量为正相关,相关系数在0.00与 1.00 之间。(3) 、当 X的值增大(减小) ,Y值减小(增大),两个变量为负相关,相关系数在-1.00与 0.00 之间。相关系数的绝对值越大,相关性越强,相关系数越接近于1 或-1 ,相关度越强,相关系数越接近于 0,相关度越弱。通常情况下通过以下取值范围判断变量的相关强度:相关系数 0.8-1.0 极强相关 0.6-0.8 强相关 0.4-0.6 中等程度相关 0.2-0.4 弱相关 0.0-0.2 极弱相关或无相关Pearson(皮尔逊)相关系数1、简介皮尔逊相关也称为积差相关(或积矩相关)是英国统计学家皮尔逊于20 世纪提出的一种计算直线相关的方法。假设有两个变量 X、Y,那么两变量间的皮尔逊相关系数可通过以下公式计算:公式一:公式二:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 10 页,共 28 页 - - - - - - - - - 9 公式三:公式四:以上列出的四个公式等价,其中E是数学期望, cov 表示协方差, N表示变量取值的个数。2、适用范围当两个变量的标准差都不为零时,相关系数才有定义,皮尔逊相关系数适用于:(1) 、两个变量之间是线性关系,都是连续数据。(2) 、两个变量的总体是正态分布,或接近正态的单峰分布。(3) 、两个变量的观测值是成对的,每对观测值之间相互独立。3、Matlab 实现皮尔逊相关系数的Matlab 实现(依据公式四实现):cppview plaincopy1. function coeff = myPearson(X , Y) 2. % 本函数实现了皮尔逊相关系数的计算操作3. % 4. % 输入:5. % X :输入的数值序列6. % Y :输入的数值序列7. % 8. % 输出:9. % coeff:两个输入数值序列X,Y的相关系数名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 11 页,共 28 页 - - - - - - - - - 10 10. % 11.12.13. if length(X) = length(Y) 14. error( 两个数值数列的维数不相等 ); 15.return ; 16. end 17.18. fenzi = sum(X .* Y) - (sum(X) * sum(Y) / length(X); 19. fenmu = sqrt(sum(X .2) - sum(X)2 / length(X) * (sum(Y .2) - sum(Y)2 / length(X); 20. coeff = fenzi / fenmu; 21.22. end %函数 myPearson结束也可以使用 Matlab 中已有的函数计算皮尔逊相关系数:cppview plaincopy1. coeff = corr(X , Y); Spearman Rank (斯皮尔曼等级)相关系数 1 、简介在统计学中,斯皮尔曼等级相关系数以Charles Spearman 命名,并经常用希腊字母(rho)表示其值。斯皮尔曼等级相关系数用来估计两个变量X、Y之间的相关性,其中变量间的相关性可以使用单调函数来描述。如果两个变量取值的两个集合中均不存在相同的两个元素,那么,当其中一个变量可以表示为另一个变量的很好的单调函数时(即两个变量的变化趋势相同),两个变量之间的 可以达到 +1或-1。假设两个随机变量分别为X、Y(也可以看做两个集合),它们的元素个数均为N,两个随即变量取的第i (1=i=N)个值分别用 Xi、Yi表示。对 X、Y进行排序(同时为升序或降序),得到两个元素排行集合x、y,其中元素 xi、yi分别为 Xi在 X中的排行以及 Yi在 Y中的排行。将集合x、y 中的元素对应相减得到一个排行差分集合d,其中di=xi-yi,1=i=N。随机变量 X、Y之间的斯皮尔曼等级相关系数可以由x、y 或者 d 计算得到,其计算方式如下所示:由排行差分集合 d 计算而得(公式一):名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 12 页,共 28 页 - - - - - - - - - 11 由排行集合 x、y 计算而得(斯皮尔曼等级相关系数同时也被认为是经过排行的两个随即变量的皮尔逊相关系数,以下实际是计算x、y 的皮尔逊相关系数)(公式二):以下是一个计算集合中元素排行的例子(仅适用于斯皮尔曼等级相关系数的计算)这里需要注意:当变量的两个值相同时,它们的排行是通过对它们位置进行平均而得到的。2、适用范围斯皮尔曼等级相关系数对数据条件的要求没有皮尔逊相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关系数来进行研究。Kendall Rank (肯德尔等级)相关系数1、简介在统计学中,肯德尔相关系数是以Maurice Kendall 命名的,并经常用希腊字母 (tau )表示其值。肯德尔相关系数是一个用来测量两个随机变量相关性的统计值。一个肯德尔检验是一个无参数假设检验, 它使用计算而得的相关系数去检验两个随机变量的统计依赖性。肯德尔相关系数的取值范围在-1 到 1 之间,当 为 1 时,表示两个随机变量拥有一致的等级相关性;当 为-1 时,表示两个随机变量拥有完全相反的等级相关性;当 为 0 时,表示两个随机变量是相互独立的。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 13 页,共 28 页 - - - - - - - - - 12 假设两个随机变量分别为X、Y(也可以看做两个集合),它们的元素个数均为N,两个随即变量取的第i (1=i=N)个值分别用 Xi、Yi表示。 X与 Y中的对应元素组成一个元素对集合 XY ,其包含的元素为 (Xi, Yi)(1=iXj且 YiYj,情况 2:XiXj且 YiXj且 YiYj,情况 4:XiYj),这两个元素被认为是不一致的。当出现情况5 或 6时(情况 5:Xi=Xj,情况 6:Yi=Yj),这两个元素既不是一致的也不是不一致的。这里有三个公式计算肯德尔相关系数的值公式一:其中 C表示 XY中拥有一致性的元素对数(两个元素为一对);D表示 XY中拥有不一致性的元素对数。注意: 这一公式仅适用于集合X与 Y中均不存在相同元素的情况 (集合中各个元素唯一) 。公式二:注意:这一公式适用于集合X或 Y中存在相同元素的情况(当然,如果X或 Y中均不存在相同的元素时,公式二便等同于公式一)。其中 C、D与公式一中相同;N1、N2分别是针对集合 X、Y计算的,现在以计算N1为例,给出 N1的由来( N2的计算可以类推):将 X中的相同元素分别组合成小集合,s 表示集合 X中拥有的小集合数(例如X包含元素:1 2 3 4 3 3 2,那么这里得到的s 则为 2,因为只有 2、3 有相同元素), Ui表示第 i 个小集合所包含的元素数。N2在集合 Y的基础上计算而得。公式三:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 14 页,共 28 页 - - - - - - - - - 13 注意:这一公式中没有再考虑集合X、或 Y中存在相同元素给最后的统计值带来的影响。公式三的这一计算形式仅适用于用表格表示的随机变量X、Y之间相关系数的计算(下面将会介绍)。参数 M稍后会做介绍。以上都是围绕用集合表示的随机变量而计算肯德尔相关系数的,下面所讲的则是围绕用表格表示的随机变量而计算肯德尔相关系数的。通常人们会将两个随机变量的取值制作成一个表格,例如有10 个样本,对每个样本进行两项指标测试 X、Y (指标 X、Y的取值均为 1 到 3)。根据样本的 X、Y指标取值,得到以下二维表格(表1):由表 1 可以得到 X及 Y的可以以集合的形式表示为:X=1, 1, 2, 2, 2, 2, 2, 3, 3, 3;Y=1, 2, 1, 1, 2, 2, 3, 2, 3, 3;得到 X、Y的集合形式后就可以使用以上的公式一或公式二计算X、Y的肯德尔相关系数了(注意公式一、二的适用条件)。当然如果给定 X、Y的集合形式,那么也是很容易得到它们的表格形式的。这里需要注意的是:公式二也可以用来计算表格形式表示的二维变量的肯德尔相关系数,不过它一般用来计算由正方形表格表示的二维变量的肯德尔相关系数,公式三则只是用来计算由长方形表格表示的二维变量的Kendall 相关系数。这里给出公式三中字母M的含义, M表示长方形表格中行数与列数中较小的一个。表1 的行数及列数均为三。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 15 页,共 28 页 - - - - - - - - - 14 2 、适用范围肯德尔相关系数与斯皮尔曼相关系数对数据条件的要求相同,可参见斯皮尔曼相关系数对数据条件的要求。相关系数矩阵ppijrR)(),2, 1,( ,11pjinxxrnkkjkiij(4)式中:ijjiijijrrrr, 1是第 i 指标与第j指标的相关系数。在重金属污染源解析中,当两种重金属含量绝对值最大,表明这两种重金属很可能来自同种污染源。1).生活区的相关矩阵结果见表表5 所示。表 5 生活区Pearson相关矩阵从相关性分析结果可以发现, 土壤中Cd与Pb显著正相关,且相关性较强; 其次As与Ni、Cu也到达了显著的正相关。以此类似可作出其他4 个区域的Pearson相关矩阵(见附录 2) 。6.2 主成份分析模型多变量研究中,由于变量的个数很多,并且彼此往往存在一定的相关性,因此使观察的数据反映的信息在一定程度上重叠。因子分析则是通过一种降维方法进行简化得到综合指标。综合指标之间既互不相关,又能反映原来的观察指标的信息5。1.计算特征值和特征向量计算相关系数矩阵,及对应的特征向量120pL,及对应的特征向量12,pu uuL,其中12(,)TjjjnpuuuuL,由特征向量组成 m个新的指标变量As (ug/g) Cd (ng/g) Cr (ug/g) Cu (ug/g) Hg (ng/g) Ni (ug/g) Pb (ug/g) 相关As (ug/g) Cd (ng/g) 0.381 Cr (ug/g) 0.238 0.349 Cu (ug/g) 0.531 0.499 0.376 Hg (ng/g) 0.293 0.397 0.150 0.198 Ni ug/g) 0.605 0.283 0.527 0.434 0.211 Pb (ug/g) 0.450 0.802 0.416 0.502 0.340 0.300 Zn (ug/g) -0.017 0.346 0.412 0.238 0.242 0.334 0.328 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 16 页,共 28 页 - - - - - - - - - 15 11 112 12121 212 2221122nnnnmmmnmnyu xu xu xyu xu xuxyuxuxuxLLL L L L L L L L L L LL(5)式中1y是第一主成分,2y是第二主成分,L,my是第 m主成分。2.选择()p pm个主成分,计算综合评价值A.计算特征值1,2,jjmL的信息贡献率和累积贡献率。称1(1, 2 ,)jjmkkbjmL(6)为主成分jy 的信息贡献率;11pkkpmkka(7)为主成分12,py yyL的累积贡献率,当pa 接近于 1(0.85,0.90,0.95)pa)时,则选择前 p 个指标变量12,pyyyL作为 p个主成份, 代替原来 m 个指标变量,从而可对 p 个主成分进行综合分析。B.计算综合得分:pjjjybz1(8)其中:jb 为第j个主成分的信息贡献率,根据综合得分就可进行评价。由此可分别计算得 8 个不同区域的特征值和主成份因子;1).生活区的结果如表6 所示。表 6 生活区解释的总方差对生活区域的土壤样品中8 中重金属进行主成份分析, 提取出 3 个因子解释了总方差的 72.797%,其中因子 1 解释了总方差的 45.199%,因子 2 解释了总方差的 14.165%,因子 3 解释了总方差的 13.432%。表 7 给出了生活区的成份得分系数矩阵(因子载荷矩阵)表 7 生活区的成份得分系数矩阵(因子载荷矩阵)As ( g/g)Cd (ng/g) Cr ( g/g)Cu ( g/g)Hg (ng/g) Ni ( g/g)Pb ( g/g)Zn ( g/g)1 0.06 0.424 -0.092 0.112 0.364 -0.169 0.381 0.064 因子特征值方差的的百分率(%)累积贡献率( %)1 3.616 45.199 45.199 2 1.133 14.165 59.365 3 1.075 13.432 72.797 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 17 页,共 28 页 - - - - - - - - - 16 成分2 -0.284 0.008 0.475 -0.026 -0.068 0.212 0.011 0.609 3 0.454 -0.039 0.17 0.282 -0.087 0.424 0.014 -0.149 因子分析的主要目的是将具有相近的因子载荷的各个变量置于一个公因子之下,变量与某个因子的联系系数绝对值(荷载)越大,则该因子与变量关系越近。根据因子载荷矩阵,主成份1 为Cd、Hg、Pb的组合,这说明这几种土壤重金属污染物可能是同一来源或相似来源。主成份2 为Cr、Zn。主成份 3 为 As、Cu、Ni。主成份 1 的方差累积贡献率达到45.199%,这可以解释Cd、Hg、Pb为该生活区土壤重金属的主要污染元素。通过因子分析结果参照土壤重金属的主要来源,认为该生活区土壤重金属污染物可能来源于生活化物排污,废渣,废水以及汽车尾气。Pearson相关分析和主成份分析结果表明该生活区的Cd、Hg、Pb可能都主要来自同一污染源。同理结合 Pearson相关分析和主成份分析可得出其他另外4个区域的污染源。 (表见附录 2) ,表 8 列出了五个不同区污染源。表 8 五个不同区污染源功能区主要污染元素重金属污染物可能来源生活区Cd、Hg、Pb 生活化物排污,废渣,废水以及汽车尾气。工业区Cr、Cu、Hg 、Pb 冶炼、电镀、制革、印染、铜制品生产、Hg 化物生产等废水、废渣和污泥山区As、Cd、Cu、Hg、Ni、Pb 化肥、肥料杂质,农药,含Cu、Hg 农药交通区Cd、 Cu、 Hg、 Pb、Zn 燃料污泥和废气,汽车防爆燃料尾气公园绿地区Cd、Cu、Pb、Zn 污泥,肥料杂质,含Cu、Zn 农药对以上 5 个不同区域进行综合分析得出区与区之间的相关性也比较大,由主要污染源和污染元素来分析发现工业区与交通区的相关性比较大,则两者可以规划为同一污染区,污染源主要是废气、废水;生活区和山区、公园绿地区的相关性比较大,则三者可规划为同一污染区,污染源主要是化物、农药。综合分析得出该城区的重金属污染主要元素:Cu、Cd、Hg、Pb。重金属污染物的主要原因是:冶炼、化物生产等工业废水、污泥和废气、肥料杂质,汽车防爆燃料尾气,含Cu、Hg农药。七、问题三的解答7.1 传播特征分析对于重金属的传播特征形式, 利用生物学基础对各种金属在该城区的传播形式进行假设分析出三种传播特征:圆型传播、条型传播、散点传播。现结合求出的问题一、二结果进行分析得出传播特征情况,特别是结合 8 种主要金属元素浓度含量的空间分布图可以看出属于圆型传播的金属元素为:As、Cd、Cu、Hg、Pb、Zn;条型传播的金名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 18 页,共 28 页 - - - - - - - - - 17 属元素为:Cr、Ni、As;散点传播的金属元素为:As、Cd;由此可对这 8种重金属元素综合归类为圆型传播特征。7.2 模型研究由于污染源在不同区域的位置对各个区域的影响有一个直接影响值,在污染源数目较多的场合下,要确定最优解的模型污染源是很困难的,而且在处理数据时还有考虑该地区的地势情况中的地下金属传播途径的迁移形式,而在大气中也通过大气降沉形式给土壤输送金属元素。则综合考虑该城区的污染源就更困难。因此通过对模型的研究,建立迁移模型、沉降模型对土壤金属流动进行分析,再结合最优解模型找出该城区的污染源。7.3 模型的建立1.迁移模型迁移模型描述由对流和弥散引起的土壤溶质迁移。对于重金属来说,在对流弥散过程中常伴随有较为强烈的吸附或分解过程,且存在作物根系吸收和排出。则此类土壤溶液流态可分为稳态流和非稳态流或瞬态流。由于该城区的流态并未知道,因此我们假设该城区为非稳态流。非稳态迁移模型为:tzqCCqDSCzztt,(9)式中C:土壤重金属在液相的浓度, mg/L;:土壤含水率,3m/3m;:土壤干容重,kg/L;S:土壤重金属在固相中的浓度,gg /;qD,:弥散系数,sm /2;q:水流流速,m/s;t: 时间 , s; z: 土壤深度坐标,m;t