我国主要城市空气质量分析.docx
我国主要城市空气质量分析我国主要城市空气质量分析温桂林厦门大学理学院地信09112020842023【摘要】:空气质量的好坏严重影响到人们的身体健康,已被逐步提上日程,本文通过聚类分析法和主成分分析法,研究现阶段哪些城市的空气质量好,以及各参数对坏境质量的影响。结果显示福州,南宁,海口,拉萨的空气质量相对较好,可吸入颗粒物是影响空气质量的主导因素。【关键词】:空气质量;影响指标;聚类分析;主成分分析0前言我国当前空气大概情况:近年来,我国经济飞速发展,这有赖于工业的进步的突出奉献,然而,工业也带来了一系列环境问题,十分是空气方面的问题。随着可吸入颗粒物,二氧化硫,酸雨等有害物质的增加,人们疾病的发生率也逐年提高。研究意义:干净大气是人类赖于生存的必要条件之一,一个人在五个星期内不吃饭或5天内不喝水,尚能维持生命,但超过5分钟不呼吸空气,便会死亡,人体天天需要吸入1012立方米的空气。因而空气质量的好坏与人类的生存息息相关,评价空气的质量才能反映空气的好坏,才能开展治理等工作。影响因素:空气质量的好坏反映了空气污染程度,它是根据空气中污染物浓度的高低来判定的。空气污染是一个复杂的现象,在特定时间和地点空气污染物浓度遭到很多因素影响。来自固定和流动污染源的人为污染物排放大小是影响空气质量的最主要因素之一,其中包括车辆、船舶、飞机的尾气、工业企业生产排放、居民生活和取暖、垃圾燃烧等。城市的发展密度、地形地貌和气象等也是影响空气质量的重要因素。1研究方法:对于空气质量的分析,各环境科研单位和研究人员都采用过很多种方法,本文主要应用dps软件作聚类分析,得到哪些城市的环保方面做的比拟好,以便作为环保示范点,供其他城市借鉴学习;用spss作主成分分析比照分析各个影响参数对环境质量的影响程度,以便对国家环保局提出对大气的进一步改良。1聚类分析1.1方法基本思想:基于所研究的样品或指标之间存在程度不同的类似性亲疏关系以样品间距离衡量。根据一批样品的多个观测指标,详细找出一些能够度量样品或指标之间类似程度的统计量,以这些统计量为划分类型根据。把一些类似程度较大的样品聚合为一类,把另外一些相互之间类似程度较大的样品又聚合为另一类,直到把所有的样品聚合完毕,这就是聚类的基本思想。21.2衡量指标衡量指标的选取对于聚类分析来讲至关重要,具有决定性的意义,影响空气质量好坏的因素有很多,有,温度,湿度等等,为此本文选取了四个指标,分别是可吸入颗粒物,二氧化硫,二氧化氮,空气质量到达二级以上的天数。用以衡量我国主要的三十一个城市的空气质量3,原文数据如下:通过dps使用离差安然平静方法Ward方法,计算样本的欧氏距离,样本变量根据Z得分进行标准化处理。聚类结果将31个城市分成四种空气质量类型。聚类分析得到的聚类分析图谱如下所示:从聚类分析谱系图能够看出,在不同的聚类标准下,聚类的结果不同:当距离为0时,每个样本为单独的一类,即31个城市各自为一类;当距离为15.45时,31个城市被归为一类。为了将这些城市分为四类,我们取6.18为距离,这样就得出下面四类的城市:第一类:北京,哈尔滨,武汉,成都,南京,杭州,天津,重庆,沈阳,郑州,西安,太原,济南,西宁;第二类:石家庄,银川,长春,长沙,合肥,呼和浩特,南昌,贵阳,上海,广州,昆明;第三类:兰州,乌鲁木齐;第四类:福州,南宁,海口,拉萨;1.4结果分析:根据上述聚类分析的结果,能够将我国31个城市的空气类型分为四类:优,良,污染和轻度污染。第一类型的城市属于污染型城市,这些城市人口密集,交通拥挤,工业发达,像北京这样的全国政治文化中心,汽车拥有量很大,汽车尾气的排放量对空气的污染特别严重,大气急需改善。第二类型的城市属于稍微污染型,这些城市的工业类型多以轻工业为主,对大气的污染较轻。第三类型的城市空气质量良好,不会影响人体的健康。第四类型的城市空气质量优,尤其是拉萨,作为我国独具特色的一个旅游城市,在发展经济的同时,十分需要将环境保护的重要性提上日程,不可再走先污染后治理的道路。2、主成分分析法2.1方法讲明和模型构建:主成分分析是把原来多个变量划分为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。假设有n个地理样本,每个样本共有p个变量,这样就构成了一个n×p阶的地理数据矩阵?=npnnppxxxxxxxxxx212222111211(2.2.1.1)假如记原来的变量指标为x1,x2,xp,它们的综合指标新变量指标为z1,z2,zm,(mp),则?+=+=+=pmpmmmppppxlxlxlzxlxlxlzxlxlxlz22112222121212121111(2.2.1.2)在(2.2.1.2)式中,系数lij由下列原则来决定:1zi与zjij;i,j=1,2,m互相无关。2z1是x1,x2,xp的一切线性组合中方差最大者;z2是与不相关的,x1,x2,xp的所有线性组合中方差最大者;zm是z1,z2,zm1都不相关的,x1,x2,xp的一切线性组合中方差最大者。2.2主成分分析数据处理相关公式1)计算相关系数矩阵 (2.2.2.1)在公式3)中,riji,j=1,2,p)为原来变量xi与xj的相关系数,其计算公式为 (2.2.2.2)由于R是实对称矩阵即rij=rji),所以只需计算其上三角元素或下三角元素即可。2)计算特征值与特征向量首先解特征方程I-R=0求出特征值ii=1,2,p),并使其按大小顺序排列,即12,p0;然后分别求出对应于特征值i的特征向量eii=1,2,p)。3)计算主成分奉献率及累计奉献率一般取累计奉献率达85-95的特征值1,2,m所对应的第一,第二,第mmp)个主成分。4)计算主成分载荷 (2.2.2.3)由此能够进一步计算主成分得分:(2.2.2.4)52.3衡量指标:影响空气质量的因素有15个之多,本方法选取可吸入颗粒物因子1,二氧化氮因子2,二氧化硫因子3,温度因子4,湿度因子5。分别反映了影响方面:呼吸健康影响前三个,热舒适度温度和湿度。数据如下:城市可吸入颗粒物二氧化硫二氧化氮年平均气温年平均相对湿度北京0.1210.0340.05313.351天津0.1010.0560.04012.958石家庄0.1040.0450.03514.457太原0.1060.0750.02211.154呼和浩特0.0740.0490.040844沈阳0.1100.0590.0377.767长春0.0850.0340.0436.160哈尔滨0.1010.0460.054565上海0.0810.0350.05317.470南京0.1000.0350.04816.472杭州0.0970.0410.05217.871合肥0.1110.0230.02716.773福州0.0640.0140.04020.770南昌0.0790.0540.03718.870济南0.1230.0500.02514.854郑州0.0990.0530.04615.561武汉0.1050.0440.05417.971长沙0.0920.0390.04218.572广州0.0700.0390.0562370南宁0.0500.0320.02822.275海口0.0380.0070.01624.381重庆0.1050.0530.0371980成都0.1110.0380.05516.874贵阳0.0740.0580.02614.974昆明0.0670.0410.04616.666拉萨0.0500.0080.02110.331西安0.1130.0480.04615.170兰州0.1500.0590.043853西宁0.1410.0420.0326.259本数据来源于中国统计年鉴202042.4数据的运算:2.3.1样本的标准化选取的指标具有不同的量纲和量纲单位,对选区价指标进行标准化处理,使其无量纲化,进而能够得到一样的协方差矩阵或相关矩阵。2.3.2因子spss分析根据所述原理,将标准后的样本数据输入spss软件进行主成分分析,并取特征值为大于1,得到累计奉献大于85%的主成分,结果如图:进而得到主成分方程:=0.813+0.755+0.389-0.826-0.539;=0.276+0.315+0.694+0.409+0.732;=0.200+0.387-0.601+0.084+0.281;用这三个因子代替原来的5个变量能够概括全部信息的87.062%。因而,描绘空气质量,能够用这三个因子,使问题更进一步简化,明了。2.3.3综合评价经过spss分析最终得出综合主成分得分表5,它反响了各样本的综合水平可吸入颗粒物成为我国主要城市空气污染的主要污染源。在第二主成分上,空气湿度的得分最高,表明湿度在一定程度上也能够影响空气的质量。在第三主成分上,二氧化硫的得分最高,这在一定程度上讲明汽车尾气,工厂废气带来的危害。2.3.4分析与讨论为了使各主成分影响指标愈加明显,在使用spss软件分析时要求得到正交方差旋转后的因子载荷矩阵,如下表表3正交方差旋转后的因子载荷矩阵因子1因子2因子3x(1)0.3003-0.0683-0.1827x(2)0.9348-0.0481-0.1497x(3)0.13310.0693-0.9772x(4)-0.20340.41920.0299x(5)-0.03980.9554-0.0749主成分中,的系数大于其他变量的系数,因而主要是影响人体呼吸健康的综合指标。代表着原有信息的47.1193,解释为主要因子的原因是人为造成的环境空气中颗粒物,氮氧化物和硫氧化物的增加。主成分中,的系数大于其他变量的系数,因而主要反映了人体热舒适度指标,代表着原有信息27.1921%。3、结语在选择分析方法是要慎重,通常的分析方法会忽略了各指标内在的相关性,在综合评分中人为决定权数进而带有很强的主观性,一方面会掩饰各参数互相影响的情况,另一方面导致普通群众的误解。而本文选择的分析方法能够减少人为赋权产生的主观缺陷,极大地利用环境各参数的实际信息,具有很好的使用价值,为普通群众提供一个很好的参考根据。6【参考文献】1重庆市环境保护局.空气质量受何因素影响2百度百科:/docsj/doc/b3c9cec39ec3d5bbfd0a74d4.html/view/903740.htm3王娟.对我国主要城市空气质量的聚类分析.百度文库4福建省统计年鉴2020主要城市空气质量指标5(计量地理学)徐建华北京:高等教育出版社2006.181996郭建辉,杨磊,程新宝.上海市环境空气质量影响参数主成分分析.中国科技信息2005年第15期