空气中PM2.5问答题的研究.doc
《空气中PM2.5问答题的研究.doc》由会员分享,可在线阅读,更多相关《空气中PM2.5问答题的研究.doc(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、+参赛密码 (由组委会填写) “华为杯”第十三届全国研究生数学建模竞赛学 校参赛队号队员姓名1.2.3.参赛密码 (由组委会填写)题 目 空气中PM2.5问题的研究摘 要:本文主要是分析空气中PM2.5的污染问题,建立了相关分析、多元线性回归模型、模糊综合评价模型、改进柯西分布函数模型、双目标非线性规划模型等,通过定性定量分析,从与PM2.5相关因素分析、分布与演变以及空气质量控制管理等方面进行研究与分析。问题一:1、针对第一问,主要定性定量分析PM2.5余其它5项指标的相关性与独立性。首先,对附件1数据进行初筛和归一化处理,剔除缺失值。其次,建立相关分析模型,分析了各个AQI指标之间的相关性
2、,发现PM2.5与其它除分指标的相关系数均大于0.7,线性相关程度较高;与各个分指标均呈负相关。然后,根据正态性原则,选出不满足统计学规律的点,由上述相关性结论检验这些异常点。2、针对第二问,建立了PM2.5与其它5项分指标之间的多元线性回归模型,并根据剔除缺失值和异常数据求解多元回归方程后,结果为:问题二:1、针对第一小问,本文将时空分布规律分别建立时间模型与空间模型进行求解。首先,建立PM2.5与SO2、NO2、PM10的三元线性回归方程来估计数据2中PM2.5中缺失的2010年1月到2012年12月的数据得到PM2.5的时间分布图,然后建立关于PM2.5的二维插值模型得到了关于各地区的空
3、间分布图。最后根据环境空气质量标准建立了模糊综合评价模型,并根据最大隶属度原则将13个地区的污染程度进行评估,模型结果表明:13个监测点污染程度为轻度污染的有:小寨、长安区、临潼区、曲江文化集团和纺织城,中度污染的有:阎良区、兴庆小区、经开区、广运潭、市人民体育场、草滩、高新西区和高压开关厂。2、针对第二小问,本文建立了不同季节下关于风力、湿度、温度的三元线性回归模型,并利用该地的数据对PM2.5的分指标进行定性与定量的分析,针对第三小问,建立了高斯点源扩散模型,分析扩散与衰减现象。3、针对第三小问,本文建立了PM2.5的浓度扩散模型PM2.5;然后,对PM2.5 污染扩散预测模型进行了参数估
4、计;最后,代入实例得到了各个监测点PM2.5 浓度的预测评估结果,如高新西区为重度污染区域,广运潭为安全区域。4、针对第四小问,用残差检验与稳定性检验了模型合理性,并总结已有研究成果给出了PM2.5 的成因、演变等一般性规律。问题三:1、针对问题一,给出合理的PM2.5治理计划:考虑到实际环境治理过程中,往往是分期进行治理工作的,而且治理进度是先慢变快,再由快变慢(这种变化规律与柯西分布函数的变化规律很相似)。因此可以将PM2.5的治理计划分为前期(准备期),中期(治理期),后期(稳固期)三个时期,并由改进的柯西分布函数对治理计划进行模拟,得出与实际环境治理过程相符的分期治理计划如下:时期前期
5、中期后期年次第一年第二年第三年第四年第五年年终平均浓度256.9381176.5296101.591358.0335治理量23.061980.408974.937943.561323.032、针对问题二,本文考虑经济投入与决策部门满意度两个因素,建立双目标规划模型,既使得五年投入的总经费较少,又使决策部门对投入金额造成的结果满意度较高。在求解过程中,通过将满意度作为约束条件,将双目标规划转化为单目标规划求解,通过不断改变满意度得出4中不同方案,将4种方案合理对比得到了最后的方案为:五年投入总费用为8.59(百万元),每年综合治理量为1.39,专项治理量为8.01,此时的满意度为90% 。一、问
6、题重述1.1 问题背景空气,我们每天都呼吸着的“生命气体”,它的质量直接关乎着人类的生产、生活和生存。因此,空气质量问题的监测、预报和控制等问题是全国人民关注的重点。2012年环境保护部公布的环境空气质量标准,增设了PM2.5和臭氧8小时平均浓度限值;调整了原有指标的浓度限值;并试行了AQI作为空气质量监测指标的规定。该规定中,首次将产生灰霾的主要因素PM2.5的浓度指标列入空气质量监测指标中。1.2 问题重述PM2.5的来源有自然源和人为源,主要成分由水溶性离子、颗粒有机物和微量元素等组成。其形成机理和过程比较复杂,而且进入公众视线的时间很短,所以关于细颗粒物PM2.5的数据相对较少,对于细
7、颗粒物PM2.5的客观规律也了解不够。因此,我们利用现有数据研究以下问题。1.2.1 PM2.5的相关因素分析AQI监测指标为:二氧化硫、二氧化氮、可吸入颗粒物PM10、细颗粒物PM2.5、臭氧和一氧化碳等6 项。有研究表明,二氧化硫、二氧化氮和一氧化碳是可能形成PM2.5的气态物体,请根据附件1或附件2中数据或自行采集数据,利用或建立适当的数学模型对AQI中的6个基本监测指标的相关与独立性进行定量分析,尤其是对其中PM2.5(含量)与其它5项分指标及其对应污染物(含量)之间的相关性及其关系进行分析。如果你们进而发现AQI基本监测指标以外的、与PM2.5强相关的(可监测的)成分要素,请陈述你们
8、的方法、定量分析结果、数据及来源。1.2.2 PM2.5的分布与演变及应急处理请依据附件2、附件3中的数据或自行采集某地区的数据,通过数学建模探索完成以下研究:1、描述该地区内PM2.5的时空分布及其规律,并结合环境保护部新修订的环境空气质量标准分区进行污染评估。2、建立能够刻画该地区PM2.5的发生和演变(扩散与衰减等)规律的数学模型,合理考虑风力、湿度等天气和季节因素的影响,并利用该地区的数据进行定量与定性分析。3、假设该地区某监测点处的PM2.5的浓度突然增至数倍,且延续数小时,请建立针对这种突发情形的污染扩散预测与评估方法。并以该地区PM2.5监测数据最高的一天为例,在全地区PM2.5
9、浓度最高点处的浓度增至2倍,持续2小时,利用你们的模型进行预测评估,给出重度污染和可能安全区域。4、采用适当方法检验你们模型和方法的合理性,并根据已有研究成果探索PM2.5 的成因、演变等一般性规律。1.2.3 空气质量的控制管理数据1所在地区的环境保护部门考虑治污达标的紧迫性和可行性,在未来五年内,拟采取综合治理和专项治理相结合的逐年达到治理目标的方案。请考虑以下问题:1、该地区目前PM2.5的年平均浓度估计为280(单位为),要求未来五年内逐年减少PM2.5的年平均浓度,最终达到年终平均浓度统计指标35(单位为),请给出合理的治理计划,即给出每年的全年年终平均治理指标。2、据估算,综合治理
10、费用,每减少一个PM2.5浓度单位,当年需投入一个费用单位(百万元),专项治理投入费用是当年所减少 PM2.5浓度平方的0.005倍(百万元)。请你为数据1所在地区设计有效的专项治理计划,使得既达到预定PM2.5减排计划,同时使经费投入较为合理,要求你给出五年投入总经费和逐年经费投入预算计划,并论述该方案的合理性。二、问题分析2.1 问题一的分析对于问题一,可以分为两个小问:首先要定量分析AQI中6个检测指标之间的相关性和独立性;其次主要分析PM2.5的浓度指标与另外5个分指标之间的相关性。针对第一小问,附件1给出的大量数据,不可避免的会出现数据缺失和异常值,数据缺失会对相关性分析有一定影响,
11、所以首先需要对数据进行预处理,剔除缺失值。在分析各指标相关性时,个别异常值对于相关性分析影响不大,所以暂时不作剔除。第一小问,定量分析6项指标之间相关性时。由于各个指标的标准不同,首先利用对数据进行归一化处理,然后再利用处理得到相关系数来衡量各个指标之间的关系强度。然后根据大样本数据需要满足正态性原则,即剔除不满足统计学规律,远离数据正态分布所对应的位置的点和浮动范围脱离总体的点。最后根据第一小问得出的相关性定量关系,检验由于不满足正态原则而剔除的数据是否合理。针对第二小问,要求建立分析PM2.5和其5项指标的相关性模型,本文将PM2.5作为因变量,其它指标作为自变量,利用第一小问预处理后的数
12、据,建立多元线性回归方程,从而得到PM2.5值与其余5项分指标的相关方程。2.2 问题二的分析针对问题二第一小问,需要综合时间和空间分析PM2.5的分布状况,而时空分布图是一个四维图,不便于绘制,所以本文将时空分布图分为时间分布图和空间分布图分别建立模型进行分析。首先建立PM2.5与SO2、NO2、PM10的三元线性回归方程来估计数据2中PM2.5中缺失的2010年1月到2012年12月的数据得到PM2.5的时间分布图,然后建立关于PM2.5的二维插值模型得到了关于各地区的空间分布图。最后根据环境空气质量标准建立了模糊综合评价模型,并根据最大隶属度原则对13个地区的污染程度进行评估。针对问题二
13、第二小问,够刻画该地区PM2.5的发生和演变的数学模型并考虑风力、湿度等天气和季节因素,并利用该地的数据进行定性与定量的分析。因此本文建立了不同季节下关于风力、湿度、温度的三元线性回归模型,并建立高斯点源扩散模型分析其扩散与衰减现象。针对问题二第三小题,在第二小问的基础,建立了针对此突发情况的基于高斯点源函数的污染扩散预测二维插值模型,并找出了全地区最高浓度PM2.5的一天,使其浓度增至两倍并持续两小时,并用所建立的模型进行预测,根据MATLAB的仿真结果得到了重度污染与可能污染的区域。2.3 问题三的分析针对问题三第一小问需要给出一份合理的治理计划。本文考虑到实际环境治理过程中,往往是分期进
14、行治理工作的,而且治理进度是先慢变快,再由快变慢。这种情况与可惜分布函数较为类似。因此可以将PM2.5的治理计划分为前期(准备期),中期(治理期),后期(稳固期)三个时期,并使用改进柯西分布函数对治理情况加以模拟,得出与实际情况相符合的分期治理计划。针对问题三第二小问需要给出五年投入总经费和逐年经费投入预算计划,本文考虑经济投入与决策部门满意度两个因素,建立双目标规划模型,既使得五年投入的总经费较少,又使决策部门对投入金额造成的结果满意度较高。三、模型假设与符号说明3.1 模型假设1、假设测量仪器没有损坏,异常数据为不可避免的人为统计;2、假设全市天气处于均一的条件下;3、假设风向流动稳定,风
15、速不会变;4、假设排放源是连续且均匀的,不会受其他因素影响;5、假设不用考虑PM2.5治理的其他可能情况,只考虑综合治理和专项治理。3.2 符号说明各指标第天所测数据综合治理投入的总费用各指标中归一化处理后的值专项治理投入的总费用已知数据点与选定点的距离第年PM2.5年终平均指标点对应的数据值满意度数据点与选定点的加权平均值综合治理第年减少的PM2.5浓度各监测点的权向量专项治理第年减少的PM2.5浓度四、问题一的模型建立与求解4.1 数据的初筛观察附件1给出的1422个样本数据,发现个别样本的数据值缺失以及可能的异常值,例如,2013年4月29日以及6月7日的PM10数据缺失。由于这些缺失值
16、会对相关性和独立性分析过程中有一定影响,所以本文首先对数据进行预处理,减小在分析过程中产生的误差,因此,将2013年4月29日以及6月7日的数据舍去。4.2 数据归一化由于各原始数据的量纲往往不一样,指标值的数量级也差别很大,为了使各因素之间具有可比性,需对原始数据进行无量纲化、无数量级的处理,以便比较不同量纲和不同数量级的各个因素,可以采取数值归一化。即将数据映射到01范围内处理,更加便捷快速。由于AQI是无量纲指数1,所以只需要对附件1的数据进行无数量级的处理,根据线性函数转换,表达式如下: (1)其中,表示各指标第天所测数据;表示各指标中归一化处理后的值;表示第天。4.3 相关与独立性定
17、量分析模型的建立相关分析4是处理变量与变量之间关系的一种统计方法,通常利用两个变量之间的相关系数来分析变量之间的线性相关程度,据此进行线性回归分析,所以要分析AQI中6项监测指标之间的相关性和独立性,就是要得到各因素之间的相关系数。本题中通过积差相关系数中的简单相关系数来判断相关关系。相关系数计算公式为: (2)其中,表示相关系数介于-11之间;表示样本数;和分别表示两变量的第天所测数据,和分别为表示变量的平均值。当时,表示两变量负相关,时,两变量为正相关;当时,表示两变量为完全线性相关,即为函数关系;当时,表示两变量间无线性相关关系;当时,表示两变量存在一定程度的线性相关。且越接近1,两变量
18、间线性关系越密切;越接近于0,表示两变量的线性相关越弱。一般分为三个等级:(1)为低度线性相关;(2)为显著性相关;(3)为高度线性相关。4.4 相关与独立性定量分析模型的求解用处理AQI中6个分指标以及对应污染物含量归一化后的数据,得到的相关系数,计算结果如表4-1所示。表4-1 AQI中6个分指标之间的相关系数指标二氧化硫二氧化氮PM10一氧化碳臭氧PM2.5二氧化硫10.8050.6780.657-0.1820.724二氧化氮0.80510.7270.625-0.0650.732PM100.6780.72710.586-0.0690.779一氧化碳0.6570.6250.5861-0.3
19、830.822臭氧-0.182-0.065-0.069-0.3831-0.355PM2.50.7240.7320.7790.822-0.3551由表4-1可以得到:(1)高度线性相关的指标组():(),(),(),(),(),()。(2)显著性相关的指标组():(),(),(),()。(3)低度线性相关的指标组():(),(), (), (),()。(4)PM2.5与其它除分指标的相关系数均大于0.7,线性相关程度较高;与各个分指标均呈负相关。4.5 检验检测数据的正确性和准确性在对大样本的测试过程中,不可避免的存在一定的误差,因此需要检测结果的正确性,这是提高数据质量的重要措施和关键环节。4
20、.5.1 正态分布性剔除异常值由于自然届大多事物都是近似正态分布的,因此测试结果的正确性也就是检测数据的正态分布性,将不满足统计规律的数据剔除。检验数据的正态分布性有多种方法:频数分布直方图、图、图等。本文利用软件,对数据1中武汉市检测点数据绘制图,检验其正态分布性,剔除异常值。图是以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为指标坐标系的散点。如果资料服从正态分布,则样本点应该呈一条围绕第一象限曲线附近。以可吸入颗粒物正态Q-Q图为例(其余见附录一),如图4-1所示:图4-1 可吸入颗粒物正态Q-Q图观察图4-1,可吸入颗粒物的分空气质量分指数大致服从正态分
21、布,但是有两个点明显不符合正态分布,远离数据正态分布所对应的位置,需要将其剔除。由此方法得到可能的异常值有2013年1月27日的PM10和PM2.5监测值,以及3月10日的PM10监测值,2月2日的监测值。4.5.2 异常值检验根据第一小问相关性模型得出的相关性结论,相关性大的两个分指标,如果其中一个指标的值过大或过小,则另一个检测值也应与其相关。因此,按照此原则分析检验所提出的异常数据发现,可吸入颗粒物与PM2.5的相关系数为0.779,且显著性水平00.05,因此我们可以认为可吸入颗粒物与PM2.5具有显著的相关性。因此预处理的数据中1.27日数据为正常数据,予以保留。综上所述,所删除的异
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 空气 pm2 问答题 研究 钻研
限制150内