基于DAP_SVDD长春地区未来24小时雾霾预测模型研究_鲁安妮.docx
《基于DAP_SVDD长春地区未来24小时雾霾预测模型研究_鲁安妮.docx》由会员分享,可在线阅读,更多相关《基于DAP_SVDD长春地区未来24小时雾霾预测模型研究_鲁安妮.docx(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、分 类 号 : TP391 研究生学号: 20013534021 单位代码: 10183 密 级:公开 吉 林 大 学 硕士学位论文 基于 DAP-SVDD长春地区未来 24小时雾霾预测模型研究 The Research of Fog-haze Prdiction Model Based on DAP-SVDD Algorithm of Changchun in the Next 24 Hours 作者姓名:鲁安妮 专 业:计算机技术 研究方向:知识工程与知识科学 指导教师:欧阳继红教授 培养单位:计算机科学与技术学院 2016年 4月 未经本论文作者的书面授权,依法收存和保管本论文书面版 本
2、、电子版本的任何单位和个人,均不得对本论文的全部或部分 内容进行任何形式的复制、修改、发行、出租、改编等有碍作者 著作权的商业性使用(但纯学术性使用不在此限 ) 。否则,应承 担侵权的法律责任 吉林大学硕士学位论文原创性声明 木人郑重声明:所呈交的硕士学位论文,是本人在指导教师的指导下, 独立进行研究工作所取得的成果 。 除文中已经注明引用的内容外,本论文 不包含任何其他个人或集体已经发表或撰写过的作品成果 .对本文的研究 做出重要贡献的个人和集体,均己在文中以明确方式标明 本人完全意识 到本声明的法律结果由本人承担。 学位论文作者签名 :奪汹 t 日期: 2016年 S JJW日 基于 DA
3、P-SVDD长春地区未来 24小时雾霾预测模型研究 The Research of Fog-haze Prdiction Model Based on DAP-SVDD Algorithm of Changchun in the Next 24 Hours 作者姓名:鲁安妮 专业名称:计算机技术 指导教师:欧阳继红教授 学位类别:工学硕士 答辩日期: 2016年 月 日 摘要 摘要 基于 DAP-SVDD长春地区未来 24小时雾霾预测模型研宄 随着社会对雾霾天气关注程度的上升,雾霾预测势必成为一个新的研究领域,但目 前针对雾霾天气发生情况尚没有成形完整的理论模型。现有的针对雾霾相似性天气霾以
4、及 PM2.5预报主要利用神经网络建模,但是由于雾霾成因复杂度较高且数据不平衡的特 点,在利用神经网络建立雾霾预报模型时易陷入维数灾害,从而降低预报准确率。 本文针对上述雾霾样本数据特点,提出了一种基于二分法自动搜寻偏向参数的 DAP 聚类与支持向量数据描述 ( SVDD)相结合的建模方法。传统的 AP聚类虽然可以形成 若干个凸型数据簇,但是由于偏向参数选择的随机性使得聚类效果不稳定,无法确定最 优解从而导致最终预测模型分类精度的不稳定。针对这个问题,本文引入二分法,在全 局范围内搜寻偏向参数并通过 Smiouette指标确定最优解,进而得到最优聚类效果。由 于样本数据不平衡导致传统的分类模型
5、很难精准进行预测分类,因此本文选用单分类模 型 SVDD算法作为下游处理器,在各个数据簇上分别建模,最终统一打包封装形成 DAP-SVDD预测模型。具体工作如下: (1) 分析了研宄背景、目的意义及研宄现状 近些年来雾霾天气越来越受到社会的关注, 对人类的日常生活产生了较大的负面影 响,因此若能建立一套雾霾预测系统,精准的预测出雾霾发生情况,则可以方便市民提 前采取预防措施减少不必要的危害。但是目前国内尚没有成型的雾霾预测模型可以应用 到现实生活中以方便人们提前采取措施预防雾霾可能造成的危害。基于雾霾样本数据的 不平衡性,传统的二分类 SVM机器学习模型很难精准的对雾霾发生情况其进行预测, 于
6、是本文系统的了解了常用于故障点诊断的 SVDD算法以及 AP聚类算法之后,发现 SVDD算法在小样本不平衡高维数据集上的分类预测具有较高的准确率,而 AP聚类则 可以自 动生成若干小样本凸型数据集,因此本文将结合二者进行结合与改进,充分发挥 二者的优点。 (2) 提出了基于二分法寻找偏向参数的 DAP-SVDD雾霾预测模型 由于样本数据较大且分布特征不确定,在应用 SVDD预测分类模型之前,需要利用 I _ 摘 要 _ AP聚类算法对其进行聚类且转化成若干个凸型数据簇,以提高预测精准度。而偏向参 数的设定直接影响聚类效果好坏,传统的偏向参数统一选取各样本相似度均值的一半作 为确定值,但是由于每
7、个样本数据集特点不同,导致统一选取固定值会造成聚类实现效 果的不确定性,无法判别其是否为最佳聚类效果。针对这个问题,本文提出了 AP聚类 的改进算法 DAP算法,即利用二分法在参数选取范围内依次代入计算,利用评价指标 评判出最优参数,之后利用 SVDD算法作为下游处理器建立预测模型。 (3) 设计并实现了基于 DAP-SVDD的长春市雾霾预测模型 首先将搜集到的长春地区空气质量数据以及大气污染数据分为测试集和训练集,再 利用 SPSS数据分析软件以及 MATLAB仿真软件对设计好的 DAP-SVDD模型进行训练 建立预测判别建模,之后再利用测试集对模型进行测试得到模型预测准确率。 (4) 雾霾
8、预测结果分析、对比和仿真 在对建立好的 DAP-SVDD预测模型进行仿真并得到预测准确率后,再将样本数据 分别在采用传统偏向参数的 AP-SVDD模型、未进行数据上游处理的 SVDD模型、以及 传统的二分类C-SVM模型进行建模测试,将其测试准确率结果进行比较分析,结果表 明改进后的模型比育有传统模型在训练时间、预报准确率上都有很大提高。 关键词: AP聚类,支持向量数据描述,二分法,雾霾预测 Abstract Abstract The Research of Fog-haze Prdiction Model Based on DAP-SVDD Algorithm of Changchun i
9、n the Next 24 Hours Fog-haze prediction is becoming a new research field with the rising attention of fog-haze weather. But no complete theoretical model has been established until now. Though most of the weather prediction model use neural network method, it will be caught in44dimension disaster5 w
10、hen building fog-haze prediction model. This paper proposes a new clustering method - DAP algorithm which is using dichotomy to search preference according to the characteristics of the fog sample data. Then combines the DAP algorithm with SVDD model to predict the fog-haze weather in the 24 hours l
11、ater. For the number of t4fog-haze day?, is quite smaller than normal day , that leads to the unbalance of the data and a low accuracy. So in this paper, we chose SVDD algorithm to build the prediction model to solve the unbalance problem. And we use AP algorithm as a pretreatment method to rise the
12、 accuracy. Details are as follows: Introduce the research background purpose significance and the research status of the papers. Fog-haze weather receives more and more attention in recent years, it has a great negative impact on peopled health traffic produce and so on. So if we could build a fog-h
13、aze prediction model to forcast this weather. It will be very convenience for people to take measures to reduce the unnecessary harm.But there has no complete model for people to use. Because of the imbalance of data, traditional SVM machine learning can not predict accurately. So ater we study the
14、algorithm of SVDD and SVM, find that the SVDD algorithm do well in predicting and classing the small sample and imbalance data. What5s more, AP clustering will turn the big sample data into some Convex type of small sample data set. From what has been discussed above, this article put these two meth
15、ods together and improve it could Give full play to the advantages of both. Proposed DAP-SVDD fog-haze prediction model which is based dichotomy to search preference. Before building the Classification model with SVDD algorithm, we should use AP HI Abstract clustering algorithm to get some mall data
16、 cluster to improve the prediction accuracy. Clustering results have much to do with preference, traditionally, we set the preference as half of the similarity matrixs mid-value. But as we know, every sample has its own trait, choose the fixed value will lead to the uncertain results of clustering,
17、we could not sure if this is the best clustering results. In order to solve this problem, this article introduce dichotomy on the basis of AP clustering tofind the best preference in order to get the best clustering results. We named it DAP algorithm, then we choose SVDD algorithm as Downstream proc
18、essors to build the prediction model. Design and implement DAP-SVDD fog-haze prediction model of Changchun . Firstly, dividing the air quality data and the atmosphere pollution data of Changchun area into test and training two sets. Then training DAP-SVDD model with SPSS data analysis software and M
19、ATLAB software to establish the prediction model. Finally we get the model prediction accuracy with the set of test data. The analysis and compare of the result of prediction model. After making the simulation and getting the accuracy of DAP-SVDD prediction model, we use the method of comparison to
20、valid the fesibility of this model. Using the data to establish a AP-SVDD models SVDD model C-SVM model, then using the test data set to get the accuracy of each model. From the results we can easy sea that DAP-SVDD in dealing with fog-haze prediction problem have the best accuracy and the fastest e
21、fficiency. Keywords: Affinity Propagation ? Support Vetor Domain Description ? dichotomy ? Fog-haze prediction IV 目录 目录 第 1 章绪 论 . 1 1.1研宄背景 . 1 1.1.1研宄意义及目的 . 1 1.1.2研究现状 . 2 1.2本文工作 . 3 第 2章 背 景 知 识 简介 . 4 2.1 主成分分析方法 (Principal Component Analysis, PCA) . 4 2.2聚类分析方法 . 7 2.2.1聚类分析一般原理 . 7 2.2.2 AP
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 DAP_SVDD 长春 地区 未来 24 小时 预测 模型 研究 安妮
限制150内