工业设备监测多源异构数据实时处理技术研究与应用_任山.docx
《工业设备监测多源异构数据实时处理技术研究与应用_任山.docx》由会员分享,可在线阅读,更多相关《工业设备监测多源异构数据实时处理技术研究与应用_任山.docx(76页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、工业设备监测多源异构数据实时处理技术研究与应用重庆大学硕士学位论文(专业学位)学生姓名:任山 指导教师:杨正益副教授 学位类别:工程硕士(软件工程)重庆大学大数据与软件学院二0_八年四月Research and Application of Multi-sourceHeterogeneous Data Real-time ProcessingTechnology for Industrial EquipmentMonitoringA Thesis Submitted to Chongqing Universityin Partial Fulfillment of the Requirement
2、 for theProfessional DegreeByRen ShanSupervised by Ass.Prof. Yang ZhengyiSpecialty:ME(Software Engineering)School of Big Data & Software Engineering of ChongqingUniversity, Chongqing ChinaApril, 2018中文摘要摘 要随着当前科学技术的不断发展,信息化建设也在工业领域中快速推进和应用, 尤其是在工业设备监测当中,由于监测项目众多,需要接入各种不同类型的传感 器,从而导致产生的数据位于不同的数据源,而且在
3、语义和数据格式等方面具有 异构的特点,给相关数据的管理和分析带来了极大的不便。因此提出一个针对大 量多源异构监测数据的集成和处理方案,在解决异构数据源的差异的同时保证数 据的完整性和时效性是非常必要的。现有的数据集成技术由于灵活性不强,而且随着数据量的增多时效性也表现 的较差,所以在应用领域方面存在很大的局限性。然而工业设备监测当中,工业 设备繁多,监测数据复杂,监测持续时间长,数据累积量大,同时在业务需求层 面多样化,需要将不同设备监测数据进行集成,并对数据进行一系列的处理,并 运用可靠的存储技术,提供快速有效的查询方式,实现工业设备监测中的智能化 和信息化。本文针对目前数据集成领域存在的问
4、题,并结合工业设备监测数据的特点, 提出一种多源异构数据实时处理模型。该模型采用XML数据表达的方式,分析 XML文档和数据库之间的映射机制,实现异构数据的转换,并针对多源传感器测 量的数据存在的不确定性问题,采取改进的贝叶斯估计推理方法实现数据融合, 以提高所测数据的真实性和可靠性。为保证监测数据的实时处理要求,在数据采 集过程中,传感器采集的最新的数据存储在本地的实时数据库中,而经过处理的 数据则存入服务器的历史数据库中做进一步分析和查询,同时在存储过程中确保 数据的一致性。然后采用本文提出的多源异构数据实时处理模型完成大连LNG接收站设备实 时监测系统的开发,并基于软件工程思想对该系统进
5、行了完整的系统分析设计和 功能实现,该系统能够有效的完成相关设备数据监测和全周期的实时故障诊断, 并针对不同的处理需求提供了丰富的查询接口和可视化界面。经过实际应用证明 本文提出的模型运用到实际业务场景中,能够保证数据的完整性、实时性和可靠 性,在提高实时处理效率和信息化方面具有极大的实际意义。关键词:设备监测,多源异构数据,XML,数据融合,实时处理I英文摘要ABSTRACTWith the rapid development of current science and technology, information construction is also rapidly advanci
6、ng and applying in the industrial field. Especially in the monitoring of industrial equipment, due to the large number of monitoring items, it is necessary to access various types of sensors, resulting in the resulting data. It is located in different data sources and has heterogeneous features in t
7、erms of semantics and data formats, which brings great inconvenience to the management and analysis of related data. Therefore, an integration and processing scheme for a large number of multi-source heterogeneous monitoring data is proposed. It is very necessary to ensure the integrity and timeline
8、ss of the data while solving the differences of heterogeneous data sources.The existing data integration technology is not flexible enough, and the timeliness performance is also worse with the increase of the amount of data, so there are great limitations in the application field. However, in the m
9、onitoring of industrial equipment, there are many industrial devices, the monitoring data is complex, the monitoring duration is long, the data accumulation is large, and at the same time, the business needs are diversified. It is necessary to integrate the monitoring data of different devices and p
10、erform a series of processing on the data. And the use of reliable storage technology to provide a fast and effective way to query, to achieve the intelligence and information in industrial equipment monitoring.This paper presents a multi-source heterogeneous data real-time processing model aiming a
11、t the problems existing in the field of data integration, combined with the characteristics of industrial equipment monitoring data. This model adopts XML data representation to analyze the mapping mechanism between XML documents and databases, realizes the conversion of heterogeneous data, and adop
12、ts improved Bayesian estimation inference for the uncertainty of the data measured by multi-source sensors. The method realizes data fusion to improve the authenticity and reliability of the measured data. In order to ensure the real-time processing requirements of the monitoring data, the latest da
13、ta collected by the sensors are stored in the local real-time database during the data collection process, and the processed data is stored in the servers historical database for further analysis and query. Ensure data consistency during storage.m重庆大学硕士学位论文And Then the multi-source heterogeneous dat
14、a real-time processing model is used to complete the development of real-time monitoring system for Dalian LNG receiving station equipment. Based on the software engineering idea, the system is completely analyzed and designed and its function is implemented. The system can be effectively completed.
15、 Related equipment data monitoring and full-cycle real-time fault diagnosis, and provide a rich query interface and visual interface for different processing needs. Through practical application, it is proved that the model presented in this paper is applied to actual business scenarios, and it can
16、ensure the integrity, real-time and reliability of the data. It has great practical significance in improving the efficiency of real-time processing and information.Keywords: device monitor, Multi-source heterogeneous data, XML, Data Fusion, Real-time processingIV目 录I英文摘要III1绪论11.1课题背景11.2国内外研宄现状11.
17、2.1异构数据集成研宄现状11.2.2实时处理技术研宄现状31.3主要研宄内容41.4本文组织结构42相关技术概述72.1多源异构数据集成技术72.1.1异构数据集成72.1.2语义集成技术82.1.3数据集成模式分析82.2中间件相关技术概述102.2.1中间件基本概念102.2.2中间件工作模式102.2.3 XML技术介绍122.3实时处理技术概述132.3.1实时数据库系统的索引技术132.3.2实时数据库系统的事务管理152.3.3实时数据库系统的并发控制152.4本章小结163多源异构数据实时处理模型研究173.1模型设计思路173.1.1模型设计目标173.1.2模型技术方案18
18、3.2模型体系结构193.3多源异构数据实时处理203.3.1基于XML的异构数据转换203.3.2基于模型驱动的异构数据映射22重庆大学硕士学位论文3.3.3基于改进贝叶斯估计算法的数据融合243.4数据存储策略283.4.1实时数据库存储283.4.2历史数据库存储283.4.3非结构化数据存储293.4.4数据的一致性维护303.5本章小结314工业设备实时监测系统分析与设计334.1系统需求分析334.1.1系统概要简述334.1.2系统特征分析344.2系统总体设计354.2.1系统体系架构354.2.2系统业务流程354.3系统功能模块设计374.3.1基本信息管理384.3.2多
19、源数据监测384.3.3数据实时处理394.3.4数据查询分析394.4数据库设计404.4.1数据库存储策略404.4.2数据库逻辑结构404.5本章小结435工业设备实时监测系统实现与应用455.1开发环境介绍455.2系统框架结构455.3关键技术实现475.3.1多数据源管理475.3.2异构数据转换实现495.3.3多源数据融合实现515.4工业设备实时监测系统应用545.4.1实际部署环境545.4.2系统运行界面565.5本章小结59VIg6总结与展望616.1总、会吉616.2 顧61至夂谢63#考文献65VII1绪论1绪论1.1课题背景随着科学技术的不断发展,特别是在21世纪
20、的今天,每天的生活工作当中都 会产生大量的数据,据统计,最近十年来产生的数据已经超过了过去的五千年的 总和1。因此对于这些庞大数据的采集、处理、存储、分析和利用是一个系统而复 杂的工作。同时信息化技术也已经渗透到各个领域,在工业设备检测监测领域中 更是如此。在工业设备的大规模运转中,需要对它们的各项性能数据进行实时地 监测以保证安全性和可靠性,然而在实际当中,完成复杂的工业化操作需要多种 多样类型的设备协作完成,因此会产生不同结构,不同来源,不同维度的数据。 并且随着不断的生产运转,这些数据还会还会以几何级数增长。与此同时,数据的实时处理技术也在不断的发展以应对各种各样复杂逻辑的 需求。通常在
21、面对不同的数据结构情况下选用不同的存储技术是更加便捷的选择, 但是这样也会造成信息和数据的表现形式和存储结构多样化,主要表现在信息源 差异、异构性、分布性等方面,想要对这些数据和信息进行整理和分析变得更加 困难,进而难以满足工作和生产中的需求2。所以对多源异构数据的处理首先需要 对异构数据进行集成,将分布在不同地点、不同设备的数据集成起来,然后对数 据进行相应的实时处理,并提供一种直观统一的访问方法。用户根本不需要关心 数据的存放位置和结构差异,只需要通过统一的可视化环境对多源异构数据进行 操作和使用。本文研宄针对工业设备监测当中,工业设备繁多,监测数据复杂,监测持续 时间长,数据累积量大,同
22、时在业务需求层面的多样化的问题,提出将不同设备 监测数据进行集成,并对数据进行一系列的处理,运用合理的实时存储技术,并 提供不同的查询方式,直观的展现方式,实现工业设备监测中的智能化、信息化。 论文的关键研宄点在于异构数据的集成和实时处理。1.2国内外研究现状 1.2.1异构数据集成研究现状国外关于多源异构数据集成的研宄开始的较早,参与研宄的高等院校也较多。 主要有 University of Waterloo、Boston college、MIT、Northwestern university、 Illinois University、University of Zurich、Paris u
23、niversity 等13。参与研发异I勾数据 系集成的公司有 IBM、Oracle、Unisys、Computer Corporation of America 等。这些研宄机构在这个过程中也不断开发出众多的数据集成系统。其中比较优秀的有重庆大学硕士学位论文Northwestern university 的 SEMINT 系统、Unisys 公司的 Mermaid 系统、Paris university 的 Scoop 系统、Computer Corporation of America 的 Multibase 系统、以及 Boston college和MIT联合开发的基于SSM的数据集成模
24、型系统等。早期的数据 集成研宄主要集中于异构数据库集成的层面,虽然也达到了一定的效果,并也开 发原型系统,然而数据库种类繁多且在不断更新迭代之中,这时针对异构数据库 的集成在很大程度上其实还存在很大的局限性。因此众多研宄机构纷纷将研宄重 点转向多数据源的异构数据集成,即多源异构数据集成。接着就有许多公司和研 宄机构就开始着手研宄通用的数据源集成系统。比较有代表性的有:IBM公司Almaden的研宄中心研发出的Garlic系统,利用面向对象思想构建 公共数据模型,将分布的多数据源的结构化数据和非结构化数据都集成为一个全 局公共模型,并基于此开发出多媒体信息管理系统,然而在实际使用中不是所有 的多
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 工业 设备 监测 多源异构 数据 实时处理 技术研究 应用 任山
限制150内