某某环保局环境信息数据仓库建设规划方案(共19页).doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《某某环保局环境信息数据仓库建设规划方案(共19页).doc》由会员分享,可在线阅读,更多相关《某某环保局环境信息数据仓库建设规划方案(共19页).doc(19页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上概述环保行业数据管理过程中面临问题应用软件开发仍停留在条块分割中,信息资源共享程度低环境管理业务与业务之间,环境保护部门的上下级之间,相对独立。目前,各省市环境信息化建设中的应用软件开发存在条块分割的现象,单一业务开发独立的应用系统,系统与系统之间往往无法对接,导致系统之间的信息不能相互共享,从而使环境信息资源共享程度不高。部分区县环境信息化建设滞后,影响环保信息采集各省市环境信息化建设程度存在不均衡现象,部分县级环境信息化建设基本处于空白状态,这种不均衡状态严重影响全省环境信息化的整体水平。县(区)作为最基层的环保机构,对本辖区内的排污单位的有关信息掌握的最为清楚,
2、对排污单位的监督管理也最为方便直接,需要加强建设县(区)级环保应用,把信息的采集源头伸向县(区)环保机构。各级部门构建应用,存在重复建设。环保系统各级部门都建设自己的业务系统,在业务方面上级部门对下级部门的业务都有指导联系,业务的相同使得所建立的系统功能都有重叠,导致系统重复建设的现象存在。信息安全不达标,存在安全隐患数据集中是管理集中化、精细化的必然要求,是国家、省、市环保部门优化业务流程、管理流程的的必要手段。数据中心的建设成为环保数据集中趋势下的必然要求。在Web应用日益深化的环境下,企业数据中心应用的运行环境正从传统客户机/服务器向需要网络连接的中央服务器扩张。Web应用的快速发展与变
3、革,直接影响到基础设施框架下多层应用程序与硬件、网络、操作系统的关系变得愈加复杂。数据仓库介绍数据仓库概念始于上世纪80年代中期,首次出现是在被誉为“数据仓库之父”WilliamHInmon的建立数据仓库一书中。随着人们对大型数据系统研究、管理、维护等方面的深刻识认和不断完善,在总结、丰富、集中多行企业信息的经验之后,为数据仓库给出了更为精确的定义,即“数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合”。数据仓库并没有严格的数据理论基础,也没有成熟的基本模式,且更偏向于工程,具有强烈的工程性。通常按其关键技术部份分为数据的抽取、存储与管理以及数据的表现等三个基本
4、方面。数据仓库的重点与要求是能够准确、安全、可靠地从数据库中取出数据,经过加工转换成有规律信息之后,再供管理人员进行分析使用。数据仓库主要是应用于决策支持系统,其主要目的是“提取”信息并加以扩展,用来进行处理基于数据仓库的决策支持系统(DSS)的应用。总体建设目标目标本次建设需完成以下目标1) 数据规划与整理建设包含数据源分析与规划、数据交换平台搭建、地理信息平台搭建2) 决策分析应用系统建设3) 综合信息门户系统建设建设阶段按照生命周期发法可将数据仓库开发的全部过程分成三个阶段:1) 数据仓库规划分析阶段2) 数据仓库设计实施阶段3) 数据仓库的应用阶段这三个阶段不是简单的循环往复,而是不断
5、完善提高的过程。一般情况下数据仓库系统都不可能在一个循环过程中完成,而是经过多次循环开发,每次循环都会给系统增加新的功能,这种循环的工作永远不会终结,数据仓库也就一直处于一个不断完善、不断提高的循环玩傅过程中。本次项目建设按以上原则分为l 数据规划与整理阶段l 决策分析应用系统建设阶段l 综合信息门户系统建设阶段数据规划与整理建设环境信息数据仓库数据源分析与规划数据源分析与范围规划的最终目标是涵盖环境相关的所有数据,将分散的、标准不一的数据进行集成整合,实现由数据到信息的转化,提高数据质量,为减排目标制定(指标)、过程管理(监测)和最终评价(考核)等工作奠定全面的信息资源体系,为科学决策、有效
6、管理提供信息支持保障。环境信息数据仓库投入运行后,随着信息范围的延伸和积累,可以建立面向不同业务的知识库(如应急预案、总量分析),逐步形成辅助决策的能力。环境信息数据仓库系统的数据源为基础数据库,基础数据库分类如下:1) 污染源监督性监测基础数据库2) 污染源在线监测基础数据库3) 污染源常规监测基础数据库4) 排污申报基础数据库5) 排污收费基础数据库:主要用于存储环境保护部和各省环保厅排污收费的业务数据,包括污染源废气缴费数据、污染源废水缴费数据、污染源噪声缴费数据、建筑施工噪声缴费数据、排污费减免处理数据等。6) 环境统计基础数据库:主要用于存储环境保护部和各省环保厅环境统计的业务数据,
7、包括工业企业污染排放处理利用数据、火电企业污染排放及处理租用数据、工业企业排放废水/废气中污染物监测数据等。7) 建设项目管理基础数据库:主要用于存储环境保护部和各省环保厅建设项目管理的业务数据,包括建设项目基本数据、工业类项目申请数据、土地类项目申请数据、饮食娱乐类项目申请数据、项目跟踪数据。8) 三同时验收基础数据库:主要用于存储环境保护部和各省环保厅三同时验收的业务数据,包括三同时项目审批数据、三同时项目试运行数据、三同时项目验收数据、三同时项目环评报告数据。9) 环境质量基础数据库:主要用于存储环境保护部和各省环保厅环境质量的业务数据,包括大气监测数据、地表水监测数据、地下水监测数据、
8、降尘监测数据、降水监测数据、区域噪声监测数据、道路交通噪声监测数据等。10) 文档数据库:存储减排相关法律法规、应用标准等文档信息。11) 信息分类及标准代码库:主要包括减排业务中的各类标准化代码,如污染源类别等。12) 环境空间数据库:主要包括污染源、环境质量的空间数据信息。环境信息数据仓库数据范围规划如下图:搭建数据交换平台搭建数据交换平台,建设ETL应用,实现ODS到数据仓库、数据仓库到数据集市的数据抽取、清晰、转换与加载。数据交换平台是数据中心数据域其他应用系统沟通的桥梁,是进行数据交换的基站。数据交换平台负责从各个业务系统采集数据,对数据进行清洗与整合,按照数据中心建设标准规范数据,
9、形成核心数据库,并提供给其他应用系统使用。数据交换平台功能由支撑功能与应用功能两部分组成。支撑功能是数据交换平台的基础,包括数据采集、元数据管理、数据交换服务总线、平台监控以及安全管理功能;应用功能是指与具体业务系统相关的功能,应用功能利用数据交换平台的数据交换服务总线,以数据交换服务的形式为各业务系统提供数据共享服务。环境信息数据仓库ETL 过程如下图各ETL 过程主要任务如下表源系统目标数据库ETL主要任务基础数据库数据仓库抽取,转模,加载,去除重复数据数据仓库数据集市汇聚加载,满足BI分析要求ETL 主要任务源数据现状分析和映射每做一步ETL工作之前都应对源数据进行全面的分析,包括如下内
10、容:l 数据的业务范围及业务含义l 数据所在平台,包括系统平台和数据库平台l 数据结构l 数据更新周期l 数据更新方式l 数据量数据抽取数据抽取从数据源提取数据,供数据清洗和转换环节进行处理,数据抽取方式包括批量抽取和单次抽取两种方式,批量抽取可将所有历史数据一次性抽取完成;单次抽取根据规则要求进行抽取。控制单次抽取可采用手工和自动两种方式,手工方式通过人为方式启动任务,自动方式基于调度程序,定期定时执行抽取任务。抽取的检验:在抽取完成后,进行数据源与目标数据库的对比,发现并解决抽取过程产生的错误。抽取的日志记录:在抽取过程中要全程记录抽取日志,至少包括:数据记录条数、开始时间、完成时间,错误
11、信息等。数据清洗数据清洗的任务主要进行脏数据处理。数据转换数据转换的任务主要进行不一致的数据转换、数据粒度的转换,以及一些业务规则的计算。数据加载数据加载工作实现转换后数据的入库。在数据加载后,还要更新元数据,以反映刚完成的数据加载活动。数据的加载活动应使用标准方法和通用工具,例如,在关系数据库管理系统中可以使用SQL 或专门用于管理数据仓库的数据库管理系统加载工具。在数据装入数据仓库数据库后,应验证维度和事实数据表之间的引用完整性,确保所有的记录都与其他表中的适当记录相关。数据缓存区规定数据缓存区用来支持数据抽取、清理、转换并加载到数据仓库,应为数据缓存区创建单独的数据库。数据缓存区应包括传
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 某某 环保局 环境 信息 数据仓库 建设 规划 方案 19
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内