《数据仓库技术在企业信息系统建设中的应用》1173.docx
《《数据仓库技术在企业信息系统建设中的应用》1173.docx》由会员分享,可在线阅读,更多相关《《数据仓库技术在企业信息系统建设中的应用》1173.docx(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据仓库技术在企业信息系统建设中的应用谢新建 宋晔 ( 北京理工工大学 计算算机科学系, 北京 11000811)摘要:本文从建建设原则、体体系结构、关关键环节等几几个方面并结结合某电信运运营商的具体体案例说明了了数据仓库技技术在国内电电信业的应用用,其中重点说说明了异种数数据源集成、ODS层的设计、ETL过程的设计、仓库模型设计、元数据管理以及专题数据挖掘等关键环节,对企业数据仓库项目的工程实施有一定的参考价值。关键词: 数数据仓库;EETL;元数数据;遗留系系统中图分类号: TP3111 文献标标识码:A 1、 引言数据仓库技术是是经过了十几几年的研究与与发展,在理理论与工程实实践上都取得
2、得了显著的成成果。国际上上许多重要的的学术会议,如如超大型数据据库国际会议议(VLDBB),数据工工程国际会议议(Dataa Engiineeriing)等,都都出现了大量量专门研究数数据仓库(DData WWarehoousingg)、联机分分析处理(OOn-Linne Anaalyticcal Prrocesssing)、数数据挖掘(DData MMiningg)1的论文文,同时各大数数据库厂商纷纷纷推出相应应产品支持数数据仓库,比如NCRR、SAS、Oraclle、IBM、Inforrmix、Sybasse等都提出出了相应的数数据仓库解决决方案;另一一方面 ,随随着信息技术术的飞速发展展
3、,企业内部部产生了越来来越多的数据据,但这些数数据并没有产产生应有的信信息,为此出出现了“数据据爆炸,知识识贫乏”的窘窘迫局面,有有效地整合与与充分利用现现有的信息资资源成为企业业提高核心竞竞争力的关键键。本文以电电信行业为例例分析了企业业经营分析与与决策支持系系统的建设应应用,重点阐阐述数据仓库库相关技术。2、 数据仓库系统的的设计2.1、系统设设计原则 (1) 通用化性原原则 企业业各地分支机机构在组织构构架、业务划划分与侧重、其其所运行的OOLTP系统统所依赖RDDBMS、电电信数据综合合分析与决策策支持系统所所需要的数据据源的类型与与格式等不尽尽相同,这些些都在企业数数据综合分析析与决
4、策支持持系统通用化化设计的考虑虑范围之内。(2) 可扩展展性原则随着业务内容的的变化,业务务系统的信息息范围会发生生变化,而对对于作为统一一信息服务平平台应设计性性能良好的体体系结构,保保证系统灵活活的功能可扩扩展性。即在在保持系统架架构与原业务务分析逻辑的的前提下,系系统能实现简简洁的分析主主题与功能性性扩充。 (3) 技术开放性性原则为保护用户投资资,通过透明明访问技术,要要保证系统能能够独立于具具体平台工具具,对用户形形成统一的功功能和界面。在在工具和平台台的选择上给给用户提供自自由选择的最最大余地。 (4) 兼容性原则则 企业业在信息化建建设的过程所所积累的信息息资源是企业业最为宝贵的
5、的财富,新建建的经营决策策分析系统应应有效的兼容容原系统,尤尤其兼容原系系统的数据资资源。2.2、系统体体系结构根据上述的设计计原则,并结结合系统设计计目标,提出出电信经营分分析与决策系系统的总体结结构如下: 图1 经经营分析与决决策支持系统统总体结构如上图所示,异异种数据源的的企业应用集集成接口实现现异种数据源源的透明访问问,要支持各各种关系数据据库、平面文文件、XMLL文件等形式式。根据企业业的分析应用用需求,通过过设计与实现现操作数据存存储(ODSS)2层来达达到面向应用用的企业级数数据视图,系系统也支持通通过异种数据据源的企业应应用集成接口口直接实施数数据仓库的EETL过程。在基于元数
6、据的的控制逻辑的的驱动下,系系统实现从业业务数据源和和ODS的数据据抽取、清洗洗、转换与加加载的过程,以以面向主题的的形式来组织织数据仓库的的数据;数据据集市是面向向部门级分析析而组织分析析模型,一般般组织成Cuube立方体体的形式向上上支持在线多多维分析。同同时为了对特特定问题(如如欠费离网)进进行深入分析析,系统要建建立相应的分分析挖掘模型型,一般采用用星型与挖掘掘宽表的形式式进行处理。元数据是关于数数据的数据,即即反映系统结结构性本质信信息的数据描描述。一般认认为包括技术术元数据与业业务元数据,为为了实现系统统应用层对物物理层的透明明访问系统引引入了元数据据内联映射的的概念,对于于元数据
7、的存存储系统采用用两层接口封封装实现元数数据存储的规规范性与灵活活性。从数据集市、挖挖掘模型以及及从ODS获取的的数据集与以以元数据存储储的报表模板板、分析模板板、门户Poortal模模板、XMLL Scheema等结合合来生成满足足分析与决策策需要的各种种展现内容,包包括预定义报报表、即席查查询(Ad Hoc)、OLAPP分析、业务务挖掘分析报报告、企业经经营指标监控控Portaal等,满足足企业经营分分析与决策支支持的需要。系统实现了基于于元数据的全全程管理,涉涉及数据获取取层、数据整整合层以及数数据展现层的的全过程,支支持分析模型型的维护以及及数据源的结结构性变化,通通过经营分析析与决策
8、支持持监控门户提提供包括展现现报表定制、元元数据维护、门门户定制、统统一安全管理理等管理服务务。2.3、系统关关键环节 2.3.11 异种数据据源集成 企业在进进行经营分析析与决策支持持系统建设时时必须将遗留留系统(Leegacy Systeem)3进行高高效全面地集集成,由于遗遗留系统是在在企业发展的的不同时期建建设的,往往往缺乏全局的的规划,所以以常表现为不不同的操作系系统平台、不不同的数据库库平台、不同同的网络通信信机制等等,形形成了所谓的的“信息孤岛”;系统中采采用异种数据据源的企业应应用集成接口口来实现对异异种数据源的的透明访问,包包括数据源元元数据访问以以及业务操作作数据访问。数数
9、据源分为在在线数据源和和离线数据源源,在线数据据源是指允许许在线抽取的的业务数据源源,如营业数数据,离线数数据源是指不不允许直接在在线抽取的数数据源,如计计费样单数据据,采用以脱脱机平面文件件数据的格式式以FTP方式集集成进本系统统。对数据源源实现元数据据级的管理,数数据源的连接接类型(ODDBC、OLEDBB、JDBC、Nativve)、连接接字符串以及及该数据源的的数据结构信信息都以技术术元数据的形形式存储于元元数据库中,通通过控制台对对其进行业务务语义定义,使使用户对整个个企业的信息息系统有了全全面的掌握。 2.3.22 ODS层层的设计 操作数据据存储ODSS(Operaation D
10、ata Storaage)是一一个集成了来来自不同数据据库数据的环环境。其目的的是为终端用用户提供一致致的企业数据据集成视图。它它可以帮助用用户轻松应对对跨多个商业业功能的操作作挑战。它是是面向主题的的、集成的、近近实时的数据据存储。设计计ODS层的目目的在于:改改善了对关键键操作数据库库的存取;用用户能获得对对于收益、客客户等主题的的企业级的完完整视图,有有利于更好地地通观全局;近实时的数数据存储提供供了查询产品品与服务的能能力;以更高高的性能生成成操作报告。设设计ODS的核心心是实现焦点点主题全局试试图应用,如如企业的客户户管理系统,可可以CRM的的理念建立以以客户为中心心的ODS客户主主
11、题视图,向向上层提供高高效的服务。而而对于话费结结算则采取了了从综合结算算系统中直接接抽取到数据据仓库的方式式,抽取周期期为结算周期期,能完全满满足决策分析析的时间窗要要求。 2.3.33 ETL过程程的设计 数据抽取取、转换和加加载,是数据据仓库实现过过程中,进行行数据由数据据源系统向数数据仓库加载载的主要方法法,对于整个个数据处理过过程,实现如如下: 数据抽取:从数数据源系统抽抽取数据仓库库系统需要的的数据。数据据抽取采用统统一的接口,可可以从数据库库抽取数据,也也可以从文件件抽取,对于于不同数据平平台、不同的的源数据形式式、不同性能能要求的业务务系统以及不不同数据量的的源数据,可可能采用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库技术在企业信息系统建设中的应用 数据仓库 技术 企业信息 系统 建设 中的 应用 1173
限制150内