如何构建银行数据仓库41676.docx
《如何构建银行数据仓库41676.docx》由会员分享,可在线阅读,更多相关《如何构建银行数据仓库41676.docx(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、如何构建银行数数据仓库数据仓库技术作作为一项数据据管理领域的的新技术,其其精髓在于针针对联机分析析处理(OLLAP)提出出了一种综合合的解决方案案,与以往很很多技术不同同的是,它主主要是一种概概念,在此概概念指导下完完成系统的构构造。既没有有可以直接购购买到的现成成产品,也没没有具体的分分析规范和实实现方法,也也就是说没有有成熟、可靠靠且被广泛接接受的数据仓仓库标准。在在以往关系数数据库的设计计和实现中,不不仅有详细的的理论推导,还还有无数的设设计实例,无无论你使用的的是什么公司司的数据库产产品、开发工工具,只要按按照规范做,那那么实现同一一业务需求的的方案都会很很相似。而现现有数据仓库库的实
2、现中,出出现了MOLLAP方案和和ROLAPP方案的区别别,出现了形形形色色的数数据仓库建模模工具、表现现工具,而设设计人员的个个人经验和素素质也会在其其中扮演很重重要的角色。 数据仓库技技术的实现方方式 目前在在数据仓库技技术的实际应应用中主要包包括如下几种种具体实现方方式。 1、在在关系数据库库上建立数据据仓库(ROOLAP) 2、在多维维数据库上建建立数据仓库库(MOLAAP) MOOLAP方案案是以多维方方式来组织数数据,以多维维方式来存储储数据;ROOLAP方案案则以二维关关系表为核心心表达多维概概念,通过将将多维结构划划分为两类表表:维表和事事实表,使关关系型结构能能较好地适应应多
3、维数据的的表示和存储储。在多维数数据模型的表表达方面,多多维矩阵比关关系表更清晰晰且占用的存存储更少,而而通过关系表表间的连接来来查询数据的的ROLAPP系统,系统统性能成为最最大问题。MMOLAP方方案比ROLLAP方案要要简明,索引引及数据聚合合可以自动进进行并自动管管理,但同时时丧失了一定定的灵活性。RROLAP方方案的实现较较为复杂,但但灵活性较好好,用户可以以动态定义统统计和计算方方式,另外能能保护在已有有关系数据库库上的投资。 由于两种方方案各有优劣劣,因此在实实际应用中,往往往将MOLLAP和ROOLAP结合合使用,即所所谓的混合模模型。利用关关系数据库存存储历史数据据、细节数据
4、据或非数值型型数据,发挥挥关系数据库库技术成熟的的优势,减少少花费,而在在多维数据库库中存储当前前数据和常用用统计数据,以以提高操作性性能。 3、在在原有关系库库上建立逻辑辑上的数据仓仓库 由于目目前正在运行行的OLTPP系统中已经经积累了海量量数据,如何何从中提取出出决策所需的的有用信息就就成为用户最最迫切的需要要。新建数据据仓库固然能能从功能、性性能各方面给给出一个完整整的解决方案案,但需要投投入大量的人人力、物力,并并且数据仓库库的建设和分分析数据的积积累需要一段段时间,无法法及时满足用用户对信息分分析的迫切需需要。因此在在筹建数据仓仓库的前期,可可以采用一些些合适的表现现工具,在原原有
5、OLTPP系统上建立立起一个逻辑辑的数据仓库库系统。尽管管由于原有OOLTP系统统设计上的局局限性,这样样的系统可能能无法实现很很多分析功能能,但这样一一个系统中数数据结构固定定、信息分析析需求相对稳稳定成熟,因因此数据仓库库的建模、实实现过程会相相对容易、便便捷;同时,这这样的系统也也会成为将来来真正数据仓仓库建设的原原型。 信息息系统与数据据仓库的关系系 由于数据据量大、数据据来源多样化化,在商业银银行构建管理理信息系统时时,不可避免免地会遇上如如何管理这些些浩如烟海的的数据,以及及如何从中提提取有用的信信息的问题;而数据仓库库的最大优点点在于它能把把企业网络中中不同信息岛岛上的商业数数据
6、集中到一一起,存储在在一个单一的的集成的数据据库中,并提提供各种手段段对数据进行行统计、分析析。因此可以以说,在银行行使用数据仓仓库构建管理理信息系统,既既有压力,又又有数据基础础,它们之间间的联系是必必然的,难以以割舍的。 数据仓库在在商业银行的的应用范围包包括存款分析析、贷款分析析、客户市场场分析、相关关金融业分析析决策(证券券、外汇买卖卖)、风险预预测、效益分分析等。 在在银行信息系系统构建时,由由于历史情况况和现实需求求的不同,存存在两种途径径: 1、建建设新系统 由于目前国国内商业银行行对银行内部部运营的监管管,缺乏很好好的数据搜集集机制,因此此可以在构建建管理信息系系统时,分数数据
7、收集录入入和数据汇总总分析两部分分来考虑。这这样的系统中中由于不需考考虑大量历史史数据的处理理问题,同时时考虑到搜集集过程中可能能存在多个数数据来源,因因此可以在系系统建设的同同时构建数据据仓库,将搜搜集来的各种种数据通过数数据抽取整合合到数据仓库库中。 2、完完善原有系统统 而对于已已经存在OLLTP系统,其其中沉淀了大大量历史数据据,则可以先先在原有系统统上建立逻辑辑数据仓库,即即使用数据分分析的表现工工具,在关系系模型上构建建一个虚拟的的多维模型。当当系统需求稳稳定后,再建建立物理数据据仓库,这样样既节省投资资,又缩短开开发工期。 实现中需要要注意的问题题 一、模型型设计中的问问题 模型
8、设设计(包括逻逻辑模型设计计和物理模型型设计)是系系统的基础和和成败的关键键,在实际操操作中,视实实现技术的不不同应分别对对下列问题引引起注意。 1、直接构构建数据仓库库 直接构建建数据仓库时时,必须按业业务分析的要要求重组OLLTP系统中中的数据,并并要按不同侧侧重点分别组组织,使之便便于使用。 *主题的确确定 主题是是一个逻辑概概念,它应该该能够完整、统统一地刻画出出分析对象所所涉及的各项项数据以及相相互联系。划划分主题的根根据主要来源源于两方面:对原有固定定报表的分析析和对业务人人员的访谈。原原有固定报表表能较好地反反映出以往工工作对数据分分析的需求,而而且数据含义义和格式相对对成熟、稳
9、定定,在模型设设计中需要大大量借鉴。但但仅仅满足于于替代目前的的手工报表还还远远不应是是构建管理信信息系统的目目标,还应该该通过业务访访谈,进一步步挖掘出日常常工作中潜在在的更广、更更深的分析需需求。只有这这样,才能真真正了解构建建数据仓库模模型所需的主主题划分。 *分析内容容的细化 主主题的划分实实际上是与分分析内容的范范围直接相关关的,一旦主主题划分清楚楚了,下一步步就是细化分分析的具体内内容以及根据据分析内容的的性质确定它它在数据仓库库中的位置。通通常维元素对对应的是分析析角度,而度度量对应的是是分析关心的的具体指标。一一个指标究竟竟是作为维元元素、度量还还是维属性,取取决于具体的的业务
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 如何 构建 银行 数据仓库 41676
限制150内