XX银行数据仓库建设项目方案11322.docx
《XX银行数据仓库建设项目方案11322.docx》由会员分享,可在线阅读,更多相关《XX银行数据仓库建设项目方案11322.docx(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、银行数据仓库建设方案文件 Evaluation Warning: The document was created with Spire.Doc for .NET.XX银行EDW/数据仓仓库项目方案案目 录第一章 系统总总体架构1.1 总体架架构设计概述述1.1.1 总总体架构的设设计框架1.1.2 总总体架构的设设计原则1.1.3 总总体架构的设设计特点1.2 EDWW执行架构1.2.1 执执行架构概述述1.2.2 执执行架构设计计原则1.2.3 执执行架构框架架1.3 EDWW逻辑架构1.3.1 逻逻辑架构框架架1.3.2 数数据处理流程程1.4 EDDW运维架构构1.4.1 运运维架构概
2、述述1.4.2 运运维架构的逻逻辑框架1.5 EDWW数据架构1.5.1 数数据架构设计计原则1.5.2 数数据架构分层层设计1.6 EDWW应用架构1.6.1 应应用架构设计计原则1.6.2 数数据服务1.6.3 应应用服务第二章 ETLL体系建设2.1 ETLL架构概述2.2 ETLL设计方案2.3 ETLL关键设计环环节2.3.1 接接口层设计策策略2.3.2 SStaginng Areea设计策略略2.3.3 数数据加载策略略2.3.4 增增量ETL设计策策略2.3.5 异异常处理2.3.66 作业调度度和监控2.3.7 元元数据管理2.3.8 EETL模块设设计2.3.9 EETL流
3、程设设计2.3.10 动态资源分分配2.3.11 数据接口设设计第一章 系统总体架构1.1 总体架构设计概概述1.1.1 总体架构的设计计框架XX银行EDWW项目的总体体架构分为基基础技术架构构、应用架构构和数据架构构三个核心部部分。这三个个部分共同组组成了XX银行EDDW系统。在基础技术架构构中,包括执执行架构、逻逻辑架构、功功能组件架构构和运维架构构四个部分。n 执行架构描述系系统大的框架架和模块区域域,以及之间间的逻辑关系系;是确定生生产环境的建建设要求及指指导原则。n 逻辑架构描述EEDW各个模模块之间的数数据的接口、数数据流向、工工具使用和采采用具体的技技术实现手段段或方式情况况,用
4、于规范范本项目最终终生产环境的的建立。逻辑辑架构是建立立应用架构、执执行架构、运运维架构的基基础,也是建建立执行架构构、应用架构构以及运维架架构的原型系系统。n 功能组件架构描描述确定系统统各个大的组组件组件区域域的功能模块块框架,以及及提供的某种种服务类型。n 运维架构是描述述EDW项目目的运维架构构标准,包括括运维架构设设计的内容、设设计原则、各各构成组件的的设计考虑因因素、约束、要要求等。运维维架构通过相相应的流程和和工具实现对对逻辑架构、功功能组件架构构、执行架构构、数据架构构以及应用架架构的运维和和管理。而数据架构和应应用架构的主主要描述:n 应用架构是EDDW为满足业业务需求所提提
5、供的系统应应用功能及其其蓝图设计,其其中业务需求求是应用架构构设计的基础础,最终的应应用架构将以以应用系统的的形式体现在在执行架构中中,主要包括括:应用服务务和数据服务务。n 数据架构描述于于EDW系统统相关的数据据流动策略,即即数据在EDDW系统的执执行架构下的的抽取、转换换、储存策略略以及应采用用的流程,包包括数据层次次和总分行之之间的数据分分部情况等。数数据架构是建建立执行架构构标准的需求求定义。下图是EDW项项目总体架构构的框架:1.1.2 总体架构的设计计原则n 总体架构在着重重考虑实施要要求的同时,需需要为后续阶阶段进行规划划,以保证项项目最终能够够达到目标架架构的设计;n 总体架
6、构的设计计要基于包括括XX银行数据据现状分析、实实施阶段数据据源情况分析析、第一阶段段实施EDWW设计建议做做为参考;n 总体架构设计架架构时充分考考虑与现有系系统兼容,充充分利用已有有成果,避免免重复开发和和建设。n 总体架构设计过过程中应遵守守XX银行的IT管管理规程,保保证最终的系系统可以顺利利的部署并移移交给XX银行的运行维维护部门。1.1.3 总体架构的设计计特点n 权衡功能、性性能、可扩展展性、易用性性、可管理性性和性价比。n 根据XX银行的的数据情况和和分析需求,采采用多层次的的企业EDWW系统架构来来保证在存在在复杂的数据据种类和关系系的海量数据据上进行业务务分析和查询询在业务
7、支持持能力和性能能等方面的要要求。n 多级自动的增增量ETL加加载机制,有有效提高ETTL并发度、加加载效率,降降低错误处理理的复杂性。n 通过用户入口支支持用户采用用Web浏览览器使用查询询和分析工具具,统一的信信息服务界面面,提高系统统易用性,减减少技术支持持工作量。n 利用企业信息集集成和Webb数据服务,提提高系统的数数据支持能力力和接口的一一致性。统一一的数据增强强平台也减少少数据增强的的复杂度。1.2 EDW执行架构构执行架构的主要要内容是描述述EDW项目目执行架构的的建设要求及及指导原则,用用于规范本项项目最终生产产环境的建设设。EDW项目的的生产环境的的建立需要参参考并遵循执执
8、行架构部分分提出的要求求。1.2.1 执行架构概述执行架构是EDDW的概念环环境,主要包包含:源数据据、数据落地地区、ETLL、数据准备备区、数据存存储区EDWW、业务应用用、用户环境境、数据管控控、系统安全全性以及EDDW基础设施施平台(包括括:服务器、存存储、网络)等等功能组件。从从技术层面上上来说,EDDW系统的执执行架构应实实现多种技术术平台及应用用之间的无缝缝集成。1.2.2 执行架构设计原原则在EDW项目实实施的过程中中,系统执行行架构的建设设应遵循以下下技术原则: 开放性原则:EEDW项目的的生产环境的的建设应基于于业界开放标标准,对系统统中使用的网网络协议、硬硬件接口、数数据接
9、口等应应进行统一规规划,EDWW系统应支持持主流的应用用软件包及其其部署的各种种硬件平台。 灵活性与可扩展展性:EDWW系统的基础础设施平台应应能够根据未未来系统的发发展需要以及及应用需求,方方便的扩展设设备容量和提提升设备性能能;具备支持持多种组件模模块、多种物物理接口的能能力;具备技技术升级、设设备更新的灵灵活性;具备备支持业务功功能的扩展与与重构的灵活活性。如:系系统容量可以以随着ETLL系统数据量量的扩展以及及应用系统的的不断扩展、用用户量不断扩扩展而进行平平滑的扩展。 高性能原则:系系统应达到数数据处理时间间窗口的要求求,用户定义义的查询效率率、响应时间间的要求,满满足业务系统统的要
10、求;对对现有业务系系统影响小。 自动化原则:EEDW项目建建设的核心任任务之一是数数据抽取、转转换、清洗和和加载(ETTL),在这这个过程中应应采用自动化化的设计原则则,避免手工工操作。同时时对于元数据据管理过程应应采用元数据据管理平台来来实现对元数数据集中、自自动化的管理理。 安全性原则:EEDW项目建建设中的数据据迁移过程都都必须保证数数据的安全性性,例如:在在系统建设过过程中应对数数据中敏感字字段进行安全全处理、同时时整个系统还还应采用网络络隔离、用户户身份认证及及访问控制、数数据库安全、操操作系统安全全以及完善的的安全审计机机制。1.2.3 执行架构框架上图是EDW系系统执行架构构,其
11、中包含含EDW系统统中涵盖的功功能框架以及及框架之间的的逻辑关系。在在以下的内容容中将对执行行架构中的功功能框架以及及框架之间的的关系进行详详细描述,具具体内容包括括: 数据源:包括XXX银行的多多个业务系统统,主要有核核心系统、个个贷系统、信信贷系统、国国际业务系统统、财务系统统和各类渠道系统统等。 数据落地区:此此部分内容说说明数据落地地的用途,同同时对数据落落地区应具备备的功能进行行了标准定义义以及数据落落地区与其他他功能组件之之间的关联关关系; ETL:此部分分内容描述EETL系统中中数据抽取、转转换、加载等等功能的需求求,同时定义义了ETL系系统建设的标标准以及ETTL与系统中中其他
12、功能组组件之间的关关系; 数据准备区:此此部分描述数数据准备区应应具备的功能能,以及数据据准备区在建建设过程中的的标准需求。 操作型存储区:此部分内容容描述EDWW系统在建设设的过程中操操作型存储区区应遵循的标标准以及系统统建设过程中中应满足的需需求; 数据仓库存储区区:此部分内内容描述EDDW系统的数数据仓库存储储区应遵循的的标准以及系系统建设过程程中应满足的的需求; 业务应用:此部部分内容描述述BI应用系系统建设的系系统需求,包包含对应用环环境、分析环环境、静态报报表环境; 用户环境:此部部分的内容描描述用户在EEDW系统中中应具备运用用的能力,包包括:利用通通用展现平台台进行信息展展现、
13、驾驶舱舱应用、报表应用等等; 时间窗口和性能能的定义:此此部分描述整整个EDW项项目中关于时时间窗口的定定义以及相关关系统的性能能指标要求; 元数据管理:此此部分描述在在系统执行架架构中元数据据管理的内容容以及元数据据管理系统的的建设的标准准定义; 系统安全性:此此部分内容主主要描述EDDW系统中的的安全性管理理内容,包括括应用安全、网网络安全、数数据安全、系系统安全等,同同时描述系统统安全在建立立过程中遵循循的原则; 基础设施平台(服服务器 、网网络、存储):此部分内容容主要描述生生产系统中的的硬件资源,包包括:服务器器,网络以及及存储的资源源需求,容量量规划应满足足的系统指标标等内容;1.
14、2.3.1 数据源源数据系统是报报表、关键指指标、灵活查查询、主题分分析等应用系系统的基础数数据来源。在在系统建设初初期,源数据据系统应提供供能满足初始始业务需要的的数据以及业业务系统需要要提供完整数数据的时间窗窗口,在EDDW系统扩展展的过程中,各各个源数据系系统中的数据据将逐渐的加加载到EDWW系统当中。源源数据无法满满足应用需求求时,系统应应提供手工方方式通过手工工数据补入平平台将需要的的数据补入到到EDW系统统中。目前数据源包括括XX银行的多多个业务系统统,主要有核核心系统、个个贷系统、对对公信贷系统统、国际业务务系统、财务务系统和各类类渠道系统等等。1.2.3.2 数据落地区数据落地
15、区是为为了保证多系系统对源系统统数据抽取的的需求,在数数据从源数据据系统抽取后后在统一的数数据集成环境境中整合。数数据落地区应应建立与各相相关源数据系系统的接口,将将这些系统定定期卸载的数数据以固定的的格式接收、存存放到落地区区,考虑数据据传输和加载载的速度,源源数据系统应应以文本文件件格式将数据据定期传输给给数据落地区区进行处理。数据落地区的数数据存储格式式原则上是与与数据源的存存储格式保持持一致1.2.3.3 数据ETL架构构ETL是数据的的抽取、转换换、加载的全全部过程,它它是数据从数数据落地区到到ETL服务务器以及从EETL服务器器到EDW的的数据迁移过过程以及数据据从EDW向向数据集
16、市的的数据迁移过过程中必须使使用的过程和和方法, EETL系统应应包括以下三三个主要功能能:n 数据抽取:从数数据落地区系系统抽取EDDW中需要的的数据;n 数据转换:将从从源数据系统统获取的数据据转换成EDDW要求的形形式,同时按按照业务需求求对数据进行行转换;n 数据加载:将助助转换后的数数据装载到EEDW的物理理模型中;1.2.3.4 数据准备区数据准备区是数数据存储的临临时存储区域域,数据在其其中只作暂时时性保存,数数据经转换后后导入到EDDW的物理模模型中。数据准备区的功功能包括:格格式转换、排排序去重/筛筛选、通用基基础清洗、连连接/合并/分割、业务务转换等1.2.3.5 操作型存
17、储区操作型存储区是是数据仓库系系统一个重要要的环节。该该区有着承上上启下的作用用,从数据形形态来看,该该区的数据定定义贴近业务务源系统;从从数据标准来来看,该区的的数据标准是是遵循数据仓仓库系统的标标准。所以该该区一般分为为两个层次,第第一个层次称称之为良好质质量的、统一一格式的数据据贴源层,第第二个层次为为统一的、规规范的、遵循循数据仓库系系统标准的数数据标准层。 数据贴源层可可以继续为行行内现有的一一些报表系统统或者分析系系统提供数据据,而数据标标准层为数据据仓库中的企企业数据模型型的落地扫清清了道路。所以该存储区在在整个EDWW系统起到了了一个承上启启下的关键作作用。1.2.3.6 ED
18、W存储区EDW存储区是是面向主题的的、集成的、面面向企业的、最最明细的数据据存储,其内内容是依据最最终用户应用用和分析需求求来进行组织织。数据存储储区中的数据据模型对标准准层数据、基基础整合数据据、汇总数据据和面向应用用的集市数据据按数据层次次进行管理,每每个数据层有有自己的数据据管理重点。对对于每个数据据层次,再按按主题进行分分类组织。这这样就可以有有效的将银行行企业的操作作型数据、汇汇总型数据和和分析型数据据以清晰的架架构组织、管管理起来,并并相辅相成。数数据层的内容容相互促进发发展,组成银银行完善的数数据集合,为为各种主题管管理应用的构构建提供良好好的数据架构构基础。1.2.3.7 业务
19、应用业务应用是EDDW系统向业业务用户提供供应用功能支支持,根据应应用服务提供供的形式和所所采用的应用用系统的不同同,业务应用用主要定义在在以下几个技技术环境。数据集市:在业业务应用层中中包含了应用用系统中需要要的应用集市市、OLAPP、静态报表表等数据集市市。数据集市市是一组特定定的、针对某某个主题域、部部门或用户分分类的数据集集合。这些数数据需要针对对用户的快速速访问和数据据输出进行优优化,优化的的方式可以通通过对数据结结构进行汇总总和索引。通通过数据集市市可以保障EEDW的高可可用性、可扩扩展性和高性性能。应用环境:应用用环境是为满满足业务需要要在数据EDDW环境中配配置的应用软软件包。
20、分析环境:数据据分析环境为为EDW的高高端用户提供供即时的数据据分析功能等等。报表环境:报表表环境是于来来产生和发布布静态报表的的环境,包括括:产生的静静态报表、OOLAP产生生的报表、KKPI指标展展现以及其他他系统产生的的报表。1.2.3.8 用户环境用户环境是EDDW系统最终终向用户提供供的某种应用用服务的集合合,主要有三三种应用服务务的表现形式式:通用展现平台:通过此平台台将报表、KKPI展现、灵灵活查询、分分析等多个应应用集成到一一个平台中,进进行统一的展展现和信息的的管理,包括括如:报表生生命周期的管管理等。数据分发环境:在数据分发发的过程中应应提供大容量量数据批量分分发的能力。给
21、给其他需要某某个系统的数数据提供数据据交换功能。报表分发环境:报表的分发发应可以满足足系统定义的的安全性,如如按照不同的的用户类型、不不同的组织进进行分发,不不同的用户和和组织只能看看到属于自己己的报表的数数据,数据的的分发将通过过数据传输平平台进行。1.2.3.9 元数据管理元数据管理是对对数据信息的的收集和发布布的集成管理理,数据信息息包括:数据据的业务含义义和技术特性性。数据仓库库系统架构中中的各个部分分中都含有元元数据信息,应应对其进行主主动式管理,以以保证它正确确的定义、收收集和使用。元元数据是“关于数据的的数据”。应包括文文件结构定义义,数据库字字段名称,数数据模型中的的长度和标准
22、准,以及在域域-域或域-报表对应关关系中的计算算和公式等内内容。元数据管理的架架构如下图所所示,系统的的最终架构应应实现对元数数据的集中的的管理方式:1.2.3.10 系统安全性EDW系统中的的数据和报表表信息均为敏敏感信息。因因此必须采用用适当的安全全策略以保证证其系统和数数据的安全性性。数据仓库库系统的安全全性应涵盖如如下四个方面面:n 验证:系统应对对用户进行访访问控制,保保证只有合法法的用户才能能进入到系统统中;n 授权:系统应根根据用户角色色对其进行授授权,包括对对数据的访问问权限,对功功能的使用权权限等。n 机密性:所有的的敏感数据必必须被严格控控制,禁止未未授权访问,并并保障其安
23、全全性。n 一致性:数据和和程序只能在在授权模式下下进行修改。针对上述6个方方面,数据仓仓库分系统应应按照以下的的6个方面的的标准进行建建设:应用层EDW应用系统统是建立在OOLAP软件件平台的基础础上,应用层层应实现用户户访问控制的的功能,针对对不同的用户户访问不同的的系统资源来来保证整个应应用系统的安安全性控制。对对于未来的数数据仓库系统统来说,应与与统一门户平平台整合,实实现整体安全全性管理的策策略;数据库层只有被授权用户户才能访问和和修改数据库库中的信息并并且数据在传传输过程中应应对敏感信息息进行加密处处理来保证数数据的安全。数据库管理员应应按照角色对对数据库用户户进行划分,并并且通过
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- XX 银行 数据仓库 建设项目 方案 11322
限制150内