银行数据仓库建设项目方案.docx
《银行数据仓库建设项目方案.docx》由会员分享,可在线阅读,更多相关《银行数据仓库建设项目方案.docx(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、XX银行EDW/数据仓库工程方案数据准备区的功能包括:格式转换、排序去重/筛选、通用基础清洗、连接/ 合并/分割、业务转换等操作型存储区操作型存储区是数据仓库系统一个重要的环节。该区有着承上启下的作用, 从数据形态来看,该区的数据定义贴近业务源系统;从数据标准来看,该区的数 据标准是遵循数据仓库系统的标准。所以该区一般分为两个层次,第一个层次称 之为良好质量的、统一格式的数据贴源层,第二个层次为统一的、规范的、遵循 数据仓库系统标准的数据标准层。数据贴源层可以继续为行内现有的一些报表系统或者分析系统提供数据, 而数据标准层为数据仓库中的企业数据模型的落地扫清了道路。所以该存储区在整个EDW系统
2、起到了一个承上启下的关键作用。1.2.3.5 EDW 存储区EDW存储区是面向主题的、集成的、面向企业的、最明细的数据存储,其内 容是依据最终用户应用和分析需求来进行组织。数据存储区中的数据模型对标准 层数据、基础整合数据、汇总数据和面向应用的集市数据按数据层次进行管理, 每个数据层有自己的数据管理重点。对于每个数据层次,再按主题进行分类组织。 这样就可以有效的将银行企业的操作型数据、汇总型数据和分析型数据以清晰的 架构组织、管理起来,并相辅相成。数据层的内容相互促进开展,组成银行完善 的数据集合,为各种主题管理应用的构建提供良好的数据架构基础。1.2.3.6 业务应用业务应用是EDW系统向业
3、务用户提供应用功能支持,根据应用服务提供的形 式和所采用的应用系统的不同,业务应用主要定义在以下几个技术环境。数据集市:在业务应用层中包含了应用系统中需要的应用集市、OLAP、静态 报表等数据集市。数据集市是一组特定的、针对某个主题域、部门或用户分类的 数据集合。这些数据需要针对用户的快速访问和数据输出进行优化,优化的方式 可以通过对数据结构进行汇总和索引。通过数据集市可以保障EDW的高可用性、 可扩展性和高性能。应用环境:应用环境是为满足业务需要在数据EDW环境中配置的应用软件包。分析环境:数据分析环境为EDW的高端用户提供即时的数据分析功能等。报表环境:报表环境是于来产生和发布静态报表的环
4、境,包括:产生的静态 报表、OLAP产生的报表、KPI指标展现以及其他系统产生的报表。1.2.3.7 用户环境用户环境是EDW系统最终向用户提供的某种应用服务的集合,主要有三种应 用服务的表现形式:通用展现平台:通过此平台将报表、KPI展现、灵活查询、分析等多个应用 集成到一个平台中,进行统一的展现和信息的管理,包括如:报表生命周期的管 理等。数据分发环境:在数据分发的过程中应提供大容量数据批量分发的能力。给 其他需要某个系统的数据提供数据交换功能。报表分发环境:报表的分发应可以满足系统定义的平安性,如按照不同的用 户类型、不同的组织进行分发,不同的用户和组织只能看到属于自己的报表的数 据,数
5、据的分发将通过数据传输平台进行。1.2.3.8 元数据管理元数据管理是对数据信息的收集和发布的集成管理,数据信息包括:数据的 业务含义和技术特性。数据仓库系统架构中的各个局部中都含有元数据信息,应 对其进行主动式管理,以保证它正确的定义、收集和使用。元数据是“关于数据 的数据”。应包括文件结构定义,数据库字段名称,数据模型中的长度和标准, 以及在域-域或域-报表对应关系中的计算和公式等内容。元数据管理的架构如以下图所示,系统的最终架构应实现对元数据的集中的管 理方式:先fllfllltlK分物M索味 住机系统.美系也 汨哥M.X怆系统)Mrn (JOEAv/ir.)技术元政楣用户 提售违反.E
6、TL开发人员. 败发现王开发人员) 1ETLXA (Pef18leo业务用户MXAOodno)MimrA(RSAS)内用软件运短人昌 做据仓庄*理人员.兄 政网理人员)由蛾工具第CA Repostfofy/ ASG Rochade. Pine Cone)1.2.3.9 系统平安性EDW系统中的数据和报表信息均为敏感信息。因此必须采用适当的平安策略 以保证其系统和数据的平安性。数据仓库系统的平安性应涵盖如下四个方面:- 验证:系统应对用户进行访问控制,保证只有合法的用户才能进入到系 统中;授权:系统应根据用户角色对其进行授权,包括对数据的访问权限,对 功能的使用权限等。- 机密性:所有的敏感数据
7、必须被严格控制,禁止未授权访问,并保障其 平安性。- 一致性:数据和程序只能在授权模式下进行修改。针对上述6个方面,数据仓库分系统应按照以下的6个方面的标准进行建设:应用层EDW应用系统是建立在OLAP软件平台的基础上,应用层应实现用户访问控 制的功能,针对不同的用户访问不同的系统资源来保证整个应用系统的平安性控 制。对于未来的数据仓库系统来说,应与统一门户平台整合,实现整体平安性管 理的策略;数据库层只有被授权用户才能访问和修改数据库中的信息并且数据在传输过程中应 对敏感信息进行加密处理来保证数据的平安。数据库管理员应按照角色对数据库用户进行划分,并且通过赋予角色权限的 方式实现对用户平安性
8、访问控制的管理,如:针对用户组或耽误用户分配特定数 据表访问权限。系统层系统应防止未授权访问和系统调用,及时进行系统平安补丁的更新。对于系 统主机应采用服务器加固的方法,来保证整个系统的平安性。网络层网络层平安是保证网络节点之间数据传递的平安性,以及网络环境不受恶意 攻击。XX银行数据仓库环境建立在企业内部网络中,不同功能的服务器应部署在 不同网段中,网段之间相互隔离,对网段之间的访问应通过防火墙并定义严格的 访问控制策略。整个系统的网络环境应得到实时监控,对入侵进行检测和处理, 并在发生入侵时通知系统管理员。物理层物理层平安保障物理设备(主机、路由器等)不受非法用户攻击。目前物理 设备的平安
9、性由运行中心负责。管理管理局部与上述的所有平安问题相关,对平安问题的管理必须由多个部门共 同协作完成。管理层面包括: 平安资源:实现各种平安使用的资源,如:防火墙,入侵检测和处理设 备,反病毒软件等;平安策略和规划:各种平安规那么,组织和责任人; 突发事件处理:在发生平安威胁时的应急处理流程,包括:事件记录、 时间报告制度等流程;平安审计:对平安策略的审核和检查; 灾难恢复计划:发生问题后的系统和数据恢复;1.3 EDW逻辑架构逻辑架构框架数据平台层ET数据源层数据落地区数据消费传输通道访问控制层1供数服务AJAX 用户层数据集市层exportJDBCexport技术元数据网络平安数据平安平安
10、管理体系报表/复杂 报表灵活查询 仪表盘 系统管理connea-onpoo-操作元数据操作系统平安Web服务器Bean JSPCPageBean)VCfeequestBean;CRequestBean JSP(PageBean)Bean业务元数据多维分析K p I系统管理2权限统一管理xlAPPbca-ionBean灵活查询固定报表一操作型功能|脸_JSP PageBeann ccIl g I _统一用户门户1支持多种中间件应用平安一线业务 使用人员管理 决策人员 B/S高级 分析人员维护人员如上图所示的XX银行EDW的逻辑体系架构,这一架构是在联科可扩展的EDW 系统框架的基础上,结合XX银
11、行信息系统建设的实际情况而设计出来的多层、 可扩展框架结构。架构的核心上包括源数据层、ETL流程调度、数据平台层、数 据集市层、应用服务层、访问控制层、用户层和数据消费传输通道七个大局部, 另外,元数据管理和平安管理也是系统必不可少的局部,这2局部会涉及到所有 核心层次。在明确定义各层之间的接口后,多层框架结构具有高度的扩展能力和方便的 系统开发和维护性能,符合目前流行的多层应用结构,适合EDW系统多阶段、多 层次的应用特点。1.3.1.1 源数据层【功能与作用】总行的各个业务系统为整个EDW系统提供原始数据支持,首先作为ETL层的 数据抽取源。【组成局部】目前总行的数据源包括XX银行的多个业
12、务系统,主要有核心系统、个贷系 统、对公信贷系统、国际业务系统、财务系统和各类渠道系统等。1.3.1.2 ETL流程调度层【功能与作用】该层为EDW数据流向的主要环节,EDW系统数据流动的流程调度核心层,流 程调度主要针对下面几个方面: EDW系统将数据源的数据抽取到数据落地区EDW系统对数据执行格式转换、排序去重、通用数据清洗、业务转换后 等操作,最终完成数据准备区加载。 EDW系统再将数据准备区的数据按照EDW数据模型的方式加载到数据存 储区中。 在数据存储区中进行基础数据层、加工汇总层和应用集市层的数据加载。 EDW中的数据准备区和数据存储区可以为为其它系统提供数据服务。 总行EDW可以
13、为分行EDW提供数据服务。【组成局部】上面的逻辑架构图淡绿色色矩形局部为ETL调度管理技术架构图,其作用 是让许多的任务在作业的执行条件满足时自动地执行。ETL调度管里最基本的可 执行元素是单元,每个单元是完成某一特定功能的程序,相关单元组合在一起构 成了可以调度的最小组件一一任务。由上面的技术架构图可知,ETL调度管里包 含以下组件: 知识库建立在DB中的一个数据库,包含了与流程调度相关的一组表,保存ETL流 程调度服务器、任务、任务之间的依赖触发关系、任务组、调度计划等多种类型 的信息。 侦测器驻留在后台的服务,基于定义的触发规那么和调度计划监测是否触发任务的执行。 任务调度引擎接受侦测器
14、的信息调度任务执行(可以使本服务器任务也可以是其它服务器 的任务)。 任务执行代理调用任务包含的每个单元执行的服务,同一服务器上可以有多个任务执行代 理同时运行。 任务封装在Perl程序中,执行数据加载、整合、立方体生成等工作的一组程序。 日志管理引擎记录ETL调度管理各个服务器组件以及每个任务的执行日志,日志按天保 存,可以定期清理。 管理监控器Java应用程序,用于定义任务、任务组合触发关系等信息,同时可以实时 监控任务执行情况查看日志。作为专门为数据仓库系统设计的流程调度管理具有如下特点: 任务执行代理可分布在多台服务器上。 结构简单、伸缩性强。 支持多种执行任务。1)加载数据2)整合数
15、据3)数据质量检查和清洗4)数据转换5) OLAP数据生成6)数据挖掘模型的执行7)定制报表的产生8)定制页面的产生9)数据库备份、告警等系统作业10)调用其他ETL/ELT工具产生的任务11)数据导出到指定的渠道系统执行的任务可以是另一个任务调度引擎触发(如:EDW)O 可以启动其它的ETL引擎的任务。1.3.1.3 数据平台层【功能与作用】作为本系统的数据核心局部,它负责存储和管理来自各种源数据系统的数 据,并为访问用户提供数据服务。这些数据是按照在逻辑数据模型分主题存放的。【组成局部】本层由操作型存储区、仓库存储区和集市应用层四个局部组成。详细内容参 见“EDW数据架构”1.3.1.4
16、数据集市层【功能与作用】数据集市是一组特定的、针对某个主题域、部门或用户分类的数据集合。 这些数据需要针对用户的快速访问和数据输出进行优化,优化的方式可以通过对 数据结构进行汇总和索引。通过数据集市可以保障EDW的高可用性、可扩展性和 高性能。【组成局部】包括:驾驶舱报表系统和灵活查询以及其他应用集市系统。1.3.1.5 应用服务层【功能与作用】通过对数据平台层中的数据进行适当的提炼、汇总,利用通用展现平台向用 户提供包括报表服务、查询服务、决策仪表盘等相关服务。该层为用户对中央数 据的访问提供各种方式的服务(C/S、B/S),从而实现访问方式的多样化和信息 存取的透明化。【组成局部】通用展现
17、平台主要包括的功能模块有:第一个层次是核心模块包括:框架、引擎,核心模块作为报表集成开发环 境的基础、核心和框架存在。报表集成开发环境核心功能和模块组装由核心模块 统一提供,只暴露给开发人员;第二个层次是管理模块包括:报表信息、基本管理、代理、信息推送、连 接信息,管理模块为报表集成开发环境提供管理服务,它提供报表集成开发环境 的用户、权限等的统一管理,管理模块也是报表集成开发环境必选模块,它的很 多功能调用由核心模块提供,管理模块包括5个子模块;第三个层次是应用模块包括:仪表盘、灵活查询、数据录入、报表、复杂 报表,应用模块提供报表集成开发环境最终用户(非管理人员)的用户体验,可 以和管理模
18、块相结合有选择地灵活部署。1.3.1.6 访问控制层【功能与作用】访问控制层主要包括WEB、认证、平安、门户四方面的服务。该层位于用户 层和中间服务层之间,为用户层成提供HTTP服务、门户的单点登录、用户统一 认证、提交用户层请求到中间服务层,对用户实施平安策略,为用户管理报表、 查询文档,提供个性化定制等。1.3.1.7 用户层由上面的逻辑架构图可知用户层包括各种最终用户。按照用户使用EDW系统 的方式和特点,可以划分为业务分析人员、高级分析人员和管理决策人员。所有 用户统一通过用户门户访问EDW系统各类应用,从而实现了 EDW系统的应用界面、 平安管理统一,同时用户可以对门户进行个性化定制
19、以方便自己使用。实际上,EDW系统还包括进行系统建设的开发人员、系统运行人员和系统管 理人员,这里所指的用户层主要针对业务用户进行描述。 业务分析人员主要指总行各业务部门、各分行的业务用户,如:客户经理。该类人员直接 使用模块化的应用界面访问EDW系统,生成或预览预定义报表,进行相对固定的 查询以及多维分析。这类用户会使用B/S和C/S两种客户端访问EDW系统。 高级分析人员是指总行各业务部门、各分行的较为高级的用户。除能够执行一般业务分析 人员进行的操作外,可以对指定的主题、指标进行自定义的灵活分析和比拟。分 析的方式包括自定义查询、自定义报表、多维旋转和穿透钻取等等。这类用户会 使用B/S
20、和C/S两种客户端访问EDW系统。 管理决策人员主要包括各部门的领导、分行领导和总行领导。EDW系统为管理决策人员分 配专门的系统资源,建立最为直观和方便的存取界面,为决策人员赋予最大的信 息访问权限,实现决策人员对信息的自由访问。同时,EDW系统将决策人员最为 关心的信息主动发布到决策人员的访问界面上,简化信息访问的方式,使得决策 人员在第一时间获得经营管理的各种重要信息和指标。这类用户只会使用B/S 客户端访问EDW系统。1.3.1.8 消费数据传输通道在数据仓库系统建立以后,会有很长一段时间旧有的报表系统和分析系统需 要逐步迁移,在此期间,需要有一个消费数据传输通道来支持旧有系统的良好运
21、 转。1.3.1.9 平安管理体系平安管理体系主要包括以下四个方面: 网络平安主要包括在不同网络层次设置不同级别的防火墙及IDS系统,同时在每 一个平安层次下通过部署不同的平安原那么,这完全符合XX银行的平安级 别规定。 操作系统平安系统所有应用或数据库服务器均采用Unix操作系统,操作系统本身有着 严密的系统平安认证与用户权限管理体系,并具备登录、审核以及资源 访问的审计与跟踪。 数据平安提供各种基于数据库的平安保护机制。 应用平安应用是直接面对用户的,虽然应用系统能够持续提供服务是涉及到系统第一章系统总体架构4总体架构设计概述41.1.1 总体架构的设计框架4总体架构的设计原那么51.1.
22、2 总体架构的设计特点5EDW执行架构61.1.3 执行架构概述6执行架构设计原那么61.1.4 执行架构框架7EDW逻辑架构141.1.5 逻辑架构框架14数据处理流程201.2 EDW运维架构21运维架构概述211.2.1 运维架构的逻辑框架22EDW数据架构271.2.2 数据架构设计原那么27数据架构分层设计291.3 EDW应用架构31应用架构设计原那么311.3.1 数据服务32应用服务33第二章ETL体系建设34ETL架构概述342.1 ETL设计方案36平安的问题,但是因为这些问题更多的是由系统的平安问题来保证的。 所以就应用级的平安策略更多的是保证对数据访问的合法性。131.
23、10元数据管理体系在机构内关于数据的信息称为“元数据(Metadata) ”。清楚地区分数据库中 的数据和元数据是很重要的,所谓元数据,是指关于数据的数据,即用来描述数 据的类型、来源、定义、存储位置,使得可以正确地使用数据仓库。元数据仓库(Meta Data Repositoiy)对业务人员来说是很重要的,是业务人 员与数据仓库的数据交流的传达手段。IT人员可能已经拥有许多有效的工具进 行数据存取。但对业务人员,他们需要一种手段和工具来理解他们存取的数据。在本期EDW系统的建设中,包括技术元数据和业务元数据两类,其数据源涵 盖了 EDW系统的各个环节,包括:数据源系统、EDW数据库、EDW逻
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 银行 数据仓库 建设项目 方案
限制150内