欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    (完整版)XX银行数据仓库建设项目方案.docx

    • 资源ID:27168920       资源大小:17.39KB        全文页数:17页
    • 资源格式: DOCX        下载积分:30金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要30金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    (完整版)XX银行数据仓库建设项目方案.docx

    (完整版)XX银行数据仓库建设项目方案 XX银行 EDW/数据仓库项目方案 目录 第一章系统总体架构. 1.1总体架构设计概述 . 1.1.1总体架构的设计框架. 1.1.2总体架构的设计原则. 1.1.3总体架构的设计特点. 1.2EDW执行架构. 1.2.1执行架构概述 . 1.2.2执行架构设计原则 . 1.2.3执行架构框架 . 1.3EDW逻辑架构. 1.3.1逻辑架构框架 . 1.3.2数据处理流程 . 1.4EDW运维架构. 1.4.1运维架构概述 . 1.4.2运维架构的逻辑框架. 1.5EDW数据架构. 1.5.1数据架构设计原则 . 1.5.2数据架构分层设计 . 1.6EDW应用架构. 1.6.1应用架构设计原则 . 1.6.2数据服务 . 1.6.3应用服务 . 第二章 ETL体系建设 . 2.1ETL架构概述. 2.2ETL设计方案. 2.3ETL关键设计环节. 2. 3.1接口层设计策略. 2.3.2 Staging Area设计策略. 2.3.3数据加载策略 . 2.3.4增量ETL设计策略. 2.3.5异常处理 . 2.3.6作业调度和监控. 2.3.7元数据管理. 2.3.8 ETL模块设计. 2.3.9 ETL流程设计. 2.3.10动态资源分配 . 2.3.11数据接口设计 . 第一章系统总体架构 1.1总体架构设计概述 1.1.1总体架构的设计框架 XX银行EDW项目的总体架构分为基础技术架构、应用架构和数据架构三个核心部分。这三个部分共同组成了XX银行EDW系统。 在基础技术架构中,包括执行架构、逻辑架构、功能组件架构和运维架构四个部分。 ?执行架构描述系统大的框架和模块区域,以及之间的逻辑关系;是确定 生产环境的建设要求及指导原则。 ?逻辑架构描述EDW各个模块之间的数据的接口、数据流向、工具使用和 采用具体的技术实现手段或方式情况,用于规范本项目最终生产环境的 建立。逻辑架构是建立应用架构、执行架构、运维架构的基础,也是建 立执行架构、应用架构以及运维架构的原型系统。 ?功能组件架构描述确定系统各个大的组件组件区域的功能模块框架,以 及提供的某种服务类型。 ?运维架构是描述EDW项目的运维架构标准,包括运维架构设计的内容、 设计原则、各构成组件的设计考虑因素、约束、要求等。运维架构通过 相应的流程和工具实现对逻辑架构、功能组件架构、执行架构、数据架 构以及应用架构的运维和管理。 而数据架构和应用架构的主要描述: ?应用架构是EDW为满足业务需求所提供的系统应用功能及其蓝图设计, 其中业务需求是应用架构设计的基础,最终的应用架构将以应用系统的 形式体现在执行架构中,主要包括:应用服务和数据服务。 ?数据架构描述于EDW系统相关的数据流动策略,即数据在EDW系统的执 行架构下的抽取、转换、储存策略以及应采用的流程,包括数据层次和 总分行之间的数据分部情况等。数据架构是建立执行架构标准的需求定 义。 下图是EDW项目总体架构的框架: 1.1.2总体架构的设计原则 ?总体架构在着重考虑实施要求的同时,需要为后续阶段进行规划,以保 证项目最终能够达到目标架构的设计; ?总体架构的设计要基于包括XX银行数据现状分析、实施阶段数据源情 况分析、第一阶段实施EDW设计建议做为参考; ?总体架构设计架构时充分考虑与现有系统兼容,充分利用已有成果,避 免重复开发和建设。 ?总体架构设计过程中应遵守XX银行的IT管理规程,保证最终的系统可 以顺利的部署并移交给XX银行的运行维护部门。 1.1.3总体架构的设计特点 ?权衡功能、性能、可扩展性、易用性、可管理性和性价比。 ?根据XX银行的数据情况和分析需求,采用多层次的企业EDW系统架构来 保证在存在复杂的数据种类和关系的海量数据上进行业务分析和查询 在业务支持能力和性能等方面的要求。 ?多级自动的增量ETL加载机制,有效提高ETL并发度、加载效率,降 低错误处理的复杂性。 ?通过用户入口支持用户采用Web浏览器使用查询和分析工具,统一的信 息服务界面,提高系统易用性,减少技术支持工作量。 ?利用企业信息集成和Web数据服务,提高系统的数据支持能力和接口的 一致性。统一的数据增强平台也减少数据增强的复杂度。 1.2EDW执行架构 执行架构的主要内容是描述EDW项目执行架构的建设要求及指导原则,用于规范本项目最终生产环境的建设。EDW项目的生产环境的建立需要参考并遵循执行架构部分提出的要求。 1.2.1执行架构概述 执行架构是EDW的概念环境,主要包含:源数据、数据落地区、ETL、数据准备区、数据存储区EDW、业务应用、用户环境、数据管控、系统安全性以及EDW 基础设施平台(包括:服务器、存储、网络)等功能组件。从技术层面上来说,EDW系统的执行架构应实现多种技术平台及应用之间的无缝集成。 1.2.2执行架构设计原则 在EDW项目实施的过程中,系统执行架构的建设应遵循以下技术原则:?开放性原则:EDW项目的生产环境的建设应基于业界开放标准,对系统中使用的网络协议、硬件接口、数据接口等应进行统一规划,EDW系统 应支持主流的应用软件包及其部署的各种硬件平台。 ?灵活性与可扩展性:EDW系统的基础设施平台应能够根据未来系统的发展需要以及应用需求,方便的扩展设备容量和提升设备性能;具备支持 多种组件模块、多种物理接口的能力;具备技术升级、设备更新的灵活 性;具备支持业务功能的扩展与重构的灵活性。如:系统容量可以随着 ETL系统数据量的扩展以及应用系统的不断扩展、用户量不断扩展而进 行平滑的扩展。 ?高性能原则:系统应达到数据处理时间窗口的要求,用户定义的查询效率、响应时间的要求,满足业务系统的要求;对现有业务系统影响小。 ?自动化原则:EDW项目建设的核心任务之一是数据抽取、转换、清洗和加载(ETL),在这个过程中应采用自动化的设计原则,避免手工操作。 同时对于元数据管理过程应采用元数据管理平台来实现对元数据集中、 自动化的管理。 ?安全性原则:EDW项目建设中的数据迁移过程都必须保证数据的安全性,例如:在系统建设过程中应对数据中敏感字段进行安全处理、同时整个 系统还应采用网络隔离、用户身份认证及访问控制、数据库安全、操作 系统安全以及完善的安全审计机制。 1.2.3执行架构框架 上图是EDW系统执行架构,其中包含EDW系统中涵盖的功能框架以及框架之间的逻辑关系。在以下的内容中将对执行架构中的功能框架以及框架之间的关系进行详细描述,具体内容包括: ?数据源:包括XX银行的多个业务系统,主要有核心系统、个贷系统、信贷系统、国际业务系统、财务系统和各类渠道系统等。 ?数据落地区:此部分内容说明数据落地的用途,同时对数据落地区应具备的功能进行了标准定义以及数据落地区与其他功能组件之间的关联关系; ?ETL:此部分内容描述ETL系统中数据抽取、转换、加载等功能的需求,同时定义了ETL系统建设的标准以及ETL与系统中其他功能组件之间的关系;?数据准备区:此部分描述数据准备区应具备的功能,以及数据准备区在建设过程中的标准需求。 ?操作型存储区:此部分内容描述EDW系统在建设的过程中操作型存储区应遵循的标准以及系统建设过程中应满足的需求; ?数据仓库存储区:此部分内容描述EDW系统的数据仓库存储区应遵循的标准以及系统建设过程中应满足的需求; ?业务应用:此部分内容描述BI应用系统建设的系统需求,包含对应用环境、分析环境、静态报表环境; ?用户环境:此部分的内容描述用户在EDW系统中应具备运用的能力,包括:利用通用展现平台进行信息展现、驾驶舱应用、报表应用等; ?时间窗口和性能的定义:此部分描述整个EDW项目中关于时间窗口的定义以及相关系统的性能指标要求; ?元数据管理:此部分描述在系统执行架构中元数据管理的内容以及元数据管理系统的建设的标准定义; ?系统安全性:此部分内容主要描述EDW系统中的安全性管理内容,包括应用安全、网络安全、数据安全、系统安全等,同时描述系统安全在建立过程中遵循的原则; ?基础设施平台(服务器、网络、存储):此部分内容主要描述生产系统中的硬件资源,包括:服务器,网络以及存储的资源需求,容量规划应满足的系 统指标等内容; 1.2.3.1数据源 源数据系统是报表、关键指标、灵活查询、主题分析等应用系统的基础数据来源。在系统建设初期,源数据系统应提供能满足初始业务需要的数据以及业务系统需要提供完整数据的时间窗口,在EDW系统扩展的过程中,各个源数据系统中的数据将逐渐的加载到EDW系统当中。源数据无法满足应用需求时,系统应提供手工方式通过手工数据补入平台将需要的数据补入到EDW系统中。 目前数据源包括XX银行的多个业务系统,主要有核心系统、个贷系统、对公信贷系统、国际业务系统、财务系统和各类渠道系统等。 1.2.3.2数据落地区 数据落地区是为了保证多系统对源系统数据抽取的需求,在数据从源数据系统抽取后在统一的数据集成环境中整合。数据落地区应建立与各相关源数据系统的接口,将这些系统定期卸载的数据以固定的格式接收、存放到落地区,考虑数据传输和加载的速度,源数据系统应以文本文件格式将数据定期传输给数据落地区进行处理。 数据落地区的数据存储格式原则上是与数据源的存储格式保持一致 1.2.3.3数据ETL架构 ETL是数据的抽取、转换、加载的全部过程,它是数据从数据落地区到ETL 服务器以及从ETL服务器到EDW的数据迁移过程以及数据从EDW向数据集市的数据迁移过程中必须使用的过程和方法, ETL系统应包括以下三个主要功能: ?数据抽取:从数据落地区系统抽取EDW中需要的数据; ?数据转换:将从源数据系统获取的数据转换成EDW要求的形式,同时按 照业务需求对数据进行转换; ?数据加载:将助转换后的数据装载到EDW的物理模型中; 1.2.3.4数据准备区 数据准备区是数据存储的临时存储区域,数据在其中只作暂时性保存,数据 经转换后导入到EDW的物理模型中。 数据准备区的功能包括:格式转换、排序去重/筛选、通用基础清洗、连接/合并/分割、业务转换等 1.2.3.5操作型存储区 操作型存储区是数据仓库系统一个重要的环节。该区有着承上启下的作用,从数据形态来看,该区的数据定义贴近业务源系统;从数据标准来看,该区的数据标准是遵循数据仓库系统的标准。所以该区一般分为两个层次,第一个层次称之为良好质量的、统一格式的数据贴源层,第二个层次为统一的、规范的、遵循数据仓库系统标准的数据标准层。 数据贴源层可以继续为行内现有的一些报表系统或者分析系统提供数据,而数据标准层为数据仓库中的企业数据模型的落地扫清了道路。 所以该存储区在整个EDW系统起到了一个承上启下的关键作用。 1.2.3.6EDW存储区 EDW存储区是面向主题的、集成的、面向企业的、最明细的数据存储,其内容是依据最终用户应用和分析需求来进行组织。数据存储区中的数据模型对标准层数据、基础整合数据、汇总数据和面向应用的集市数据按数据层次进行管理,每个数据层有自己的数据管理重点。对于每个数据层次,再按主题进行分类组织。这样就可以有效的将银行企业的操作型数据、汇总型数据和分析型数据以清晰的架构组织、管理起来,并相辅相成。数据层的内容相互促进发展,组成银行完善的数据集合,为各种主题管理应用的构建提供良好的数据架构基础。 1.2.3.7业务应用 业务应用是EDW系统向业务用户提供应用功能支持,根据应用服务提供的形式和所采用的应用系统的不同,业务应用主要定义在以下几个技术环境。 数据集市:在业务应用层中包含了应用系统中需要的应用集市、OLAP、静态报表等数据集市。数据集市是一组特定的、针对某个主题域、部门或用户分类的数据集合。这些数据需要针对用户的快速访问和数据输出进行优化,优化的方式可以通过对数据结构进行汇总和索引。通过数据集市可以保障EDW的高可用性、可扩展性和高性能。 应用环境:应用环境是为满足业务需要在数据EDW环境中配置的应用软件包。 分析环境:数据分析环境为EDW的高端用户提供即时的数据分析功能等。 报表环境:报表环境是于来产生和发布静态报表的环境,包括:产生的静态报表、OLAP产生的报表、KPI指标展现以及其他系统产生的报表。 1.2.3.8用户环境 用户环境是EDW系统最终向用户提供的某种应用服务的集合,主要有三种应用服务的表现形式: 通用展现平台:通过此平台将报表、KPI展现、灵活查询、分析等多个应用集成到一个平台中,进行统一的展现和信息的管理,包括如:报表生命周期的管理等。 数据分发环境:在数据分发的过程中应提供大容量数据批量分发的能力。给其他需要某个系统的数据提供数据交换功能。 报表分发环境:报表的分发应可以满足系统定义的安全性,如按照不同的用户类型、不同的组织进行分发,不同的用户和组织只能看到属于自己的报表的数据,数据的分发将通过数据传输平台进行。 1.2.3.9元数据管理 元数据管理是对数据信息的收集和发布的集成管理,数据信息包括:数据的业务含义和技术特性。数据仓库系统架构中的各个部分中都含有元数据信息,应对其进行主动式管理,以保证它正确的定义、收集和使用。元数据是“关于数据的数据”。应包括文件结构定义,数据库字段名称,数据模型中的长度和标准,以及在域-域或域-报表对应关系中的计算和公式等内容。 元数据管理的架构如下图所示,系统的最终架构应实现对元数据的集中的管理方式:

    注意事项

    本文((完整版)XX银行数据仓库建设项目方案.docx)为本站会员(h****)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开