银行业务数据库导入的探析与规划-精品文档.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《银行业务数据库导入的探析与规划-精品文档.docx》由会员分享,可在线阅读,更多相关《银行业务数据库导入的探析与规划-精品文档.docx(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、银行业务数据库导入的探析与规划1加载策略源数据的获取将依靠于数据的生成和更新周期,目前与源数据层约定的获取接口为规定的数据库接口,由DataStage通过数据库接口,从各个源系统获取源数据,在ETL服务器上,以数据文件或命名管道文件的形式,将数据加载到数据仓库中央数据库中。在经过初步的转换处理后,数据将首先加载进入数据仓库临时数据区,在临时数据区的基础上完成数据的进一步清洗、汇总计算和转换处理,并最终生成数据仓库的物理模型数据,相关的数据集市和OLAP立方体,以及其他为数据输出而准备的中间数据。在整个ETL经过中,需要自动化管理ETL任务调度和控制以及必要的数据质量检查模块。2相关层次数据导入
2、是在源数据中经确认的数据进入数据仓库数据服务的数据获取和数据处理的中间层,是重要的数据处理环节。下面将结合ETL经过的几个重点步骤,对数据导入的数据处理经过进行具体的描绘:1确认源数据确实认是指根据针对本系统的业务需求,来定义包含相应的数据源的物理表/数据构造的经过,这些表在进行信息需求分析时需要确定下来,即确定需要使用源系统的哪些数据来知足业务需求。2映射数据的映射(Mapping)是指确定操作源数据和数据仓库数据库中数据存储之间的物理映射关系,简单的讲就是将已确认的源数据与本系统数据库中的数据相对应起来,供ETL参考。3获取为了把源数据加载到数据仓库数据库中,首先需要先获取这些数据。一般来
3、讲,数据获取包括两种方式:数据源主动(PUSH):即数据源主动定时将相关数据吐到ETL服务器上。再由ETL服务器对数据进行必要处理转换、清洗后加载到数据库;ETL服务器主动(PULL):即ETL服务器主动到数据源中获取数据。考虑到本系统的主要数据源是业务系统的镜像系统或Snapshot,数据获取经过将采用ETL服务器主动(PULL)的方式,即业务系统完成Snapshot或镜像处理后,由ETL服务器主动到业务系统的镜像系统或Snapshot中获取数据,而后直接加载入数据仓库数据库中。4转换转换工作主要分为两部分:加载前的转换:主要是针对数据格式、代码映射以及数据类型转换等。加载后的清洗和转换:主
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 银行业务 数据库 导入 探析 规划 精品 文档
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内