数据仓库实施方法论.ppt
《数据仓库实施方法论.ppt》由会员分享,可在线阅读,更多相关《数据仓库实施方法论.ppt(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、菲奈特数据仓库实施方法论 实施部实施部 2005本手册是菲奈特公司实施部实施项目的参考手册。拿到本手册的菲奈特员工必须确保本手册没有被复制、散发或采取任何方式为第三方所用。在您离开菲奈特公司时,有义务归还本文件。Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR主题菲奈特数据仓库方法论概述菲奈特数据仓库方法论概述菲奈特数据仓库体系架构菲奈特数据仓库体系架构菲奈特数据仓库实施方法菲奈特数据仓库实施方法Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR菲奈特之“一种方法两个模型”菲奈特做为商业智能解
2、决方案的领导者,一直致力于菲奈特做为商业智能解决方案的领导者,一直致力于BI领域的创领域的创新,创建了新,创建了DW的最佳实施体系的最佳实施体系“一种方法两个模型一种方法两个模型一种方法两个模型一种方法两个模型”-“一种方法一种方法”,菲奈特数据仓库方法论是菲奈特经过多年的数据仓库实,菲奈特数据仓库方法论是菲奈特经过多年的数据仓库实施积累的最佳实践经验。施积累的最佳实践经验。-“两个模型两个模型”指的是指的是DWM和和BAM。DWM(FEnet DW Integration DataModel)用于企业数据整合的数据模型是对企业数据进行整合和组织的工具,描述了数据仓库各个主题域的实现。BAM(
3、FEnet Business Analysis DataModel)用于企业数据分析的数据模型,是技术人员与业务人员沟通的载体和工具,反映了业务分析需求、指标体系、行业最佳实践经验。-建设数据仓库一定要统一规划,分步实施。建设数据仓库一定要统一规划,分步实施。建议企业在数据整合和业务分析两方面对EDW蓝图进行统一规划。方法论是使蓝图得以实现的路线图,建议企业循序渐进,逐步建成企业级DW。Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR什么是菲奈特数据仓库方法论菲奈特数据仓库方法论:菲奈特数据仓库方法论:-是菲奈特多年的数据仓库系统实施过程中积
4、累的最佳经验。-是一套建立企业级数据仓库解决方案的方法。帮助定义灵活的、可扩展的DW体系架构;采用结构化方法,详细定义了建设一个满足客户需求的数据仓库系统所不可缺少的任务和步骤。-可提高工作效率,保证项目实施质量;减少项目的实施风险,确保在预算的范围内按时完成项目,满足用户的需求。-可解决诸如:确定正确的系统范围和需求、建立灵活的系统架构以满足不断变化的分析决策需求等等比较棘手的、高风险的问题。Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR菲奈特数据仓库方法论体系菲奈特数据仓库方法论包含的内容:菲奈特数据仓库方法论包含的内容:一、体系架构。
5、帮助建立灵活的、可扩展的EDW架构。二、数据模型。包括DWM和BAM。三、实施方法论。采用结构化方法,定义了建设一个DW包含的详细任务和步骤。四、项目管理。减少项目的实施风险,确保在预算的范围内按时完成项目,满足用户的需求。过程管理委员会对项目进行评审和指导。Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR主题菲奈特数据仓库方法论概述菲奈特数据仓库方法论概述菲奈特数据仓库体系架构菲奈特数据仓库体系架构菲奈特数据仓库实施方法菲奈特数据仓库实施方法Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR
6、菲奈特数据仓库数据处理流程Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR名词解释-DW数据仓库是与操作系统分离的、基于企业模型集成的、面向主题数据仓库是与操作系统分离的、基于企业模型集成的、面向主题的、稳定的、历史的数据集合。的、稳定的、历史的数据集合。数据仓库的数据模型是应用无关的,换句话说,DW是一个数据平台,提供各种查询的数据支持,但最终用户的查询并不直接在DW中执行。DW的物理设计也无需针对用户查询和分析的需求进行优化。Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR名词解释-DW
7、M数据仓库数据模型是对企业数据进行整合和组织的工具。首先抽数据仓库数据模型是对企业数据进行整合和组织的工具。首先抽象出企业概念模型,然后将其转换为象出企业概念模型,然后将其转换为DWM。企业概念模型把现实世界高度抽象为信息世界。企业概念模型把现实世界高度抽象为信息世界。概念模型是主观与客观之间的桥梁。概念模型是设计系统、收集信息的概念性工具。用ER图描述概念模型,形式简单,便于交流。系统设计阶段把概要模型转换为系统设计阶段把概要模型转换为DWM DWM描述了数据仓库各个主题域的逻辑实现,即每个主题所对应的关系表的关系模式定义。DWM是当前和未来数据的集成蓝图,用来指导企业级数据仓库建设。DWM
8、主题域保证数据组织独立于数据处理逻辑,因而可以从DWM之上方便的开发新的分析应用。定义主题域采用结构化、逐步求精的方法,确保主题域的独立性和完备性。Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR名词解释-DataMart用户所有的数据需求都通过访问用户所有的数据需求都通过访问Data Mart,Data Mart可分为:可分为:1、Data Mart(RDBMS)面向业务需求;存储在关系数据库中;一般采用反规范化设计方法,包括明细的数据,或者聚合、冗余的数据;2、OLAP(MDBMS)OLAP根据存储方式又分为三类:1、ROLAP,数据以S
9、tar-Schema存储在关系数据库中。2、MOLAP,数据先以Star-Schema存储在关系数据库中,再加载到OLAP。3、HOLAP,把上面两种方式结合起来。Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR名词解释-BAMBusiness Templates是用来指导数据集市建模(是用来指导数据集市建模(BAM)和前端开)和前端开发的业务分析需求、指标体系、行业最佳实践经验等。发的业务分析需求、指标体系、行业最佳实践经验等。BAM是数据集市的数据模型,根据分析需求组织数据,通过数是数据集市的数据模型,根据分析需求组织数据,通过数据冗余和
10、数据库优化来满足数据访问的快速响应要求。据冗余和数据库优化来满足数据访问的快速响应要求。BAM设计必须与行业经验结合,设计必须与行业经验结合,采用结构化、逐步求精采用结构化、逐步求精的方法。的方法。BAM的设计采用反规范化以及的设计采用反规范化以及Star-Schema。Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR名词解释-ODSODS(Operational Data Storage)是是一一个个包包含含了了面面向向主主题题、集集成成、可可变变、当前的(或最近一个阶段)和详细的操作信息。当前的(或最近一个阶段)和详细的操作信息。ODS的
11、优点:的优点:ODS提供了改善的方法进行数据库的存取。通过ODS,企业可以在客户交易的过程中获得客户的完整视图。ODS可在实时或近实时的基础上提供查询产品和服务所需数据的能力。与传统系统相比,ODS能以更高的性能生成操作报告。ODS可帮助集成现有新型系统。根根据据的的提提法法,把把ODS按按照照数数据据更更新新频频率率分分为为3类类,后后来来随随着着业业务务的的发发展展,又出现了第又出现了第4类类ODS:ODS I:实时或准实时,数据整合少、简单。ODS II:每1小时或半小时更新一次,数据整合比较复杂。ODS III:每天更新一次,或者每周更新一次。ODS IV:把DW的分析结果存储到ODS
12、,该ODS保证交易访问这些数据能在2-3秒获得。Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR名词解释-StagingAreaStaging Area Storage由由一一些些ETL处处理理过过程程的的辅辅助助表表组组成成,辅辅助助ETL工工具具完完成成复复杂杂的的转转换换和和计计算算,Staging Area通通常常是是一一些些临临时时表。表。Staging Area的作用与实现:的作用与实现:1、减少对数据源的查询压力,有助于不同数据源的整合。2、应用于增量处理,可以减少处理的记录数量,使增量处理更加容易。3、对数据的格式进行转换,例
13、如日期格式、数据类型转换等。4、时间调度上的灵活性,通过建立Staging Area,把数据存储在临时空间,使ETL调度更灵活。5、作为ETL后续处理的统一接口,建立Staging Area作为ETL每个处理阶段的接口,对系统的灵活性和可扩展性非常有帮助。Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR主题菲奈特数据仓库方法论概述菲奈特数据仓库方法论概述菲奈特数据仓库体系架构菲奈特数据仓库体系架构菲奈特数据仓库实施方法菲奈特数据仓库实施方法Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR菲奈
14、特实施模式与关键因素 系统测试系统测试系统测试系统测试系统建立系统建立系统建立系统建立系统设计系统设计系统设计系统设计需求分析需求分析需求分析需求分析以业务为驱动以业务为驱动,需求明确需求明确用户培训用户培训用户培训用户培训试运行试运行试运行试运行部署部署部署部署上线运行上线运行上线运行上线运行监控监控监控监控业务增长业务增长业务增长业务增长业务分析业务分析业务分析业务分析管理层重视管理层重视,业务积极参与业务积极参与循序渐进,螺旋式开发循序渐进,螺旋式开发数据质量控制数据质量控制成熟的实施方法成熟的实施方法,风险控制风险控制灵活的架构和数据模型灵活的架构和数据模型最佳实践经验最佳实践经验Co
15、pyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR数据仓库实施评估过程过程|阶段阶段方案评估方案评估系统定义系统定义系统分析系统分析系统设计系统设计系统开发系统开发系统测试系统测试系统上线系统上线系统维护系统维护项目前期准备项目前期准备10.0%业务需求定义业务需求定义40.0%26.0%35.0%系统结构设计系统结构设计15.0%20.0%15.0%8.0%4.0%逻辑模型设计逻辑模型设计10.0%15.0%15.0%15.0%数据获取数据获取(ETL)10.0%12.0%18.0%20.0%40.0%20.0%8.0%物理模型设计物理模型设计1
16、8.0%8.0%12.0%DW/OLAP建立建立5.0%10.0%3.0%5.0%前端应用开发前端应用开发2.0%3.0%8.0%8.0%3.0%3.0%数据质量控制数据质量控制5.0%10.0%3.0%5.0%5.0%15.0%元数据管理元数据管理1.0%1.0%3.0%3.0%2.00%数据仓库管理数据仓库管理2.0%4.0%3.0%4.0%5.0%7.0%5.0%文档编写文档编写5.0%1.0%2.0%4.0%3.0%3.0%5.0%系统测试系统测试/Review5.0%2.0%4.0%5.0%8.0%25.0%15.0%用户培训用户培训7.0%2.0%4.0%4.0%7.0%20.0%
17、系统上线系统上线2.0%3.0%30.0%技术支持技术支持8.0%25.00%合计合计100%100%100%100%100%100%100%25%表中的百分比以一个中等规模的项目为例,说明每个过程的工作量在各个实施阶段中所占的比例,该百分比是多个项目的平均值,仅供参考。Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR项目组织结构图Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR实施团队模型实施团队模型定义了相互协作、同等角色关系的工作模型。每实施团队模型定义了相互协作、同等角色关系的工作模
18、型。每个组中的成员在项目中都有一个明确定义的角色,并且关注于个组中的成员在项目中都有一个明确定义的角色,并且关注于一种特定的任务。一种特定的任务。每个人的工作是同样重要和有价值的。每个人的工作是同样重要和有价值的。每个人必须对其交付品的质量负责。每个人必须对其交付品的质量负责。团队模型不是组织结构图。团队模型不是组织结构图。Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR菲奈特数据仓库实施流程 方案评估方案评估 系统定义系统定义 系统分析系统分析 系统设计系统设计 系统开发系统开发 系统测试系统测试 系统上线系统上线 系统维护系统维护Copy
19、right2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR方案评估概述本阶段为售前阶段,以客户策略性业务需求和目标为基础,提供本阶段为售前阶段,以客户策略性业务需求和目标为基础,提供解决方案,完成对系统目标和企业数据仓库基础结构的定义。解决方案,完成对系统目标和企业数据仓库基础结构的定义。对客户组织结构、成功的关键因素、主要的限制因素、事项、风对客户组织结构、成功的关键因素、主要的限制因素、事项、风险和由数据仓库系统带来的收益进行评估。险和由数据仓库系统带来的收益进行评估。此外,还要完成对高层的技术实现结构、高层的数据仓库结构进此外,还要完成对高层的技术实现结
20、构、高层的数据仓库结构进行定义,确保方案的可行性和扩展性。行定义,确保方案的可行性和扩展性。Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR菲奈特数据仓库实施流程 方案评估方案评估 系统定义系统定义 系统分析系统分析 系统设计系统设计 系统开发系统开发 系统测试系统测试 系统上线系统上线 系统维护系统维护Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR系统定义概述本阶段项目组尚未正式进场,根据商务合同文本及其附件,明确本阶段项目组尚未正式进场,根据商务合同文本及其附件,明确定义迭代过程的定义
21、迭代过程的目标和范围目标和范围,对用户目标和分析需求的信息进行,对用户目标和分析需求的信息进行收集,在已确定的解决方案实施范围内确定整体技术方案。收集,在已确定的解决方案实施范围内确定整体技术方案。在本阶段还需建立在需求范围控制、数据获取、数据质量控制、在本阶段还需建立在需求范围控制、数据获取、数据质量控制、数据仓库管理、元数据管理、数据访问和培训等方面的数据仓库管理、元数据管理、数据访问和培训等方面的策略性方策略性方案案。必要的时候,必要的时候,PMPM可以与客户相关人员进行沟通。可以与客户相关人员进行沟通。本阶段确定项目组的成员和项目范围、分工,各个阶段的主要提本阶段确定项目组的成员和项目
22、范围、分工,各个阶段的主要提交物,以及项目预算。交物,以及项目预算。通过内部通过内部Kick offKick off确认资源安排、计划以及预算等。确认资源安排、计划以及预算等。Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR系统定义实施流程Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR系统定义主要任务主要任务主要任务n确认项目范围和主要目标;n确认项目阶段性验收及总体验收标准;n熟悉合同附件中的系统解决方案建议书和SOW;n确认项目实施初步计划;n成立项目组,确定各项目小组的成员及各自的工
23、作职责;n确定各项目小组的阶段性工作目标;n确定系统最主要的End User;n 工具选型和评估。交付物交付物n 项目组织架构和人员组成;n 项目实施初步计划;n 项目实施成本预算;Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR菲奈特数据仓库实施流程 方案评估方案评估 系统定义系统定义 系统分析系统分析 系统设计系统设计 系统开发系统开发 系统测试系统测试 系统上线系统上线 系统维护系统维护Copyright2000-2004FEnetSoftwareCo.,Ltd.-AllRightsR系统分析概述在本阶段开始之前,在客户现场召开项目启动
24、会议,重申项目目在本阶段开始之前,在客户现场召开项目启动会议,重申项目目标、重点,以及需求访谈的模式等。标、重点,以及需求访谈的模式等。在本阶段中,在已确定的解决方案实施范围内,进行现状分析,在本阶段中,在已确定的解决方案实施范围内,进行现状分析,明确详细的业务需求,项目组集中精力收集详细的分析需求,设明确详细的业务需求,项目组集中精力收集详细的分析需求,设计数据仓库构架,收集最终用户对数据的访问需求。计数据仓库构架,收集最终用户对数据的访问需求。本阶段的结果提交一个详细的需求分析报告,这些需求将用于数本阶段的结果提交一个详细的需求分析报告,这些需求将用于数据仓库设计和项目的其它阶段。据仓库设
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 实施 方法论
限制150内