数据仓库实施步骤与关键成功因素.pptx
《数据仓库实施步骤与关键成功因素.pptx》由会员分享,可在线阅读,更多相关《数据仓库实施步骤与关键成功因素.pptx(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、3/16/20021一、数据仓库实施方法论?规划解决方案支持数据仓库管理(处理流程与操作)物理数据库设计数据转换应用开发数据挖掘服务设计与实现支持与增强解决方案体系结构设计元数据管理数据仓库评估应用增强逻辑数据模型回顾物理数据库回顾性能调整容量规划解决方案集成定制解决方案规划详细数据分析解决方案准备就绪解决方案实施建议现成解决方案规划数据仓库策略开发业务探索业务探索解决方案定义逻辑数据模型设计修改逻辑数据模型验证解决方案数据仓库的循环过程第1页/共28页3/16/20022数据仓库管理物理数据模型数据转换应用开发数据挖掘服务系统体系结构设计元数据管理解决方案集成项目具体实施步骤项目前期准备业务
2、探索信息探索逻辑数据模型二、项目具体实施步骤1.项目前期准备2.业务探索(Business Discovery)3.信息探索(Information Discovery)4.逻辑数据模型设计5.系统体系结构设计6.物理数据库设计7.数据转换加载ETL8.前端应用开发9.数据挖掘服务10.元数据管理11.数据仓库管理(处理流程与操作)12.解决方案集成(测试验收与试运行)第2页/共28页3/16/200232.1 项目前期准备主要任务:项目启动会议(Kick-off Meeting)确认项目范围和主要目标 确认项目阶段性验收及总体验收标准 确认项目实施计划 成立项目组 确定各项目小组的成员及各自
3、的工作职责 确定各项目小组的阶段性工作目标 确定教育训练计划 确定服务流程及方式 交付项目:项目组织机构项目人员组成 项目前期准备业务探索信息探索逻辑数据模型第3页/共28页3/16/200242.2 业务探索(Business Discovery)主要任务:确定重点用户与数据源 用户需求调研与确认 数据源确认 用户需求和数据源的筛选和分析 交付项目:业务需求说明书BRL(Business Requirement List)概念数据模型CDM(Conceptual Data Model)项目前期准备业务探索信息探索逻辑数据模型第4页/共28页3/16/200252.3 信息探索(Informa
4、tion Discovery)主要任务:分析用户需求 数据源分析 进行工具评估 系统安全性设计 系统命名规范设计交付项目:功能需求列表FRL(Function Requirement List)系统安全性设计说明书 系统命名规范说明书数据质量分析项目前期准备业务探索信息探索逻辑数据模型第5页/共28页3/16/200262.4 逻辑数据模型设计主要任务:进行原始数据分析 建立实体模型 建立实体间依赖关系 完善并填入所有属性 建立数据库逻辑模型 利用工具:ERWin交付项目:数据仓库逻辑数据模型LDM逻辑数据模型说明书项目前期准备业务探索信息探索逻辑数据模型第6页/共28页3/16/200272
5、.4 逻辑数据模型概念逻辑数据模型是用来发现、记录和沟通业务的详细“蓝图”基于概念数据模型(CDM)由一系列表和实体详细描述组成通用的业务语言便于业务与业务之间的功能理解集成当前和未来数据的蓝图独立于技术为物理数据库设计作准备是IT人员和业务人员沟通的工具发现属性发现关系发现实体1.业务规则2.ER图3.ERA建模第7页/共28页3/16/200282.4 逻辑数据模型(LDM)示例第8页/共28页3/16/200292.5 系统体系结构设计主要任务:1.对业务、技术环境及企业文化的充分了解,从技术、组织、教育和支持等方面对系统进行全面评估2.定义业务驱动力3.定义数据仓库成功的关键因素4.定
6、义数据仓库的实施原则5.对系统体系结构各个组件进行详细设计交付项目:系统体系结构设计说明书数据仓库管理物理数据模型数据转换应用开发数据挖掘服务系统体系结构设计元数据管理解决方案集成第9页/共28页3/16/2002102.5 体系结构设计组件用户类型拓扑结构网络存取与互连组织机构安全性数据体系结构-逻辑数据模型-元数据-数据质量-命名规范数据采集与转换用户存取及工具备份系统操作管理第10页/共28页3/16/200211主要任务:主要任务:转换逻辑数据模型(LDM)为物理数据模型定义主索引、次索引非正则化处理(denormalizations)数据库建立设计优化数据库功能测试使用工具:使用工具
7、:ERWwin交付项目:交付项目:物理数据模型(LDM)物理数据模型说明书数据库描述语言DDL2.6 物理数据库设计建模方法:第三范式 3NF 星型结构 雪花状结构数据仓库管理物理数据模型数据转换应用开发数据挖掘服务系统体系结构设计元数据管理解决方案集成第11页/共28页3/16/200212概念数据模型(CDM Conceptual Data Model)主要实体和它们的关系(Major Entities and Their Relationships)逻辑数据模型(LDM-Logical Data Model)业务模型加(CDM Plus):所有的表及简单的数据(All Tables wi
8、th Sample Data)辅助的表及简单的数据(Minor Tables with Sample Data)主键与外键的关系(PK&FK Relationships)数据约束(Constraints)属性(Attributes)扩展逻辑数据模型(ELDM-Extended Logical Data Model)逻辑数据模型加(LDM Plus):存取详细描述(Access Demographics)数据详细描述(Data Demographics)物理数据模型(PDM-Physical Data Model)扩张逻辑数据模型(ELDM Plus):索引(Indices)非正则化(Denor
9、malization)2.6 数据模型的演变第12页/共28页3/16/200213非正则化的两种类型:v 物理非正则化派生数据(Derived Data)汇总表(Summary Tables)重复的Groups (Repeating Groups)多物理表(Multiple Physical Tables)预连接(Pre-joins)子实体(Sub-entities)v 逻辑非正则化视图(Views)逻辑星型结构(Logical Star Schemas)F 物理非正则化对模型的灵活性会有影响F 逻辑非正则化是一个优选的方法(OLAP实现)2.6 非正则化处理(Denormalization
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 实施 步骤 关键 成功 因素
限制150内