数据仓库的开发流程.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《数据仓库的开发流程.ppt》由会员分享,可在线阅读,更多相关《数据仓库的开发流程.ppt(53页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据仓库的技术与开发数据仓库的技术与开发数据仓库设计开发流程数据仓库设计开发流程数据库系统的开发流程数据库系统的开发流程需求收集和分析设计概念结构设计逻辑结构数据模型优化设计物理结构设计评价性能预测物理实现实验性运行使用维护数据库不满意不满意需求分析阶段概念设计阶段逻辑设计阶段物理设计阶段数据库实施阶段数据库运行维护阶段不满意不满意数据库设计流程的特点数据库设计流程的特点n有明确的应用需求;n严格遵循系统生命同期的阶段划分,较清楚的设计开发步骤;n良好的可操作性,每一步骤的任务、文档内容与格式有细致的规定。n举例:项目文档数据库设计举例数据库设计举例 1.需求分析 (沟通、会议演示、软件需求说
2、明书)2.系统概念设计 (系统功能结构、流程、数据结构等)3.系统详细设计 (E-R、功能模块、界面、业务过程、接口)5.系统实现 (数据库实现、程序实现)4.系统测试与实施数据库与数据仓库设计的区别数据库与数据仓库设计的区别数据仓库开发流程的特点数据仓库开发流程的特点n原始需求不明确,且不断变化与增加,不能较准确地预见到以后的需求;n采用原型法开发,从构建系统的简单的基本框架着手;n数据驱动,着眼于有效地抽取、综合、集成和挖掘已有数据库的数据资源。原型法原型法n原型(Prototype)是开发信息系统的一个可执行模型或引导性版本;n帮助得到目标系统明确而严格的需求,促进客户和各阶段系统人员之
3、间的相互有效的信息交流,并以此为基础进行需求分析和系统设计。n从本质上看,原型是未来目标系统的一个模型。原型法原型法n原型不是系统开发的最终产品,而是在某个开发阶段中为达到一定的目的所生成的系统简化模拟版本;n可能只是目标系统的一个式样,或只包含目标系统的某些功能,或仅仅是具有目标系统的一个结构。原型法原型法数据仓库的开发流程数据仓库的开发流程规划与确定需求开发概念模型开发逻辑模型设计体系结构数据库与元数据设计确定数据源抽取开发中间件填充与测试数据仓库数据仓库应用数据仓库维护数据仓库评价数据仓库开发过程规划分析阶段规划分析阶段设计实施设计实施阶段阶段使用维使用维护阶段护阶段数据仓库的开发流程数
4、据仓库的开发流程n数据仓库系统的开发是一个经过不断循环、反馈而使系统不断增长与完善的过程,这也是原型法区别于系统生命周期法的主要特点。数据仓库的设计步骤数据仓库的设计步骤n概念模型设计n技术准备工作n逻辑模型设计n物理模型设计n数据仓库生成n数据仓库使用与维护数据仓库的设计步骤数据仓库的设计步骤数据仓库的设计步骤数据仓库的设计步骤n概念模型设计n技术准备工作n逻辑模型设计n物理模型设计n数据仓库生成n数据仓库运行与维护概念模型设计概念模型设计n任务:界定系统边界 确定主题域及其属性描述 数据模型(多维数据模型,或E-R)n成果:是在原有的数据库的基础上建立一个较为稳固的概念模型。概念模型设计概
5、念模型设计n任务:界定系统边界 确定主题域及其属性描述 数据模型(多维数据模型,或E-R)n成果:是在原有的数据库的基础上建立一个较为稳固的概念模型。界定系统边界界定系统边界(初步需求分析)(初步需求分析)n基本的方向性需求:要做的决策类型有哪些?决策者感兴趣的是什么问题?这些问题需要什么样的信息?要得到这些信息需要包含原有数据库系统的哪些部分的数据?n可以划定一个当前的大致的系统边界,集中精力进行最需要的部分的开发。概念模型设计概念模型设计n任务:界定系统边界 确定主题域及其属性描述 数据模型(多维数据模型,或E-R)n成果:是在原有的数据库的基础上建立一个较为稳固的概念模型。确定主题域确定
6、主题域及其内容及其内容n确定主要的主题域n对每个主题域的内容进行较明确的描述:主题域的公共码键;主题域之间的联系;充分代表主题的属性组。n举例以商场的数据仓库设计为例商场数据仓库概念模型设计商场数据仓库概念模型设计 日趋激烈的市场竞争要求商场经营者更加准确地了解商场经营状况,跟踪市场趋势,更加合理地制定商品采购与销售策略。由于商场以前的一些OLTP 的需要,在各个部门建立了许多分散的数据库,分别处理各自的业务。如在人事、采购、库存、销售等部门分别存储着各自的数据库,各个部门的数据按自己业务需要加以组织。这样的组织使得数据各自为政,缺乏全局性,管理层想要在这些数据的基础上得到一些全局报表、进行一
7、些分析工作是比较困难的。因此商场的领导决定要在原有的数据库系统的基础上建立一个数据仓库。界定系统的边界界定系统的边界n需求:主要是商品采购和销售情况n商场经营者目前所要进行的分析主要有:分析顾客的购买趋势;分析商品供应市场的变化趋势;分析供应商信用等级。界定系统的边界界定系统的边界n所需要的数据应包括:商品销售数据;商品采购数据;商品库存数据;顾客信息;供应商信息。n所以,我们可以将系统的边界定为包含原有的销售子系统、采购子系统以及库存子系统在内的集合。确定主要的主题域确定主要的主题域n三个基本主题:商品、供应商和顾客。n主题之间的联系是:供应商供应多种商品,一种商品可由多个供应商提供,即“商
8、品”主题与“供应商”供应的商品直接联系;供应商供应的商品同样也可以被不同的顾客购买,但“顾客”主题与“供应商”主题间并不是直接发生关系的,它们之间的联系是经过“商品”主题的间接联系。E-R模型模型各主题的属性信息各主题的属性信息数据仓库的设计步骤数据仓库的设计步骤n概念模型设计n技术准备工作n逻辑模型设计n物理模型设计n数据仓库生成n数据仓库使用与维护技术准备工作技术准备工作n工作包括:技术评估,技术环境准备。n成果是:技术评估报告,软硬件配置方案,系统(软、硬件)总体设计方案。数据仓库的设计步骤数据仓库的设计步骤n概念模型设计n技术准备工作n逻辑模型设计n物理模型设计n数据仓库生成n数据仓库
9、使用与维护逻辑模型设计逻辑模型设计n分析主题域n确定粒度层次划分n确定数据分割策略n关系模式定义n数据源及抽取模型的定义分析主题域分析主题域n对概念模型设计步骤中确定的几个基本主题域进行分析,选择首先要实施的主题域;n如果所选择的主题域很大并且很复杂,我们甚至可以针对它的一个有意义的子集来进行开发;n商场数据仓库设计的例子:“商品”主题既是一个商场的最基本的业务对象,又是进行决策分析的最主要的领域,因而较之另两个主题来说,“商品”主题具有更重要的意义与作用。所以,我们可以先选定“商品”主题来实施。粒度层次划分粒度层次划分n粒度层次划分适当与否直接影响到数据仓库中的数据量和所适合的查询类型;n通
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 开发 流程
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内