数据仓库设计课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《数据仓库设计课件.ppt》由会员分享,可在线阅读,更多相关《数据仓库设计课件.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据仓库设计数据仓库设计胡正耀 09105015一、数据仓库系统结构一、数据仓库系统结构RDBMS数据文件数据文件其他其他 综合数据综合数据 当前数据当前数据 历史数据历史数据 元数据元数据 抽取、转换、装载抽取、转换、装载数据仓库数据仓库OLAP工具工具DM工具工具 查询工具查询工具分析工具分析工具报表工具报表工具 抽取抽取.转换转换.装载装载源数据库源数据库 DW管理工具管理工具数据建模工具数据建模工具 数据源数据源二、建立二、建立DWDW的两种方式的两种方式1.1.自顶向下型自顶向下型“自顶向下自顶向下”的开发策略是指对原来分散存储在企业的开发策略是指对原来分散存储在企业各处的各处的OL
2、TPOLTP数据库中的有用数据通过提取、清洁、转数据库中的有用数据通过提取、清洁、转换、聚集等处理步骤建立一个全局性数据仓库。这个换、聚集等处理步骤建立一个全局性数据仓库。这个全局的数据仓库将提供给用户一个一致的数据格式,全局的数据仓库将提供给用户一个一致的数据格式,一致的软件环境。从理论上说,决策支持所需的数据一致的软件环境。从理论上说,决策支持所需的数据都应该包含在这个全局数据仓库中。数据集市中存储都应该包含在这个全局数据仓库中。数据集市中存储的数据是为某个部门的的数据是为某个部门的DSSDSS应用而专门从全局数据仓库应用而专门从全局数据仓库中提取的,它是全局数据仓库中数据的一个子集。在中
3、提取的,它是全局数据仓库中数据的一个子集。在“自顶向下自顶向下”的模式中,数据集市和数据仓库的关系的模式中,数据集市和数据仓库的关系是单方向的,即数据从数据仓库流向数据集市。是单方向的,即数据从数据仓库流向数据集市。原有数据和应用源原有数据和应用源抽取、转换、迁移抽取、转换、迁移数据仓库数据仓库数据仓库/数据集市元数据数据集市自顶向下的数据仓库结构自顶向下的数据仓库结构二、建立二、建立DWDW的两种方式的两种方式2.2.自下向上型自下向上型“自底向上自底向上”模式是从建立各个部门或特定的商业问模式是从建立各个部门或特定的商业问题的数据集市开始,全局性数据仓库建立在这些数据题的数据集市开始,全局
4、性数据仓库建立在这些数据集市的基础上。集市的基础上。“自底向上自底向上”模式的特点是初期投资模式的特点是初期投资少,见效快,因为它在建立部门数据集市时只需要较少,见效快,因为它在建立部门数据集市时只需要较少的人做决策,解决的是较小的商业问题。少的人做决策,解决的是较小的商业问题。“自底向自底向上上”的开发模式可以使一个单位在数据仓库发展初期的开发模式可以使一个单位在数据仓库发展初期尽可能少地花费资金,也可以在做出有效的投入之前尽可能少地花费资金,也可以在做出有效的投入之前评估技术的收益情况。评估技术的收益情况。原有数据和应用源原有数据和应用源抽取、转换、迁移抽取、转换、迁移数据仓库数据仓库数据
5、仓库/数据集市元数据数据集市自下向上的数据仓库结构自下向上的数据仓库结构 “平行开发平行开发”模式是指在一个全局性数据仓库模式是指在一个全局性数据仓库的数据模型的指导下,数据集市的建立和全局性数据的数据模型的指导下,数据集市的建立和全局性数据仓库的建立同时进行。在仓库的建立同时进行。在“平行开发平行开发”模式中由于数模式中由于数据集市的建立是在一个统一的全局数据模型的指导下据集市的建立是在一个统一的全局数据模型的指导下进行的,可避免各部门在开发各自的数据集市时的盲进行的,可避免各部门在开发各自的数据集市时的盲目性,减少各数据集市之间的数据冗余和不一致。在目性,减少各数据集市之间的数据冗余和不一
6、致。在“平行开发平行开发”模式中数据集市的这种相对独立性有利模式中数据集市的这种相对独立性有利于全局性数据库的建设。一旦全局性数据仓库建立好于全局性数据库的建设。一旦全局性数据仓库建立好后,各部门的数据集市将成为全局数据仓库的一个子后,各部门的数据集市将成为全局数据仓库的一个子集集#全局数据仓库将负责为各部门已建成和即将要建的全局数据仓库将负责为各部门已建成和即将要建的数据集市提供数据。数据集市提供数据。二、建立二、建立DWDW的两种方式的两种方式两种方式的比较:两种方式的比较:自顶向下自顶向下 的方法是在单个项目阶段中实现数据仓的方法是在单个项目阶段中实现数据仓库,需要在项目开始时完成更多计
7、划和设计工作。这库,需要在项目开始时完成更多计划和设计工作。这就需要涉及参与数据仓库实现的每个工作组、就需要涉及参与数据仓库实现的每个工作组、部门或部门或业务线中的人员。要使用的数据源、安全性、数据结业务线中的人员。要使用的数据源、安全性、数据结构、数据质量、数据标准和整个数据模型的有关决策构、数据质量、数据标准和整个数据模型的有关决策一般需要在真正的实现开始之前就完成,一般需要在真正的实现开始之前就完成,建设规模往建设规模往往较大,建设周期长,投资大。往较大,建设周期长,投资大。二、建立二、建立DWDW的两种方式的两种方式两种方式的比较:两种方式的比较:自下向上自下向上的实现包含数据仓库的计
8、划和设计,无的实现包含数据仓库的计划和设计,无需等待安置好更大业务范围的数据仓库设计。这并不需等待安置好更大业务范围的数据仓库设计。这并不意味着不会开发更大业务范围的数据仓库设计;随着意味着不会开发更大业务范围的数据仓库设计;随着初始数据仓初始数据仓 库实现的扩展,将逐渐增加对它的构建。库实现的扩展,将逐渐增加对它的构建。现在,该方法得到了比自顶向下方法更广泛的接受,现在,该方法得到了比自顶向下方法更广泛的接受,因为数据仓库的直接结果可以实现,并可以用作扩展因为数据仓库的直接结果可以实现,并可以用作扩展更大业务范围实现的证明。更大业务范围实现的证明。二、建立二、建立DWDW的两种方式的两种方式
9、两种方式的比较:两种方式的比较:一种折中方案:一种折中方案:每种实现方法都有利弊。在许多情况下,最好的方法可能是某两每种实现方法都有利弊。在许多情况下,最好的方法可能是某两种的组合。该方法的关键之一就是确定业务范围的架构需要用于种的组合。该方法的关键之一就是确定业务范围的架构需要用于支持集成的计划和设计的程度,因为数据仓库是用自底向上的方支持集成的计划和设计的程度,因为数据仓库是用自底向上的方法进行构建。在使用自底向上或阶段性数据仓库项目模型来构建法进行构建。在使用自底向上或阶段性数据仓库项目模型来构建业务范围架构中的一系列数据集市时,您可以一个接一个地集成业务范围架构中的一系列数据集市时,您
10、可以一个接一个地集成不同业务不同业务 主题领域中的数据集市,从而形成设计良好的业务数据主题领域中的数据集市,从而形成设计良好的业务数据仓库。这样的方法可以极好地适用于业务。在这种方法中,可以仓库。这样的方法可以极好地适用于业务。在这种方法中,可以把数据集市理解为整个数据仓库系统的逻辑子把数据集市理解为整个数据仓库系统的逻辑子 集,换句话说数据集,换句话说数据仓库就是一致化了的数据集市的集合。这种方案的实施步骤通常仓库就是一致化了的数据集市的集合。这种方案的实施步骤通常分如下几步:分如下几步:(1)(1)从整个企业的角度定义计划和需求从整个企业的角度定义计划和需求 (2)(2)构建完整的仓库体系
11、结构构建完整的仓库体系结构 (3)(3)使数据内容一致而且标准化使数据内容一致而且标准化 (4)(4)将数据仓库作为一种超级数据集市来实施将数据仓库作为一种超级数据集市来实施 随着数据仓库技术的发展随着数据仓库技术的发展 ,数据仓库的实现策略数据仓库的实现策略已从原先的已从原先的“自顶向下自顶向下”一种模式发展到了六种模式。一种模式发展到了六种模式。1 1、“自顶向下自顶向下”模式模式 2 2、“自底向上自底向上”模式模式 3 3、“平行开发平行开发”模式模式 为了解决用户需求变化的问题为了解决用户需求变化的问题 ,在业界引入了三在业界引入了三种模式。种模式。4 4、“有反馈的自顶向下有反馈的
12、自顶向下”模式模式5 5、“有反馈的自底向上有反馈的自底向上”模式模式 6 6、“有反馈的平行开发有反馈的平行开发”模式模式 三、数据仓库构建步骤三、数据仓库构建步骤 数据建模数据建模 概念模型设计概念模型设计 逻辑模型设计逻辑模型设计物理模型设计物理模型设计 OLAP应用应用完善维护系统完善维护系统 应用与维护应用与维护确定系统边界确定系统边界确定主题域确定主题域 总体分析设计总体分析设计技术环境设备技术环境设备 三、数据仓库构建步骤三、数据仓库构建步骤1)收集和分析业务需求;收集和分析业务需求;2)建立数据模型和数据仓库的物理设计;建立数据模型和数据仓库的物理设计;3)定义数据源;定义数据
13、源;4)选择数据仓库技术和平台;选择数据仓库技术和平台;5)从操作型数据库中提取、转换和净化数据到数从操作型数据库中提取、转换和净化数据到数据仓库;据仓库;6)选择访问和报表工具;选择访问和报表工具;7)选择数据库连接软件;选择数据库连接软件;8)选择数据分析和数据展示软件;选择数据分析和数据展示软件;9)更新数据仓库;更新数据仓库;三、数据仓库建立的基本框架三、数据仓库建立的基本框架需求分析需求分析运行维护运行维护模型设计物理设计技术选择数据处理应用设计应用开发产品选择项项目目管管理理四、数据的获取四、数据的获取数据仓库所需要的数据不像业务处理系统那样数据仓库所需要的数据不像业务处理系统那样
14、直接从业务发生地获取,而是从与业务处理发直接从业务发生地获取,而是从与业务处理发生直接联系的业务处理系统那里获取,如传统生直接联系的业务处理系统那里获取,如传统的基于的基于C/S结构的在线事物处理系统结构的在线事物处理系统OLTP。这些业务处理系统中的数据往往与业务处理联这些业务处理系统中的数据往往与业务处理联系在一起,只为业务的日常处理服务,而不为系在一起,只为业务的日常处理服务,而不为决策分析服务。所以决策分析服务。所以DW从业务处理系统那里从业务处理系统那里获取数据时,并不能将原数据库中的数据直接获取数据时,并不能将原数据库中的数据直接加载到加载到DW中,而是要进行一系列的处理。中,而是
15、要进行一系列的处理。四、数据的获取四、数据的获取数据进入数据仓库的基本过程数据进入数据仓库的基本过程 操作数据向数操作数据向数据仓库的移动包括以下五个过程据仓库的移动包括以下五个过程:五、设计模型的选择五、设计模型的选择数据仓库是多维数据库,它扩展了关系数据库模型,数据仓库是多维数据库,它扩展了关系数据库模型,以星形架构为主要结构方式的,并在它的基础上,扩以星形架构为主要结构方式的,并在它的基础上,扩展出理论雪花形架构和数据星座等方式,但不管是哪展出理论雪花形架构和数据星座等方式,但不管是哪一种架构,维度表、事实表和事实表中的量度都是必一种架构,维度表、事实表和事实表中的量度都是必不可少的组成
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 设计 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内