2、数据仓库设计1102.pptx





《2、数据仓库设计1102.pptx》由会员分享,可在线阅读,更多相关《2、数据仓库设计1102.pptx(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据仓库是面向主题的、集成的、稳定的、随时间不断变化的数据库系统。它介于数据源与多维数据库之间,起到承上启下的作用。数据仓库是通过对来自不同的数据源进行统一处理及管理,通过灵活的展现方法来帮助决策支持。数据源数据仓库决策在设计仓库数据库之初在设计仓库数据库之初把用户的分析需求纳入把用户的分析需求纳入考虑范围是十分有必要考虑范围是十分有必要的。同时,数据仓库的的。同时,数据仓库的构建必需基于业务数据构建必需基于业务数据库,业务数据源的结构库,业务数据源的结构也是不得不考虑的问题。也是不得不考虑的问题。因此在设计数据仓库的因此在设计数据仓库的时候,应该坚持用户驱时候,应该坚持用户驱动与数据驱动相结
2、合的动与数据驱动相结合的设计理念。设计理念。1NF如果一个表中没有重复组(即行与列的交叉点上只有一个值,而不是一组值),且定义了关键字、所有非关键属性都依赖于关键字,则这个表属于第一范式(常记成1NF)2NF如果一个表属于1NF,且不包含部分依赖性,既没有任何属性只依赖于关键字的一部分,则这个表属于第二范式(常记成2NF)。3NF如果一个表属于2NF,且不包含传递依赖性(即没有一个非关键属性依赖于另一个非关键属性,或者说没有一个非关键属性决定另一个非关键属性),则这个表是第三范式(常记成3NF)。ER模型(实体联系模型)简称ER图。它是描述概念世界,建立概念模型的实用工具。ER图包括三个要素:
3、实体、属性、实体之间的联系联系归结为三种类型:一对一联系(1:1)设A、B为两个实体集。若A中的每个实体至多和B中的一个实体有联系,反过来,B中的每个实体至多和A中的一个实体有联系,称A对B或B对A是1:1联系。一对多联系(1:n)如果A实体集中的每个实体可以和B中的几个实体有联系,而B中的每个实体至我和A中的一个实体有联系,那么A对B属于1:n联系。多对多联系(m:n)若实体集A中的每个实体可与和B中的多个实体有联系,反过来,B中的每个实体也可以与A中的多个实体有联系,称A对B或B对A是m:n联系。多对多对多联系举例多联系举例统计特征统计特征统计特征统计特征FatFatLeanLeanUgl
4、yUglyWealthyWealthy统计特征客户客户统计特征销售Fact客户客户客户客户统计特征统计特征统计特征统计特征JohnJohnFatFatRichardRichardLeanLeanJohnJohnUglyUglyRichardRichardWealthyWealthy客户客户客户客户JohnJohnRichardRichardCristianCristian客户客户客户客户销售额销售额销售额销售额JohnJohn1.01.0RichardRichard3.03.0CristianCristian10.010.0每个统计特征对销售人员来说是怎么样的呢?统计特征统计特征统计特征统计特
5、征销售额销售额销售额销售额All DemographicsAll Demographics14.014.0FatFat1.01.0LeanLean3.03.0UglyUgly1.01.0WealthyWealthy3.03.0数据仓库模型设计主要分数据仓库模型设计主要分三个阶段:三个阶段:1、概念设计、概念设计2、逻辑设计、逻辑设计3、详细设计、详细设计并分别产生三类设计模型并分别产生三类设计模型1、主题域模型、主题域模型2、业务数据模型、业务数据模型3、物理模型、物理模型8数据仓库模型设计采用迭代式开发,这一点也符合数据仓库数据仓库模型设计采用迭代式开发,这一点也符合数据仓库系统迭代开发的特
6、点。它具有较好的灵活性和易变性,适应系统迭代开发的特点。它具有较好的灵活性和易变性,适应于主题不明确或不确定的需求。于主题不明确或不确定的需求。数据仓库是面向主题来组织数据仓库是面向主题来组织数据,一个数据仓库有若干个主题,数据,一个数据仓库有若干个主题,而每个主题又有一个数据集合体做而每个主题又有一个数据集合体做支撑,这个数据集合称为主题域。支撑,这个数据集合称为主题域。概念设计的中心工作是在需概念设计的中心工作是在需求分析基础上设计的主题域模型。求分析基础上设计的主题域模型。主体域模型是客观到主观之间的桥主体域模型是客观到主观之间的桥梁,是与硬件环境、软件选择无关梁,是与硬件环境、软件选择
7、无关的数据抽象模型,是为下一步建立的数据抽象模型,是为下一步建立业务数据模型、物理模型服务的概业务数据模型、物理模型服务的概念性工具。念性工具。主题主题域具有两个域具有两个特性特性1、独立性,即主题域具有明确的边界与独立的内涵,虽然主题间可以有交、独立性,即主题域具有明确的边界与独立的内涵,虽然主题间可以有交叉,但不影响其独立性叉,但不影响其独立性。2、完备性,即每个主题的分析要求所需的数据均应能在主题域中得到。采、完备性,即每个主题的分析要求所需的数据均应能在主题域中得到。采用概念数据模型设计就是要设计主题域的数据结构。用概念数据模型设计就是要设计主题域的数据结构。逻辑设计设计到的知识点包括
8、:逻辑设计设计到的知识点包括:业务数据模型设计的建模对象应包含实体、属性、关键字业务数据模型设计的建模对象应包含实体、属性、关键字和联系。和联系。业务数据模型设计应该遵守规范化准则:即第三范式设计业务数据模型设计应该遵守规范化准则:即第三范式设计准则。准则。业务数据模型的业务数据模型的ER图表示法。图表示法。逻辑设计的中心工作是逻辑设计的中心工作是设计业务数据模型,业务数设计业务数据模型,业务数据模型是用具体的软件结构据模型是用具体的软件结构来实现概念数据模型。来实现概念数据模型。目前数据仓库一般是建目前数据仓库一般是建立在关系数据库基础上,因立在关系数据库基础上,因此数据仓库的设计中采用的此
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 设计 1102

限制150内