02 数据仓库 第二章 数据仓库组成部分.ppt
《02 数据仓库 第二章 数据仓库组成部分.ppt》由会员分享,可在线阅读,更多相关《02 数据仓库 第二章 数据仓库组成部分.ppt(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Chapter Two 数据仓库组成部分p本章学习目标n数据仓库的定义n区分数据仓库和数据集市n学习数据仓库的每一个组成部分n介绍元数据的概念和它的重要性p提纲2.1 定义的特点2.2 数据仓库和数据集市2.3 数据仓库的组成部分2.4 元数据MetaDatap数据仓库的创始者 Bill Inmon:“A Data Warehouse is a subject oriented,integrated,nonvolatile,and time variant collection of data in support of managements decisions.”“数据仓库是为支持管理决策
2、建立的,面向主题的,综合的,数据仓库是为支持管理决策建立的,面向主题的,综合的,稳定的,随时间变化的数据集合稳定的,随时间变化的数据集合”p数据仓库的开拓者Sean Kelly,认为数据仓库中的数据是:n彼此分离n可利用的n综合的n包含时间标记的n面向主题的n非易失性的n能访问的2.1 定义的特点p“面向主题”的数据n在操作型系统中,各行业的数据集合都是围绕单独的应用程序进行组织的n在数据仓库中p数据是按主题而不是按照应用程序存储的。p数据是跨应用程序的订单处理客户贷款顾客帐单可接收帐款索赔处理储蓄帐目销售产品客户帐户索赔政策操作型应用程序数据仓库主题储蓄帐户支票帐户贷款帐户主题帐户来自应用程
3、序的数据数据仓库主题p“综合”的数据n数据仓库中的数据来自不同的数据库、文件、数据段。(内部或者外部,不同的平台)n数据进入数据仓库前,需要进行的标准化工作:p命名规则 p编码p数据特性p度量单位p数据的“时间特性”n数据仓库中的每一个数据结构都包含了时间要素。n数据仓库中的数据是和时间变化相关的数据p可以对过去进行分析p与当前的信息相关p可以对未来进行预测p数据的非易变性n操作型系统的数据实时地进行更新,每次交易发生都要更新;数据仓库中的数据非实时性更新n数据仓库中的数据用来进行查询和分析的p不能在数据仓库中实时地删除数据p不能在数据仓库中修改数据决策支持系统决策支持系统操作型系统操作型系统
4、OLTP数据库数据库数据仓库数据仓库 读取 增加 修改 删除 读取Data Granularityp数据粒度:数据的细节程度n在操作型系统中,数据粒度一般都很细。一般不保存加和的数据。n在数据仓库中,保存加和这一个数据项。一般来说,按不同层次组织数据,用户是从高层次向低层次的细节过渡。n根据需求的不同,需要不同层次的数据细节。每日数据每日数据帐户交易日期数额存款取款月汇总月汇总帐户月份交易数取款存款期初结余期末结余季度汇总季度汇总帐户月份交易数取款存款期初结余期末结余银行数据仓库的三个层次数据粒度2.2 数据仓库和数据集市p数据仓库和数据集市是一个混淆不清的概念。是学术界争论的话题pBill
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 02 数据仓库 第二章 数据仓库组成部分 第二 组成部分
限制150内