数据仓库原理设计与应用精.ppt
《数据仓库原理设计与应用精.ppt》由会员分享,可在线阅读,更多相关《数据仓库原理设计与应用精.ppt(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据仓库原理设计与应用第1页,本讲稿共29页第第 4 章章 OLAP 技术技术u4.1 OLAP 技术概念技术概念u4.2 OLAP 与多维分析与多维分析u4.3 OLAP 的实施的实施u4.4 多维多维 OLAP 与关系与关系 OLAPu4.5 OLAP 技术评价技术评价u练习练习第2页,本讲稿共29页4.1 OLAP 4.1 OLAP 技术概念技术概念在线分析处理或联机分析处理(线分析的处理上的OLAP,)是一个应用广泛的数据仓库使用技术。两个特点,在线性(On_Line),多维分析(Multi_Analysis),4.1.1OLAP的发展针对特定问题的联机数据查询和分析对原始数据按照用户
2、的观点进行转换处理反映用户眼中问题某一真实方面(“维”)快速、稳定、一致和交互式的存取允许用户对这些数据按照需要进行深入的观察第3页,本讲稿共29页4.1.2 OLAP 的特性的特性1.快速性快速性系统能在数秒内对用户的多数分析要求做出反应系统能在数秒内对用户的多数分析要求做出反应2.可分析性用户无需编程就可以定义新的专门计算,将其作为分析的一部分,并以用户所希望的方式给出报告3.多维性提供对数据分析的多维视图和分析4.信息性能及时获得信息,并且管理大容量信息能及时获得信息,并且管理大容量信息第4页,本讲稿共29页4.2 OLAP 与多维分析与多维分析4.2.1 多维基本概念多维基本概念维维、
3、维维的的层层次次、维维成成员员、多多维维数数据据集集、数数据据单单元元、多维数据集的度量值和聚集多维数据集的度量值和聚集1.维维“上卷”“下钻”销售地区西南华中华东四川云南河南湖北江苏上海第5页,本讲稿共29页4.2 OLAP 与多维分析与多维分析2.多维数据集多维数据集产品北京上海化妆品江苏玩具服装电器1234时间(月)销售数量:10000服装切片第6页,本讲稿共29页3.维成员维成员维维的的一一个个取取值值、不同维层次取值的组合、维成员描述所关心的主题在维中的位置 数据单元可以表示为:(维1维成员,维2维成员,维3维成员,维4维成员,观察变量值)4.多维数据集的度量值多维数据集的度量值多维
4、数据集的核心值多维数据集的核心值 5.聚集聚集立立方方体体中中包包括括很很多多层层次次,这这些些层层次次可可以以向向用用户户提提供供某某一一层层次的概括数据次的概括数据 通过聚集,形成基于维的有决策分析意义的一些数据交集通过聚集,形成基于维的有决策分析意义的一些数据交集第7页,本讲稿共29页4.2.2 多维分析多维分析1.多维的切片多维的切片(维 1,维2,维i成员,维n,观察变量)是多维数据集(维1,维2,维i,维n,观察变量)在维i上的一个切片 2.多维的切块多维的切块在(维1,维2,维i,维k,维n,观察变量)多维数据集上,对维i,维k,选定了维成员,那(维1,维2,维i成员,维k成员,
5、维n,观察变量)就是多维数据集(维1,维2,维i,维k,维n,观察变量)在维i,维k上的一个切块 第8页,本讲稿共29页4.2.2 多维分析多维分析3.旋转旋转2002年2003年1季度2季度3季度4季度1季度2季度3季度4季度北京市123564566134562355上海市13410398871021399782天津市6773599673696294第9页,本讲稿共29页4.2.2 多维分析多维分析3.旋转旋转北京市上海市天津市2002年1季度123134672季度56103733季度4598594季度6687962003年1季度134102732季度56139693季度2397624季度5
6、58294第10页,本讲稿共29页4.2.2 多维分析多维分析4.其它其它OLAP操作操作u“上卷上卷”(roll_up)、)、“下钻下钻”(drill_down)、)、“钻过钻过”(drill_across)和)和“钻透钻透”(drill_through)等钻取操作。)等钻取操作。“上卷上卷”是指沿某一个维的概念分层向上归约是指沿某一个维的概念分层向上归约;“下钻下钻”是上是上卷的逆向操作,它是沿某一个维的概念分层向下或引入新的维卷的逆向操作,它是沿某一个维的概念分层向下或引入新的维来实现;来实现;“钻过钻过”是指对多个事实表进行查询;是指对多个事实表进行查询;“钻透钻透”是指对立是指对立方
7、体操作时,利用数据库关系,钻透立方体的底层,进入后方体操作时,利用数据库关系,钻透立方体的底层,进入后端的关系表。端的关系表。uOLAP的其它操作还有统计表中最高值和最低值的项数,计算平均的其它操作还有统计表中最高值和最低值的项数,计算平均值、增长率、利润、投资回报率等统计计算。值、增长率、利润、投资回报率等统计计算。第11页,本讲稿共29页4.2.3 维的层次关系维的层次关系简单层次简单层次复杂层次复杂层次全国江苏北京上海苏州市扬州市宝应县第12页,本讲稿共29页4.2.4 维的类关系维的类关系类类的的划划分分,只只能能依依据据同同一一层层次次的的维维成成员员集集合合来划分来划分 维的层次与
8、类组合图 产品维产品大类产品用途类产品销地类产品产地类产品小类第13页,本讲稿共29页4.2.5 OLAP与数据仓库关系与数据仓库关系u从OLAP使用的效率角度考虑,设计数据仓库时考虑因素。u尽可能使用星型架构,如果采用雪花结构,就要最小化事实表底层维度表以后的维度表数量。u为用户设计包含事实表的维度表。u维度表的设计应该符合通常意义上的范式约束,维度表中不要出现无关的数据。u事实表中不要包含汇总数据,事实表中所包含的用户需要访问的数据应该具有必需的粒度。u对事实表和维度表中的关键字必须创建索引;同一种数据尽可能使用一个事实表。u保证数据的参考完整性,避免事实表中的某些数据行在立方体进行聚集运
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 原理 设计 应用
限制150内