数据仓库原理设计与应用幻灯片.ppt
《数据仓库原理设计与应用幻灯片.ppt》由会员分享,可在线阅读,更多相关《数据仓库原理设计与应用幻灯片.ppt(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据仓库原理设计与应用第1页,共29页,编辑于2022年,星期六第第 4 章章 OLAP 技术技术u4.1 OLAP 技术概念技术概念u4.2 OLAP 与多维分析与多维分析u4.3 OLAP 的实施的实施u4.4 多维多维 OLAP 与关系与关系 OLAPu4.5 OLAP 技术评价技术评价u练习练习第2页,共29页,编辑于2022年,星期六4.1 OLAP 4.1 OLAP 技术概念技术概念在线分析处理或联机分析处理(线分析的处理上的OLAP,)是一个应用广泛的数据仓库使用技术。两个特点,在线性(On_Line),多维分析(Multi_Analysis),4.1.1OLAP的发展针对特定问
2、题的联机数据查询和分析对原始数据按照用户的观点进行转换处理反映用户眼中问题某一真实方面(“维”)快速、稳定、一致和交互式的存取允许用户对这些数据按照需要进行深入的观察第3页,共29页,编辑于2022年,星期六4.1.2 OLAP 的特性的特性1.快速性快速性系统能在数秒内对用户的多数分析要求做出反应系统能在数秒内对用户的多数分析要求做出反应2.可分析性用户无需编程就可以定义新的专门计算,将其作为分析的一部分,并以用户所希望的方式给出报告3.多维性提供对数据分析的多维视图和分析4.信息性能及时获得信息,并且管理大容量信息能及时获得信息,并且管理大容量信息第4页,共29页,编辑于2022年,星期六
3、4.2 OLAP 与多维分析与多维分析4.2.1 多维基本概念多维基本概念维维、维维的的层层次次、维维成成员员、多多维维数数据据集集、数数据据单单元元、多维数据集的度量值和聚集多维数据集的度量值和聚集1.维维“上卷”“下钻”销售地区西南华中华东四川云南河南湖北江苏上海第5页,共29页,编辑于2022年,星期六4.2 OLAP 与多维分析与多维分析2.多维数据集多维数据集产品北京上海化妆品江苏玩具服装电器1234时间(月)销售数量:10000服装切片第6页,共29页,编辑于2022年,星期六3.维成员维成员维维的的一一个个取取值值、不同维层次取值的组合、维成员描述所关心的主题在维中的位置 数据单
4、元可以表示为:(维1维成员,维2维成员,维3维成员,维4维成员,观察变量值)4.多维数据集的度量值多维数据集的度量值多维数据集的核心值多维数据集的核心值 5.聚集聚集立立方方体体中中包包括括很很多多层层次次,这这些些层层次次可可以以向向用用户户提提供供某某一层次的概括数据一层次的概括数据 通通过过聚聚集集,形形成成基基于于维维的的有有决决策策分分析析意意义义的的一一些些数数据据交交集集第7页,共29页,编辑于2022年,星期六4.2.2 多维分析多维分析1.多维的切片多维的切片(维 1,维2,维i成员,维n,观察变量)是多维数据集(维1,维2,维i,维n,观察变量)在维i上的一个切片 2.多维
5、的切块多维的切块在(维1,维2,维i,维k,维n,观察变量)多维数据集上,对维i,维k,选定了维成员,那(维1,维2,维i成员,维k成员,维n,观察变量)就是多维数据集(维1,维2,维i,维k,维n,观察变量)在维i,维k上的一个切块 第8页,共29页,编辑于2022年,星期六4.2.2 多维分析多维分析3.旋转旋转2002年2003年1季度2季度3季度4季度1季度2季度3季度4季度北京市123564566134562355上海市13410398871021399782天津市6773599673696294第9页,共29页,编辑于2022年,星期六4.2.2 多维分析多维分析3.旋转旋转北京市
6、上海市天津市2002年1季度123134672季度56103733季度4598594季度6687962003年1季度134102732季度56139693季度2397624季度558294第10页,共29页,编辑于2022年,星期六4.2.2 多维分析多维分析4.其它其它OLAP操作操作u“上卷上卷”(roll_up)、)、“下钻下钻”(drill_down)、)、“钻过钻过”(drill_across)和)和“钻透钻透”(drill_through)等钻取操作。)等钻取操作。“上卷上卷”是指沿某一个维的概念分层向上归约是指沿某一个维的概念分层向上归约;“下钻下钻”是上卷是上卷的逆向操作,它是
7、沿某一个维的概念分层向下或引入新的维的逆向操作,它是沿某一个维的概念分层向下或引入新的维来实现;来实现;“钻过钻过”是指对多个事实表进行查询;是指对多个事实表进行查询;“钻透钻透”是指是指对立方体操作时,利用数据库关系,钻透立方体的底层,进入后端的对立方体操作时,利用数据库关系,钻透立方体的底层,进入后端的关系表。关系表。uOLAP的其它操作还有统计表中最高值和最低值的项数,计的其它操作还有统计表中最高值和最低值的项数,计算平均值、增长率、利润、投资回报率等统计计算。算平均值、增长率、利润、投资回报率等统计计算。第11页,共29页,编辑于2022年,星期六4.2.3 维的层次关系维的层次关系简
8、单层次简单层次复杂层次复杂层次全国江苏北京上海苏州市扬州市宝应县第12页,共29页,编辑于2022年,星期六4.2.4 维的类关系维的类关系类类的的划划分分,只只能能依依据据同同一一层层次次的的维维成成员员集集合合来划分来划分 维的层次与类组合图 产品维产品大类产品用途类产品销地类产品产地类产品小类第13页,共29页,编辑于2022年,星期六4.2.5 OLAP与数据仓库关系与数据仓库关系u从OLAP使用的效率角度考虑,设计数据仓库时考虑因素。u尽可能使用星型架构,如果采用雪花结构,就要最小化事实表底层维度表以后的维度表数量。u为用户设计包含事实表的维度表。u维度表的设计应该符合通常意义上的范
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 原理 设计 应用 幻灯片
限制150内