《联机分析处理.ppt》由会员分享,可在线阅读,更多相关《联机分析处理.ppt(60页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第3章 联机分析处理(1)第3章 联机分析处理3.1 OLAP概念3.2 OLAP的数据模型3.3 多维数据的显示3.4 OLAP多维数据分析(上)(3.4.1 3.4.2)联机分析处理(On Line Analytical Processing,OLAP)在数据仓库系统中,联机分析处理是重要的数据分析工具。OLAP的基本思想是从多方面和多角度,以多维的形式来观察企业的状态和了解企业的变化。3.1 OLAP概念 OLAP是以数据仓库为基础的数据分析处理。它有两个特点:一是在线性(On Line),由网络上的客户机/服务器这种体系结构来完成的;二是多维分析,这也是OLAP的核心所在。3.1.1
2、OLAP定义1.OLAP理事会给出的定义 联机分析处理(OLAP)是一种软件技术,它使分析人员能够迅速、一致、交互地从各个方面(多维)观察信息,以达到深入理解数据的目的。这些信息是从原始数据转换过来的,按照用户的理解,它反映了企业真实的方方面面。2.OLAP的简单定义 联机分析处理是共享多维信息的快速分析。它体现了四个特征:(1)快速性:用户对OLAP的快速反应能力有很高的要求。(2)可分析性:OLAP系统应能处理任何逻辑分析和统计分析。(3)多维性:系统必须提供对数据分析的多维视图和分析。(4)信息性:OLAP系统应能及时获得信息,并且管理大容量的信息。1993年,E.F.Codd提出OLA
3、P的12条准则,其主要的准则有以下四条:(1)多维数据分析;(2)客户/服务器结构;(3)多用户支持;(4)一致的报表性能等。在12条准则中,挑选如下几条说明:3.1.2 OLAP准则 1.多维概念视图n 企业的数据空间本身就是多维的。因此OLAP的概念模型也应是多维的。n 用户可以对多维数据模型进行切片、切块、旋转坐标或进行多维的综合(概括和聚集)分析。4.一致稳定的报表性能 报表操作不应随维数增加而削弱,即当数据维数和数据的综合层次增加时,提供的报表能力和响应速度不应该有明显的降低。5客户/服务器体系结构 OLAP是建立在网络上的客户/服务器体系结构。多维数据库服务器能够被不同的应用和工具
4、所访问。客户端负责用户的应用逻辑及界面。8多用户支持能力 当多个用户要在同一分析模式上并行工作,OLAP工具应能够提供并发访问等功能(客户/服务器结构能满足这个要求)。11灵活的报表生成 报表必须充分反映数据分析模型的多维特征,并可按用户需要的方式来显示它。(1)变量:变量是数据的实际意义,即描述数据“是什么”。(2)维:维是人们观察数据的特定角度。如产品维、顾客维、时间维(即座标系中的座标)等。(3)维的层次:数据的细节不同程度为维的层次 如日、月、季、年是时间维的层次。(4)维成员:维的一个取值称为该维的一个维成员。如“某年某月某日”是时间维的一个成员。3.1.3 OLAP的基本概念(5)
5、多维数组:一个多维数组可以表示为:(维1,维2,维n,变量)一个4维的结构,即(产品,地区,时间,销售渠道,销售额)。(6)数据单元(单元格):多维数组的取值称为数据单元。如:4维数据单元(牙膏,上海,1998年12月,批发,销售额为100000)。OLAP的基本概念(续)3.2 OLAP的数据模型 3.2.1 MOLAP数据模型3.2.2 ROLAP数据模型3.2.3 MOLAP与ROLAP的比较3.2.4 HOLAP数据模型3.2.1 MOLAP的数据模型 MOLAP是基于多维数据库存储方式建立的OLAP;表现为“超立方”结构,采用类似于多维数组的结构。例如,二维MDDB(数组,即矩阵)的
6、数据组织见表3.1所示。表3.1 MDDB(二维)数据组织北京 上海 广州衣服600 700 500鞋800 900 700帽子100 200 803.2.2 ROLAP数据模型n ROLAP是基于关系数据库的OLAP。n 它是一个平面结构,用关系数据库表示多维数据时,采用星型模型。产品名 地区 销售量衣服 北京600衣服 上海700衣服 广州500鞋 北京800鞋 上海900鞋 广州700帽子 北京100帽子 上海200帽子 广州80表3.3 关系数据库RDBMS数据组织3.2.3 MOLAP与ROLAP的比较1.数据存取速度(MOLAP的响应速度快)2.数据存储的容量(ROLAP存储容量上
7、没有限制)3.多维计算的能力(MOLAP能够支持高性能计算)4.维度变化的适应性(ROLAP对于维表的变更有很好的适应性)5.数据变化的适应性(ROLAP对于数据变化的适应性高)6.软硬件平台的适应性(ROLAP适应性很好)1.数据存取速度n ROLAP服务器需要将SQL语句转化为多维存储语句,临时“拼合”出多维数据立方体。因此,ROLAP的响应时间较长。n MOLAP在数据存储速度上性能好,响应速度快。2.数据存储的容量n ROLAP使用的传统关系数据库的存储方法,在存储容量上基本没有限制。n MOLAP通常采用多平面叠加成立体的方式存放数据。n 当数据量超过操作系统最大文件长度时,需要进行
8、数据分割。n 多维数据库的数据量级难以达到太大的字节级。3.多维计算的能力n MOLAP能够支持高性能的决策支持计算。n ROLAP无法完成多行的计算和维之间的计算。4.维度变化的适应性n MOLAP增加新的维度,则多维数据库通常需要重新建立。n ROLAP对于维表的变更有很好的适应性。5.数据变化的适应性n 当数据频繁的变化时,MOLAP需要进行大量的重新计算,甚至重新建立索引乃至重构多维数据库。n 在ROLAP中灵活性较好,对于数据变化的适应性高。6.软硬件平台的适应性ROLAP对软硬件平台的适应性很好,而MOLAP相对较差。7.元数据管理目前在元数据的管理,MOLAP和ROLAP都没有成
9、形的标准。MOLAP和ROLAP的对比简表MOLAP ROLAP固定维 可变维维交叉计算 多维视图行级计算 超大型数据库读-写应用 维数据变化速度快数据集市 数据仓库3.2.4 HOLAP数据模型 n HOLAP(Hybrid OLAP),即混和OLAP介于MOLAP和ROLAP之间。在HOLAP中,对最常用的维度和维层次,使用多维数据表来存储,对于用户不常用的维度和数据,采用ROLAP星型结构来存储。n 在HOLAP的多维数据表中的数据维度少于MOLAP中的维度表,数据存储容量也少于MOLAP方式。n HOLAP在数据存取速度上又低于MOLAP。3.3 多维数据的显示3.3.1 多维数据显示方法3.3.2 多维类型结构(MTS)3.3.3 多维数据的分析视图3.3.1 多维数据显示方法n 多维数据的显示只能在平面上展现出来。三维数据无法在平面上展现出来。n 三维数据显示见表3.6所示。
限制150内