SSAS使用基础手册专业资料.doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《SSAS使用基础手册专业资料.doc》由会员分享,可在线阅读,更多相关《SSAS使用基础手册专业资料.doc(71页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、SQL SERVER SSAS使用手册1 BI、OLAP、Analysis Services1.1 BI概念简介BI系统负责从各种数据源中收集数据,并将这些数据进行必要转换后存储到一种统一存储介质中,并提供应使用者将这些数据转换为使用者所需信息功能。一种BI系统普通涉及5层:1. 数据源层(data source layer):由每日操作数据、文本数据、Excel表格、Access数据库、其她外部数据构成;2. 数据转换层(data transformation layer):转换数据源层为统一持续数据,并放入数据存储层;3. 数据存储和提取层(data storage and retriev
2、al layer):数据仓库;4. 分析层(analytical layer):多维度OLAP数据库,为决策者提供分析根据;5. 展示层(presentation layer):报表和可视化工具。与当前RDC系统相应,BSERP数据库便相称于一种数据源层,它提供实时事务数据。一种由SSIS(SQL Server Integration Services)提供ETL功能可以将业务数据库中操作性数据通过一定规则转换为统一持续数据,它提供便是一种数据转换层功能。通过SSIS转换后数据,存储到DW_RDC数据仓库中。DW_RDC是一种关系型数据仓库,包括两种类型表:维度表和事实表。它提供一种数据存储和
3、提取功能,但是这里数据依然不是多维数据,因此咱们需要将这些数据通过SSAS(SQL Server Analysis Services)转换成多维数据并提供分析功能,这些多维数据,存储在BI_RDC中。最后,咱们将BI_RDC数据通过Analyzer展示工具进行多维可视化呈现。1.2 OLAP、Analysis Services由SSAS生成BI_RDC是一种OLAP(On-Line Analysis Process)多维数据库。OLAP是与OLTP(On-Line Transaction Process)相相应概念,OLTP是老式关系型数据库重要应用,重要是基本、寻常事物解决;OLAP是数据仓
4、库系统重要应用,支持复杂分析操作,侧重决策支持,并且提供直观易懂查询成果。某些在BI系统中重要概念,也是从OLAP中概念延伸过来,例如:属性、层次构造、维度,度量值等。Integration Services、Analysis Services以及Reporting Services是SQL Server提供BI工具,分别提供BI系统数据转换层、分析层和展示层功能。可以看到使用微软SQL SERVER 产品可以完全实现BI系统中可以提供所有功能。其中,Microsoft SQL Server Analysis Services 为商业智能应用程序提供了联机分析解决 (OLAP) 功能和数据挖掘
5、功能。Analysis Services 支持 OLAP,可以设计、创立和管理包括从其她数据源(如,关系型数据库)聚合来数据多维构造。对于数据挖掘应用程序,Analysis Services 使您可以通过使用各种各样业界原则数据挖掘算法,设计、创立和查看从其她数据源构造数据挖掘模型。1.3 使用SSAS需要理解概念1.3.1 Cube、Dimension和MeasureCube就像一种坐标系,每一种Dimension代表一种坐标轴,要想得到一种点,就必要在每一种坐标轴上取一种值,而这个点就是Cube中Cell。见下图(来源于):上图较好阐明了Cube、Dimension、Measure之间关系
6、。这里需要注意是:其实Measure也属于一种维度,即Measures Dimension。所有Measure构成了Measures Dimension,这个维度只有一种Hierarchy,并且这个Hierarchy只有一种层次(Level)。1.3.2 Hierarchy、Level和Member在上节图中,每个Dimension只有一种Hierarchy,而在实际环境中,一种Dimension往往有诸多Hierarchy。因而,上一小节中关于“Cube就象一种坐标系,每一种Dimension代表一种坐标轴”这句话其实不够精确,精确说应当是每一种Hierarchy代表了一种坐标轴,而Hier
7、archy中每一种Member代表了坐标轴上一种值。下图以时间维度为例展示了Dimension内部构造。2 UDM统一维度模型 但愿直接从诸如公司资源规划 (ERP) 数据库这样数据源中检索信息顾客会晤临几种重要挑战: 此类数据源内容普通非常难于理解,由于它们设计初衷是针对系统和开发人员,而不是顾客。 顾客所关怀信息普通分布在各种异类数据源中。虽然只是使用其她关系数据库,顾客也必要理解每个数据库详细信息(例如,所用 SQL 方言)。更糟糕是,这些数据源类型也许各不相似,不但涉及关系数据库,并且还涉及文献和 Web 服务。 尽管许多数据源都倾向于包括大量事务级别详细信息,但是,支持业务决策制定所
8、需查询经常涉及汇总信息和聚合信息。随着数据量增长,最后顾客为进行交互式分析而检索此类汇总值所需时间也会过长。 业务规则普通并不封装在数据源中。顾客需要自行理解数据。统一维度模型 (UDM) 作用是在顾客和数据源之间搭建一座桥梁。UDM 构造于一种或各种物理数据源之上。顾客使用各种客户端工具(例如,Microsoft Excel)向 UDM 发出查询。虽然 UDM 只是作为数据源上瘦层来构造,对于最后顾客而言也有益处:更简朴、更容易理解数据模型,与异构后端数据源相隔离,并且汇总类型查询性能也有所提高。在某些方案中,可以自动构造简朴 UDM。如果在构造 UDM 过程中再增长某些投资,则可以从该模型
9、提供丰富元数据中获得其她收益。UDM 具备下列长处: 极大地丰富了顾客模型。 提供了支持交互式分析高性能查询,虽然是数据量非常大也不例外。 捕获模型中业务规则,以支持更丰富分析。 支持“关闭循环”:容许顾客按照所看到数据进行操作。 2.1 基本最后顾客模型 当前考虑一种示例,在该示例中,顾客但愿比较不同步间段销售额和配额。 销售额数据存储在主数据库“销售额和库存”,其中包括许多其她表。甚至在标记出了有关表之后,该顾客也也许发现单个实体(例如,产品)数据分散在诸多表中。由于引用完整性由应用程序逻辑强制实行,因而没有定义这些表之间关系。销售配额存储在另一种应用程序数据库中。这两个数据库都不会捕获任
10、何业务规则,例如如下事实:为比较配额和实际销售额,必要使用订单发货日期,而不能使用与订单关于其她日期(订单日期、订单到期日期、筹划日期等)。2.1.1 直接访问数据源一方面考虑顾客直接访问数据源状况。下图显示了一种使用示例工具构造查询示例。到当前为止,顾客已经完毕了大量工作。其中涉及: 从大量名称隐晦表中筛查出所需表。 拟定了应将哪些列用于联接表。 从诸多包括大量针对系统详细信息表中,选取那些包括所需详细信息列。例如,在存储了关于产品类别详细信息表中 11 个列中,只有两个名称列与顾客实际有关。 当前顾客专注于定义应当在哪里使用“外部”联接与“内部”联接,以及如何对详细信息进行分组以提供所需聚
11、合。 然而,顾客还要面对更艰巨任务。例如,顾客如何联接来自其她数据源数据?虽然其中一种数据库支持分布式查询,大多数顾客依然无法构造所需查询,并且在此任务中工具也许无法向顾客提供足够支持。代码示例显示了一种查询外部数据办法。SELECT Quotas.QuotaAmount,Quotas.EmployeeId,?FROM OPENROWSET(SQLOLEDB,seattle1;Sales;MyPass,SELECT * FROM Forecasts.dbo.SalesQuota?) As Quotas如果使用其她数据源(如 Web 服务),则在拟定如何执行对的远程调用,然后又如何解决返回XML
12、以将其与其她数据合并时,顾客将遇到另一种巨大障碍。 最后尚有一点:对一种查询执行此项工作之后,进行下一种查询时,此工作很大一某些又将重复一遍。 2.1.2 使用 UDM 访问数据源与前面情形相反,如下关系图例示了如何为访问某个基于这些数据源而构造简朴 UDM 顾客生成查询。 Microsoft SQL Server 附带开发工具提供了此示例中显示设计界面。但可以使用支持 UDM 任何接口,涉及客户端工具,例如,Office Excel 或 Office Web 组件 (OWC),或诸多报表和分析工具中一种。左边树视图显示了 UDM 内容。注意该示例中如下几点:只为顾客显示面向顾客有关项目。系统
13、列(例如,行 GUID 或最后修改日期)是不可见。所用名称为和谐名称,而没有使用基本数据库中采用面向开发人员命名商定。UDM 还将每个业务实体所有属性分组为单独“维度”,如产品或雇员。因而,客户端便可引用该示例中“产品颜色”、“子类别”以及“类别”,而无需在所涉及大量表之间显式执行联接。 这些表达事务值或度量值列随后将显示为“度量值”。例如,顾客普通都喜欢对销售量或销售配额之类列进行聚合。这种将数据显示为“度量值”和“维度”办法称为“维度建模”。 右边关系图显示了当前查询中包括元素。在这种状况下,为了祈求“按产品类别分类销售额和配额”,顾客只需通过从树视图中将三个有关项目拖动到右侧设计界面中,
14、即可定义查询。顾客不必指定实际访问两个不同数据源时所需详细信息,或在诸多有关表之间执行对的联接。 模型定义了简朴默认格式:例如,使用货币符号。还可以定义更复杂格式,涉及条件格式,例如,如果某个值低于特定阈值,则以红色显示该值。 同一模型可支持各种查询。例如,只需通过拖动雇员维度中一种属性便可按雇员对成果进行细分。2.2 扩展基本模型 虽然上面示例阐释了虽然简朴 UDM 也可以明显地简化基本数据浏览。但是,当顾客访问数据时,还会遇到更多挑战。例如: 支持来自不同顾客众多不同类型查询 UDM 规模也许会变得非常庞大。如何才干保证解决特定任务顾客不会受到与之无关信息干扰?如何满足全球顾客但愿看到以其
15、自己母语显示报表规定?如何才干简化所有与时间有关常用问题?例如,顾客也许但愿显示与上一年同期进行比较销售额。 本某些探讨了上述某些问题,阐明 UDM 如何支持对基本模型进行扩展以协助顾客实现更高档数据浏览操作。 2.2.1 层次构造虽然将一种实体所有属性合并为一种维度可以明显简化顾客模型,但是,尚有某些属性关系是用简朴列表所无法表达。在前面示例中,“类别”、“子类别”以及 SKU 定义了其中一种可用于组织产品层次构造。由于顾客经常但愿基于此类层次构造执行分析,因而 UDM 容许定义此类层次构造。例如,按“类别”查看总计之后,顾客也许要进一步到“子类别”,然后进一步到最低 SKU 级别。每个层次
16、构造都是序列属性,可以在查询中使用这些属性来简化这种向下深化和向上深化情形。如下关系图示例显示了层次构造也许以何种形式出当前最后顾客界面中。该模型包括若干种不同层次构造,产品便是按照这些层次构造来组织。这里显示查询回答了这个问题:“显示以产品类别分组销售额和配额,然后细分到子类别。”该查询是通过将“按类别分类产品”层次构造拖到网格中来定义。为了查看详细数据,该顾客双击“自行车”类别以展开子级别。 UDM 解决如何在层次构造级别之间进行移动详细信息。UDM 还解决诸如配额在“子类别”级别不可用而只在“类别”级别可用这样详细信息。其中一种特殊层次构造是父子层次构造,这种构造中包括互相之间具备复杂关
17、系实体。在下一种图中,“雇员”维度具备名为“按组织构造分类雇员”层次构造。使用此层次构造,您可以更容易地在组织每个级别浏览父子关系并分析汇总值。例如,主管销售 Charles Marshall 销售配额涉及其所有员工销售配额总和再加上与其直接有关所有销售配额。2.2.2 分类顾客普通会为其数据应用分类。例如,顾客也许说“这些属性包括了雇员个人详细信息方方面面”或“此属性是电子邮件地址”。UDM 提供有两种机制,专用于依照此分类来提供其她值:维度、属性和其她对象可以放在语义上故意义类别中,以便于客户端工具更加合理地使用它们。例如,属性可以标记为 URL。然后,包括此属性报表便可依照 URL 值进
18、行导航。另一种属性也许标记为电子邮件地址。在这种状况下,报表客户端就也许依照某些顾客操作自动打开新电子邮件。 度量值、层次构造和其她对象都可以分组到对顾客故意义文献夹中。使用此分组,报表工具可以以更易于管理方式显示大量属性。例如,也许有一组标签为“Customer Demographics”属性。2.2.3 时间时间信息普通使用“日期时间”或“日期”数据类型记录在基本数据源中。尽管精通 SQL 或 XPath 顾客可以提取按年度总计数据所需要日期信息,但虽然是这样顾客也也许会发现很难基于时间其她方面来为问题编写查询,例如“按星期几显示销售额”或“从七月一日开始,按会计年度显示明细。”但是,UD
19、M 有内置时间知识,涉及如下日历: 自然 会计 报告(“445”等) 生产(13个期间) ISO8601因而,该模型也许涉及一种时间维度,该时间维度提供了一组丰富属性用于定义每日详细信息。下图显示了当顾客选取查看 会计年度销售量和配额时成果。若要执行此操作,顾客只需将有关项从树拖到筛选区域。UDM 懂得如何将该顾客操作翻译为日期范畴,此外,它还理解业务规则,即查询中必要涉及在这些日期发货订单,而不是在这些日期到期订单或在这些日期定购订单。由 UDM 隐式执行对的联接。 此外,UDM 为回答与时间有关常用问题提供了特定支持,这些问题涉及诸如“本月与上一年度同一月份比较”这样同期比较。 2.2.4
20、 翻译在上面示例中,模型内容和数据都以一种语言显示。但是,国际顾客普通需要查看以她们本地语言显示元数据。 为理解决此问题,UDM 容许将元数据翻译为其她任何语言。使用特定区域设立连接客户端应用程序便可接受以相应语言显示所有元数据。 该模型还可以进行数据翻译。属性可以映射到数据源中其她元素,并且可觉得这些元素提供不同语言翻译。例如,如果顾客在连接时使用了咱们在上一示例中始终使用相似工具,但这是从采用法语区域设立客户端计算机上执行,则 UDM 和查询成果都会以法语显示,如图所示。2.2.5 透视虽然此处所用示例模型大小非常适度,但是,真实模型也许涉及更广范畴,包括数十种度量值和维度,并且每个维度都
21、包括数十种或数百种属性。执行特定任务顾客普通不必查看完整模型。为了避免模型完整大小对顾客产生干扰,咱们需要定义一种视图来显示该模型一种子集。 UDM 提供了这种称为透视视图。一种 UDM 可以具备各种透视,每个透视都只表达一种与特殊顾客组有关特定模型子集(度量值、维度、属性等)。然后,每个透视都可与顾客安全角色(定义应当看到该透视顾客)进行关联。例如,名为“西雅图库存”透视可以定义为只包括来自库存度量值组度量值,隐藏“按位置分类仓库”层次构造,并将默认“都市”设立为“西雅图”。2.2.6 属性语义UDM 提供了属性其她语义。这些语义目的是为了使信息更容易使用。下面是可以应用于属性语义某些示例:
22、名称与键:查看关系数据库时,也许无法理解 EmployeeID 是一种系统生成无意义唯一键。UDM 解决此问题办法是让“雇员”属性同步具备键(唯一 EmployeeID)和名称(例如,名称由 FirstName 和 LastName 串联而成)。诸如“显示雇员”这样查询便可通过使用其唯一ID来对的地区别同名雇员,但是显示对顾客故意义名称。排序:属性值普通必要以某个固定顺序显示,而该顺序并不是简朴字母或数值顺序。UDM 容许定义默认排序设立以管理此规定。例如:按星期日、星期一、星期二等星期日期浮现。顺序中优先级显示为高、中、低。离散化:对于数值属性,显示属性每个非重复值普通毫无意义。例如,查看某
23、个产品所有不同价格 ($9.97,$10.05,$10.10,) 销售额与查看每一价格范畴 ( $10,$10 - $15,) 销售额相比,后者更有用。UDM 容许使用各种条件将属性离散到上述范畴中。 2.2.7 核心性能指标 (KPI)公司普通会定义核心性能指标 (KPI),这些指标是用于衡量业务发展状况重要原则。UDM 容许创立这样 KPI,以便公司可以按更易于理解方式分组和呈现数据。KPI 还可以使用图形来显示状态和走向,例如,表达好、普通或糟糕批示灯。UDM 中每个 KPI 可觉得每个性能指标最多定义四个表达式:实际值目的值状态 一种介于 -1 和 1 之间规范化值,表达实际状态与目的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SSAS 使用 基础 手册 专业 资料
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内