数据仓库与数据挖掘习题答案资料.docx





《数据仓库与数据挖掘习题答案资料.docx》由会员分享,可在线阅读,更多相关《数据仓库与数据挖掘习题答案资料.docx(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据仓库及数据挖掘习题答案 第1章 数据仓库的概念及体系构造 1. 面对主题的,相对稳定的。 2. 技术元数据,业务元数据。 3. 联机分析处理OLAP。 4. 切片Slice,钻取Drill-down和Roll-up等。 5. 基于关系数据库。 6. 数据抽取,数据存储及管理。 7. 两层架构,独立型数据集市,依靠型数据集市和操作型数据存储,逻辑型数据集市和实时数据仓库。 8. 可更新的,当前值的。 9. 接近实时。 10. 以报表为主,以分析为主,以预料模型为主,以营运导向为主。 11. 答: 数据仓库就是一个面对主题的Subject Oriented, 集成的Integrate, 相对稳
2、定的Non-Volatile, 反映历史改变Time Variant的数据集合,通常用于协助决策支持。 数据仓库的特点包含以下几个方面: 1 面对主题。操作型数据库的数据组织是面对事务处理任务,各个业务系统之间各自别离;而数据仓库中的数据是依据肯定的主题域进展组织。主题是一个抽象的概念,是指用户运用数据仓库进展决策时所关切的重点领域,一个主题通常及多个操作型业务系统或外部档案数据相关。 2集成的。面对事务处理的操作型数据库通常及某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据作抽取, 清理的根底上经过系统加工, 汇总和整理得到的,必需消退源
3、数据中的不一样性,以保证数据仓库内的信息是关于整个企事业单位一样的全局信息。也就是说存放在数据仓库中的数据应运用一样的命名规那么, 格式, 编码构造和相关特性来定义。 3相对稳定的。操作型数据库中的数据通常实时更新,数据依据须要刚好发生改变。数据仓库的数据主要供单位决策分析之用,对所涉及的数据操作主要是数据查询和加载,一旦某个数据加载到数据仓库以后,一般状况下将作为数据档案长期保存,几乎不再做修改和删除操作,也就是说针对数据仓库,通常有大量的查询操作及少量定期的加载或刷新操作。 4反映历史改变。操作型数据库OLTP主要关切当前某一个时间段内的数据,而数据仓库中的数据通常包含较长远的历史数据,因
4、此总是包括一个时间维,以便可以探讨趋势和改变。数据仓库系统通常记录了一个单位从过去某一时点(如开场启用数据仓库系统的时点)到目前的全部时期的信息,通过这些信息,可以对单位的开展历程和将来趋势做出定量分析和预料。 12. 答: 1两层架构Generic Two-Level Architecture。 2独立型数据集市Independent Data Mart。 3依靠型数据集市和操作型数据存储Dependent Data Mart and Operational Data Store。 4逻辑型数据集市和实时数据仓库Logical Data Mart and Real-Time Data War
5、ehouse。 13. 答: 数据仓库技术的开展包括数据抽取, 存储管理, 数据表现和方法论等方面。在数据抽取方面,将来的技术开展将集中在系统集成化方面。它将互连, 转换, 复制, 调度, 监控纳入标准化的统一管理,以适应数据仓库本身或数据源可能的改变,使系统更便于管理和维护。在数据管理方面,将来的开展将使数据库厂商明确推出数据仓库引擎,作为数据仓库效劳器产品及数据库效劳器并驾齐驱。在这一方面,带有决策支持扩展的并行关系数据库将最具开展潜力。在数据表现方面,数理统计的算法和功能将普遍集成到联机分析产品中,并及Internet/Web技术严密结合。按行业应用特征细化的数据仓库用户前端软件将成为产
6、品作为数据仓库解决方案的一局部。数据仓库实现过程的方法论将更加普及,将成为数据库设计的一个明确分支,成为管理信息系统设计的必备。 14. 答: 1IBM公司供应了一套基于可视化数据仓库的商业智能BI解决方案,包括:Visual WarehouseVW, Essbase/DB2 OLAP Server 5.0, IBM DB2 UDB,以及来自第三方的前端数据呈现工具如BO和数据挖掘工具如SAS。其中,VW是一个功能很强的集成环境,既可用于数据仓库建模和元数据管理,又可用于数据抽取, 转换, 装载和调度。Essbase/DB2 OLAP Server支持“维的定义和数据装载。Essbase/DB
7、2 OLAP Server不是ROLAPRelational OLAP效劳器,而是一个ROLAP和MOLAP混合的HOLAP效劳器,在Essbase完成数据装载后,数据存放在系统指定的DB2 UDB数据库中。它的前端数据呈现工具可以选择Business Objects的BO, Lotus的Approach, Cognos的Impromptu或IBM的Query Management Facility;多维分析工具支持Arbor Software的Essbase和IBM及Arbor联合开发的DB2 OLAP效劳器;统计分析工具采纳SAS系统。 2Oracle数据仓库解决方案主要包括Oracle
8、Express和Oracle Discoverer两个局部。Oracle Express由四个工具组成:Oracle Express Server是一个MOLAP(多维OLAP)效劳器,它利用多维模型,存储和管理多维数据库或多维高速缓存,同时也能够访问多种关系数据库;Oracle Express Web Agent通过CGI或Web插件支持基于Web的动态多维数据呈现;Oracle Express Objects前端数据分析工具目前仅支持Windows平台供应了图形化建模和假设分析功能,支持可视化开发和事务驱动编程技术,供应了兼容Visual Basic语法的语言,支持OCX和OLE;Orac
9、le Express Analyzer是通用的, 面对最终用户的报告和分析工具目前仅支持Windows平台。Oracle Discoverer即席查询工具是特地为最终用户设计的,分为最终用户版和管理员版。 在Oracle数据仓库解决方案的实施过程中,通常把汇总数据存储在Express多维数据库中,而将具体数据存储在Oracle关系数据库中,当须要具体数据时,Express Server通过构造SQL语句访问关系数据库。 3Microsoft将OLAP功能集成到SQL Server数据库中,其解决方案包括BI平台, BI终端工具, BI门户和BI应用四个局部,如图1.1。 BI平台是BI解决方案
10、的根底,包括ETL平台SQL Server 2005 Integration Service(SSIS), 数据仓库引擎SQL Server 2005 RDBMS以及多维分析和数据挖掘引擎SQL Server 2005 Analysis Service, 报表管理引擎SQL Server 2005 Reporting Service。 BI终端用户工具,用户通过终端用户工具和Analysis Service中的OLAP效劳和数据挖掘效劳进展交互来运用多维数据集和数据挖掘模型,终端用户通常可运用预定义报表, 交互式多维分析, 即席查询, 数据可视化, 数据挖掘等多种方法。 BI门户供应了各种不同
11、用户访问BI信息的统一入口。BI门户是一个数据的聚集地,集成了来自不同系统的相关信息。用户可以制定特性化的个人门户,选择和自己相关性最强的数据,提高信息访问和运用的效率。 BI应用是建立在BI平台, BI终端用户工具和BI统一门户这些公共技术手段之上的满意某个特定业务需求的应用,例如零售业务分析, 企业工程管理组合分析等。 第2章 数据仓库的数据存储及处理 1. 企业级数据仓库EDW。 2. 单一的,具体的。 3. 最初填充数据仓库。 4. 越高,越低,越多。 5. 提高,预处理,事实表。 6. 自然键Natural Key,代理键Surrogate Key。 7. 星型模式。 8. 早期细微
12、环节级,轻度综合级。 9. 答: 简洁地说,数据是从企业内外部的各业务处理系统操作型数据流向企业级数据仓库EDW或操作型数据存储区(ODS),在这个过程中,要依据企业或其他组织的数据模型和元数据库对数据进展调和处理,形成一个中间数据层,然后再依据分析需求,从调和数据层EDW, ODS将数据引入导出数据层,如形成满意各类分析需求的数据集市。 10. 答: 数据的ETL过程就是负责将操作型数据转换成调和数据的过程。如上面的小节所述,这两种数据具有明显的区分,因此,数据调和是构建一个数据仓库中最难的和最具技术挑战性的局部。在为企业级数据仓库填充数据的过程中,数据调和可分为两个阶段:一是企业级数据仓库
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 数据 挖掘 习题 答案 资料

限制150内