数据仓库与数据挖掘必考点(共4页).doc
《数据仓库与数据挖掘必考点(共4页).doc》由会员分享,可在线阅读,更多相关《数据仓库与数据挖掘必考点(共4页).doc(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上第一章1、 数据仓库:是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合。组成:数据仓库数据库,数据抽取工具,元数据,访问工具,数据集市,数据仓库管理,信息发布系统;2、元数据:技术元数据业务元数据。3、 数据处理:联机事务处理(OLTP) 联机分析处理。(OLAP)4、 多维分析采取:切片、切块、钻取和旋转等各种分析动作。5、 ROLAP:关系数据库MOLAP:多维数据结构组织 的OLAP实现。HOLAP:混合数据组织 6、数据仓库开发过程:数据抽取、数据存储与管理、数据表现;7、数据仓库系统的体系结构根据应用需求的不同:两层架构,独立型数据集市,依赖型数
2、据集市和操作型数据存储,逻辑型数据集市和实时数据仓库8、操作型数据存储:是一个集成的、面向主题的、可更新的、当前值的、企业级的、详细的数据库,也叫运营数据存储。9、“实时数据仓库”:接近实时的速度交换数据和业务规则。10、一个典型的数据仓库系统的组成?P12数据源、数据存储与管理、OLAP服务器、前端工具与应用第二章1、调和数据:是存储在企业级数据仓库和操作型数据存储中的数据。2、抽取、转换、加载(ETL)目的:是为决策支持应用提供一个单一的、权威数据源。因此,我们要求ETL过程产生的数据(即调和数据层)是详细的、历史的、规范的、可理解的、即时的和质量可控制的。3、 数据抽取:从源文件和源数据
3、库中获取相关数据用于填充数据仓库;两个常见类型静态抽取用于:最初填充数据仓库;增量抽取用于:数据仓库的维护;4、 数据清洗:使用模式识别和其他技术将原始数据转换和移到数据仓库之前升级数据质量的技术;5、数据转换:把数据从源操作业务系统的格式转换到企业数据仓库的数据格式;6、粒度越小,细节程度越高,综合程度越低,回答查询的种类越多。7、多维数据建模:以维度为中心、多个角度分析有关数据的建模。存在形式:星型、雪花型、事实星座模式8、星型模式可以从一定程度上提高查询效率。因为星型模式中数据的组织已经经过预处理,主要数据都在庞大的事实表中。9、维度表一般由主键、分类层次和描述属性组成。对于主键可以选择
4、两种方式:一种是采用自然键,另一种是采用代理键。10、雪花型模式是对星型模式维表的进一步层次化和规范化来消除冗余的数据。11、数据仓库中存在不同综合级别的数据。一般把数据分成4个级别:早期细节级、当前细节级、轻度综合级和高度综合级。12、简述数据仓库ETL软件的主要功能和对产生数据的目标要求。P30ETL软件的主要功能:数据的抽取,数据的转换,数据的加载对产生数据的目标要求:详细的、历史的、规范化的、可理解的、即时的、质量可控制的13、多维数据模型中的基本概念:维,维类别,维属性,度量,粒度,分割P37l 维:人们观察数据的特定角度,是考虑问题的一类属性,如时间维或产品维l 维类别:也称维分层
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 数据 挖掘 必考
限制150内