2022年数据仓库与数据挖掘课后习题答案.docx





《2022年数据仓库与数据挖掘课后习题答案.docx》由会员分享,可在线阅读,更多相关《2022年数据仓库与数据挖掘课后习题答案.docx(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选学习资料 - - - - - - - - - 多练出技巧 巧思出硕果数据仓库与数据挖掘第一章 课后习题一:填空题1)数据库中储备的都是 数据 ,而数据仓库中的数据都是一些历史的、存档的、归纳的、计算的数据;2)数据仓库中的数据分为四个级别:早起细节级、 当前细节级、 轻度综合级、 高度综合级 ;3)数据源是数据仓库系统的基础,是整个系统的数据源泉,通常包括 业务数据和历史数据;4)元数据是 “ 关于数据的数据”;依据元数据用途的不同将数据仓库的元数据分为 技术元数据和业务元数据两类;5)数据处理通常分为两大类:联机事务处理和联机事务分析6)Fayyad过程模型主要有 数据预备,数据挖掘和结
2、果分析 三个主要部分组成;7)假如从整体上看数据挖掘技术,可以将其分为 统计分析类、学问发觉类和其他类型 的数据挖掘技术三大类;8)那些与数据的一般行为或模型不一样的数据对象称做孤立点 ;web9)依据挖掘对象的不同,将Web 数据挖掘分为三类:web 内容挖掘、 web 结构挖掘和使用挖掘;10)查询型工具、 分析型工具盒挖掘型工具结合在一起构成了数据仓库系统的工具层,它们各自的侧重点不同,因此适用范畴和针对的用户也不相同;二:简答题1)什么是数据仓库?数据仓库的特点主要有哪些?数据仓库是一个面对主题的、集成的、相对稳固的、反映历史变化的数据集合,用于支持治理决策;主要特点:面对主题组织的、
3、集成的、稳固的、随时间不断变化的、数据的集合性、支持决策作用2)简述数据挖掘的技术定义;从技术角度看,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据名师归纳总结 - - - - - - -第 1 页,共 7 页精选学习资料 - - - - - - - - - 多练出技巧 巧思出硕果中,提取隐含在其中的、人们不知道的、但又是潜在有用的信息和学问的过程;3)什么是业务元数据?业务元数据从业务角度描述了数据仓库中的数据,它供应了介于使用者和实际系统之间 的语义层,使得不懂运算机技术的业务人员也能够读懂数据仓库中的数据 4)简述数据挖掘与传统分析方法的区分;本质区分是:数据挖掘是在没有
4、明确假设的前提下去挖掘信息、发觉学问;数据挖掘所 得到的信息应具有从前未知、有效和有用三个特点;4 种体系结构的异同点及其适用性;5)简述数据仓库 a.虚拟的数据仓库体系结构 b.单独的数据仓库体系结构 c.单独的数据集市体系结构 d.分布式数据仓库结构其次章 课后习题 一:填空题 1)模型是对 现实世界 进行抽象的工具;在信息治理中需要将现实世界的事物及其有关特点转换为 信息世界的数据才能对信息进行处理与治理,这就需要依靠数据模型作为这种转换的桥梁;2)数据仓库模型设计包括概念、规律、物理、元数据模型设计等内容;3)现实世界 是存在于现实之中的各种客观事物;概念世界 是现实情形在人们头脑中的
5、反应;规律世界 是人们为将存在于自己头脑中的概念模型转换到运算机中的实际的物理储备过程中的一个运算机规律表示模式;储备模式;运算机世界 就是指现实世界中的事物在运算机系统中的实际名师归纳总结 - - - - - - -第 2 页,共 7 页精选学习资料 - - - - - - - - - 多练出技巧 巧思出硕果4)数据仓库设计的概念模型与业务数据处理系统的三级数据模型仍旧具有肯定的差距;表 现在 数据类型的差异、数据的历史变迁性、数据概况性5)数据仓库项目需求的收集与分析需求要从历史数据与用户需求两个方面同时着手,采纳 数据驱动 +用户驱动 的理念;6)所谓主题,是指 在较高程度上将业务数据进
6、行综合,归类和分析利用的一个抽象概念,每个主题基本对立业务的一个分析领域;7)多维数据模型较为普遍地采纳 星型模型、雪花模型 两种模式;8)设计集合模型时,第一需要考虑 用户的使用要求,其次要考虑 数据仓库的粒度模型和数 据的统计分析情形;9)分割是数据仓库规律设计中要解决的另一个重要问题,它的目的在于 提高效率 能为数据 仓库的物理实施供应设计依据;10)元数据依据使用情形,主要有技术元数据和业务元数据两类元数据;二:简答题1)简述概念模型设计主要完成哪些工作?界定系统边界、确定主要的主题域、细化分析详细内容 2)简述一个符合第三范式的关系必需具有的三个条件;A.每个属性的值唯独,不具有多义
7、性 B.每个非主属性必需完全依靠于整个主键 C.每个非主属性不能依靠于其他关系中的属性;3)简述确定粒度级别的步骤 A.估算 DASD B.运算储备空间、确定是否划分粒度;C.方案影响数据仓库的粒度划分 D.使用多重粒度 E.使用多种储备介质的空间量 F.挑选合适的粒度名师归纳总结 - - - - - - -第 3 页,共 7 页精选学习资料 - - - - - - - - - 多练出技巧 巧思出硕果G.只采纳概况数据 4)简述 CWM 五个功能层 对象模型层、基础层、资源层、分析层、治理层 5)数据仓库物理模型进行优化时可以考虑的解决方案有哪些?A.合并表与簇文件 B.建立数据序列 C.引入
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 数据仓库 数据 挖掘 课后 习题 答案

限制150内