2022年完整word版,数据挖掘_概念与技术部分习题答案汇总.docx
《2022年完整word版,数据挖掘_概念与技术部分习题答案汇总.docx》由会员分享,可在线阅读,更多相关《2022年完整word版,数据挖掘_概念与技术部分习题答案汇总.docx(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选学习资料 - - - - - - - - - 1.4 数据仓库和数据库有何不同?有哪些相像之处?答:区分:数据仓库是面对主题的,集成的,不易更换且随时间变化的数据集合,用来支持治理人员的决策,数据库由一组内部相关的数据和一组治理和存取数据的软件程序组成,是面对操作型的数据库,是组成数据仓库的源数据;它用表组织数据,采纳 ER 数据模型;相像:它们都为数据挖掘供应了源数据,都是数据的组合;1.3 定义以下数据挖掘功能:特点化、区分、关联和相关分析、猜测聚类和演化分析;使用你熟悉的现实生活的数据库,给出每种数据挖掘功能的例子;答:特点化 是一个目标类数据的一般特性或特性的汇总;例如,同学的特点
2、可被提出,形成全部高校的运算机科学专业一年级同学的轮廓,这些特点包括作为一种高的年级平均成果GPA:Grade point aversge的信息,仍有所修的课程的最大数量;区分 是将目标类数据对象的一般特性与一个或多个对比类对象的一般特性进行比较;例如,具有高 GPA 的同学的一般特性可被用来与具有低GPA 的一般特性比较;最终的描述可能是同学的一个一般可比较的轮廓,就像具有高 GPA 的同学的 75%是四年级运算机科学专业的同学,而具有低GPA 的同学的 65%不是;关联 是指发觉关联规章,这些规章表示一起频繁发生在给定数据集的特点值的条件;例如,一个数据挖掘系统可能发觉的关联规章为:maj
3、orX, “ computing science” . ownsX, “ personal computer” support=12%, confidence=98% 生, 12% 其中, X 是一个表示同学的变量;这个规章指出正在学习的学(支持度)主修运算机科学并且拥有一台个人运算机;这个组一个同学拥有一台个人电脑的概率是98%(置信度,或确定度);分类与猜测 不同,由于前者的作用是构造一系列能描述和区分数据类型或概念的模型(或功能),而后者是建立一个模型去猜测缺失的或无效的、并且通常是数字的数据值;它们的相像性 是他们都是猜测的工具:分类被用作猜测目标数据的类的标签,而猜测典型的应用是猜测
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 完整 word 数据 挖掘 概念 技术 部分 习题 答案 汇总
限制150内