23. 数据挖掘概述.ppt
《23. 数据挖掘概述.ppt》由会员分享,可在线阅读,更多相关《23. 数据挖掘概述.ppt(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、23.数据挖掘概述数据挖掘概述主讲人:MichaelLee主要内容:主要内容:n1.数据挖掘的定义n2.数据挖掘的功能n3.数据挖掘的商业应用1.数据挖掘数据挖掘 定义:数据挖掘定义:数据挖掘(Data Mining)(Data Mining),又称为数据库中的知识发现(Knowledge Discovery in Database,KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识。注:数据挖掘与信息检索的区别并非所有的信息发现任务都被视为数据
2、挖掘。例如,使用数据库管理系统查找个别的记使用数据库管理系统查找个别的记录,或通过因特网的搜索引擎查找特定的录,或通过因特网的搜索引擎查找特定的WebWeb页面,则是信息检索(页面,则是信息检索(information information retrievalretrieval)领域的任务。)领域的任务。虽然这些任务是重要的,可能涉及使用复杂的算法和数据结构,但是它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。尽管如此,数据挖掘技术也已用来增强信息检索系统的能力。2.数据挖掘的主要功能数据挖掘的主要功能1)1)数据挖掘能做以下四种功能(分析方法):数
3、据挖掘能做以下四种功能(分析方法):1.1.分类分类 (ClassificationClassification)首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类。举例:a.信用卡申请者,分类为低、中、高风险 b.分配客户到预先定义的客户分片 注意:类的个数是确定的,预先定义好的 2.估值(估值(Estimation)估值与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的输出;分类的类别是确定数目的,估值的量是不确定的。例子:例子:na.根据购买模式,估计一个家庭的孩子个数nb.根据购买模式,估计一个家庭的
4、收入nc.估计realestate的价值n一般来说,估值可以作为分类的前一步工作。给定一些输入数据,通过估值,得到未知的连续变量的值,然后,根据预先设定的阈值,进行分类。例如:银行对家庭贷款业务,运用估值,给各个客户记分(Score01)。然后,根据阈值,将贷款级别分类。3.3.预言(预言(PredictionPrediction)通常,预言是通过分类或估值起作用的,也就是说,通过分类或估值得出模型,该模型用于对未知变量的预言。从这种意义上说,预言其实没有必要分为一个单独的类。预言其目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时间后,才知道预言准确性是多少。例子:例子
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 23. 数据挖掘概述 数据 挖掘 概述
限制150内