终于有人把数据挖掘讲明白了.docx
《终于有人把数据挖掘讲明白了.docx》由会员分享,可在线阅读,更多相关《终于有人把数据挖掘讲明白了.docx(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、终于有人把数据搀掘讲明白了导读:为什么要进行数据挖掘?什么是数据挖掘?数据挖掘的主要内容又有哪些? 本文将逐一解答这些问题。通过本文的学习,你将对数据挖掘从为什么到是 什么,再到有什么有一个基本的了解。010100101C 1101010(5001#010100101C 1101010(5001#随着大型数据库的建立和海量数据的不断涌现,人们迫切需要强有力的数据分析工具。但现实情况往往是数据十分丰富,而信息相当贫乏。快速增长的海量数据被收集、存放在大型数据库中,没有强有力的工具,以人类 现有的能力很难理解它们。因此,有人说大数据是数据坟墓。当采用数据挖 掘工具进行数据分析时,可以发现隐藏在大数
2、据之中重要的数据内容、模式,能 对商务决策、知识库、科学和医学研究等做出巨大贡献。为解决数据和信息之间 的鸿沟,我们应系统地学习数据挖掘知识,开发数据挖掘工具,将数据坟墓花色相同的牌符号相同的牌图6聚类准那么影响结果示意回归分析(regression analysis )是一个统计预测模型,用于描述和评估应变量 与一个或多个自变量之间的关系,包括一元线性回归、多元线性回归、非线性回 归、逻辑回归等。具体来说,可以利用回归模型来实现数值预测的任务,比方前 面提到的房价预测任务。当自变量为非随机变量、因变量为随机变量时,分析它们的关系称为回归分析;根据回归分析可以建立变量间的数学表达式,称为归方程
3、。回归方程反映自变量在固定条件下因变量的平均状态变化情况。相关分析是以某一指标来度量回归方程所描述的各个变量间关系的密切程度。回归分析方法常用于解释市场占有率、销售额、品牌偏好及市场营销效果。把两个或两个以上定距或定比例的数量关系用函数形式表示出来,就是回归分析要解 决的问题。01数据挖掘过程数据挖掘(data mining )又译为资料探勘、数据采矿,是指从大量的、不完全 的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的但 又潜在有用的信息和知识的过程。数据挖掘的具体过程描述如下:1)数据:进行数据挖掘首先要有数据,可以根据任务的目的选择数据集,并筛选 自己需要的数据,或
4、者根据实际情况构造自己需要的数据。2)预处理:确定数据集后,就要对数据进行预处理,使数据能够为我们所用。数 据预处理可以提高数据质量,包括准确性、完整性和一致性。进行数据预处理的 方法有数据清理、数据集成、数据规约和数据变换等。3)变换:进行数据预处理后,对数据进行变换,将数据转换成一个分析模型,这 个分析模型是针对数据挖掘算法建立的。建立一个真正适合数据挖掘算法的分析 模型是数据挖掘成功的关键。4)数据挖掘:对经过转换的数据进行挖掘,除了选择合适的挖掘算法外,其余一 切工作都能自动地完成。5 )解释/评估:解释并评估结果,最终得到知识。其使用的分析方法一般视数据 挖掘操作而定,通常会用到可视
5、化技术。数据挖掘的具体过程如图1所示。知识!02数据挖掘的内容关联规那么挖掘从大规模数据中搀掘对象之间的隐含关系称为关联分析(Associate Analysis ) 或者关联规那么挖掘(Associate Rule Mining ),它可以揭示数据中隐藏的关联 模式,帮助人们进行市场运作、决策支持等。考察一些涉及许多物品的事务。事务1中出现了物品甲,事务2中出现了物品乙,事务3中同时出现了物品甲和乙。那么,物品甲和乙在事务中的出现是否有规律 可循呢?在数据库的知识发现中,关联规那么就是描述这种在一个事务中物品同时出现的规律的知识模式。更确切地说,关联规那么通过量化的数字描述物品甲的出 现对物
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 终于 有人 数据 挖掘 明白
限制150内