(1.3.1)--1.3数据分析与数据挖掘的方法.ppt
-
资源ID:84315404
资源大小:2.37MB
全文页数:9页
- 资源格式: PPT
下载积分:8金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
(1.3.1)--1.3数据分析与数据挖掘的方法.ppt
第1章 数据分析与数据挖掘目录 CONTENTS1.52 1.11.21.31.4数据分析与数据挖掘分析与挖掘的数据类型数据分析与数据挖掘的方法数据分析与数据挖掘使用的技术应用场景及存在的问题1.5Chapter 1.3数据分析与数据挖掘的方法4 1.3 数据分析与数据挖掘的方法频繁模式:数据中频繁出现的模式频繁项集:频繁在事务数据集中一起出现的商品集合 例如:在超市的销售中哪些商品会频繁地一起被购买?关联与相关性 例如:典型的关联规则 尿不湿 啤酒1.频繁模式5 1.3 数据分析与数据挖掘的方法分类与标签预测是找出描述和区分数据类或概念的模型或函数,以便能够使用模型预测类标号未知的对象的类标号分类预测类别(离散的、无序的)标号,回归建立连续值函数模型,也就是用来预测缺失的或难以获得的数值数据值。典型方法:决策树,朴素贝叶斯分类,支持向量机,神经网络,规则分类器,基于模式的分类,逻辑回归 2.分类与回归6 1.3 数据分析与数据挖掘的方法2.分类与回归7 1.3 数据分析与数据挖掘的方法3.聚类分析聚类就是把一些对象划分为多个组或者“聚簇”,从而使得同组内对象间比较相似而不同组对象间差异较大。例如:通信公司根据“工作时间通话时长”、“其他时间通话时长”、“本地通话时长”等属性对用户进行聚类分析,可以将用户划分为“商务用户”、“普通用户”以及“较少使用用户”。8 1.3 数据分析与数据挖掘的方法4.离群点分析离群点是指全局或局部范围内偏离一般水平的观测对象。例如:当发现某个人的信用卡在不经常消费的地区短时间内消费了大量的金额,则可以认定这张卡的使用情况异常,可以作为离群点数据。THANKS FOR YOUR ATTENTION感谢指导!