聚类分析详解ppt课件.ppt
《聚类分析详解ppt课件.ppt》由会员分享,可在线阅读,更多相关《聚类分析详解ppt课件.ppt(65页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、报告人: 主要内容引言聚类分析原理聚类分析的种类聚类分析应注意的问题聚类分析应用聚类分析工具及案例分析引言“物以类聚,人以群分”市场营销中的市场细分和客户细分问题。可从客户分类入手,根据客户的年龄、职业、收入、消费金额、消费频率、喜好等方面进行单变量或者多变量的客户分组。不足:不足:客户群划分带有明显的主观色彩,需要有丰富的行业经验才能做到比较合理和理想的客户细分。主要表现在,同一客户细分段中的客户在某些方面并不相似,而不同客户细分段中的客户在某些特征方面却又很相似。解决方法:解决方法:从数据自身出发,充分利用数据进行客户的客观分组,使诸多有相似性的客户被分在同一组,而不相似的客户被区分到另一
2、组中。这时便可采用聚类分析方法。主要内容引言聚类分析原理聚类分析原理聚类分析的种类聚类分析应注意的问题聚类分析应用聚类分析工具及案例分析聚类分析定义聚类:聚类:聚类(clustering)是对大量未知标注的数据集,按数据的内在相似性内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小,其过程被称为聚类。聚类分析定义聚类分析定义:聚类分析定义:聚类分析是将样品样品或变量变量按照他们性质上的亲疏程度亲疏程度进行分类的多元统计分析方法。进行聚类分析时,用来描述物品或变量的亲疏程度通常有两个途径:一是把每个样品或变量看成是多维空间上的一个点,在多维坐标中,定义点与点、类与
3、类之间的距离,用点与点间距离距离来描述样品或变量的亲疏程度;二是计算样品或变量的相似系数相似系数,用相似系数来描述样品或变量之间的亲疏程度。聚类分析特点聚类分析是一种建立分类的多元统计分析方法,它能将一批样本(或变量)数据根据其诸多特征,按照在性质上的亲疏程度亲疏程度在没有先验知识没有先验知识的情况下进行自动分类,产生多个分类结果。类内部的个体在特征上具有相似性,不同类间个体特征的差异性较大。聚类分析特点编号编号购物环境购物环境服务质量服务质量A商厦7368B商厦6664C商厦8482D商厦9188E商厦9490 把商厦分成两类: 把商厦分为三类: 没有指定分类标准,大家为什么会这么分呢? 从
4、数据出发,根据性质上的亲疏程度亲疏程度进行分类!A、B为一类,C、D、E为一类A、B为一类,C为一类,D、E为一类聚类分析特点编号编号购物环境购物环境服务质量服务质量A商厦7368B商厦6664C商厦8482D商厦9188E商厦9490 把商厦分成两类: 把商厦分为三类: 没有指定分类标准,大家为什么会这么分呢? 从数据出发,根据性质上的亲疏程度亲疏程度进行分类!A、B为一类,C、D、E为一类A、B为一类,C为一类,D、E为一类样本样本变量变量亲疏程度的度量方法亲疏程度的度量也叫相似性度量,方法主要有两个:(1) 距离距离常用来度量样品样品之间的相似性;(2)相似系数相似系数常用来度量变量变量
5、之间的相似性。编号编号购物环境购物环境服务质量服务质量A商厦7368B商厦6664C商厦8482D商厦9188E商厦9490样本样本变量变量距离距离欧氏(Euclidean)距离平方欧氏(Squared Euclidean)距离明氏(明科夫斯基 Minkowski)距离切比雪夫(Chebychev)距离兰氏(Lance和Willianms)距离马氏(Mahalanobis)距离斜交空间距离其他详细定义请参考教材:信息分析方法与应用王伟军,清华大学出版社SPSS统计分析方法及应用薛薇,电子工业出版社距离编号编号购物环境购物环境服务质量服务质量A商厦7368B商厦6664距离编号编号购物环境购物环
6、境服务质量服务质量A商厦7368B商厦6664E商厦94901ijc , (0)ijxaxb ab1ijc , i jijjicc, i j相似系数1ijc , (0)ijxaxb ab1ijc , i jijjicc, i j相似系数相似系数编号编号购物环境购物环境服务质量服务质量A商厦7368B商厦6664参考教材:应用多元统计分析高惠璇,北京大学出版社相似系数主要内容引言聚类分析原理聚类分析的种类聚类分析的种类聚类分析应注意的问题聚类分析应用聚类分析工具及案例分析聚类分析的种类(1)系统聚类法(也叫分层聚类或层次聚类)(2)动态聚类法(也叫快速聚类)(3)模糊聚类法(4)图论聚类法 系统
7、聚类法对比常用的系统聚类方法一、最短距离法 二、最长距离法三、中间距离法四、类平均法五、重心法六、离差平方和法(Ward方法) 一、最短距离法定义类与类之间的距离为两类最近样品间的距离,即,minKLKLiji Gj GDd详细步奏和实例详细步奏和实例最短距离法的聚类步骤(1) 规定样品之间的距离,计算 个样品的距离矩阵 ,它是一个对称矩阵。(2) 选择 中的最小元素,设为 ,则将 和 合并成一个新类,记为 ,即(3) 计算新类 与任一类 之间距离的递推公式为n 0D 0DKLDKGLGMGMKLGGGMGJG,minminmin, minmin,MJKJLJMJijijiji Gj Gi G
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 聚类分析 详解 ppt 课件
限制150内