《第二讲模糊聚类分析.ppt》由会员分享,可在线阅读,更多相关《第二讲模糊聚类分析.ppt(25页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二讲第二讲 模糊聚类分析模糊聚类分析 聚类分析(聚类分析(cluster analysis)将具体或抽象对象)将具体或抽象对象的集合分组成为由类似的对象组成的多个类的过程的集合分组成为由类似的对象组成的多个类的过程被称为聚类。聚类分析是一种重要的人类行为。聚被称为聚类。聚类分析是一种重要的人类行为。聚类与分类的不同在于,聚类所要求划分的类是未知类与分类的不同在于,聚类所要求划分的类是未知的。聚类是将数据分类到不同的类这样的一个过程,的。聚类是将数据分类到不同的类这样的一个过程,所以同一类中的对象有很大的相似性,而不同簇间所以同一类中的对象有很大的相似性,而不同簇间的对象有很大的相异性的。换言
2、之,聚类分析是建立的对象有很大的相异性的。换言之,聚类分析是建立一种分类方法,它是将一批样品或变量,按照它们在一种分类方法,它是将一批样品或变量,按照它们在性质上的亲疏程度进行分类。聚类分析的特点是我们性质上的亲疏程度进行分类。聚类分析的特点是我们不知道它们的分类,甚至连分成几类也不知道,希望不知道它们的分类,甚至连分成几类也不知道,希望用某种方法把观测进行合理的分类,使得同一类的观用某种方法把观测进行合理的分类,使得同一类的观测比较接近,不同类的观测相差较多。测比较接近,不同类的观测相差较多。一、基本概念及定理一、基本概念及定理例:设对于模糊等价矩阵例:设对于模糊等价矩阵例:设有模糊相似矩阵
3、例:设有模糊相似矩阵二、模糊聚类的一般步骤二、模糊聚类的一般步骤、建立数据矩阵、建立数据矩阵(1)标准差标准化)标准差标准化(2)极差正规化)极差正规化(3)极差标准化)极差标准化(4)最大值规格化)最大值规格化其中:其中:、建立模糊相似矩阵、建立模糊相似矩阵(1)相似系数法)相似系数法夹角余弦法夹角余弦法相关系数法相关系数法(2)距离法)距离法Haiming距离距离Euclid距离距离Chebyshev距离距离(3)贴近度法)贴近度法最大最小法最大最小法算术平均最小法算术平均最小法几何平均最小法几何平均最小法3 3、聚类并画出动态聚类图、聚类并画出动态聚类图(1)模糊传递闭包法)模糊传递闭包
4、法步骤:步骤:解:解:由题设知特性指标矩阵为由题设知特性指标矩阵为采用最大值规格化法将数据规格化为采用最大值规格化法将数据规格化为用最大最小法构造用最大最小法构造模糊相似矩阵得到模糊相似矩阵得到用平方法合用平方法合成传递闭包成传递闭包取取 ,得,得取取 ,得,得取取 ,得,得取取 ,得,得取取 ,得,得画出动态聚类图如下:画出动态聚类图如下:0.70.630.620.531应用一应用一:教师课堂教学质量评价教师课堂教学质量评价 数据标准化采取最大值规格化数据标准化采取最大值规格化;相似矩阵的建立采取相关系数法相似矩阵的建立采取相关系数法.动态聚类图如下动态聚类图如下:1 4 8 12 0 0
5、2 3 6 13 14 15 5 0 0 0 0 0 7 10 0 0 0 0 9 11 0 0 0 0当当lamda=0.9200时时,分类如下分类如下 应用二应用二:金融机构金融机构 财务分析财务分析 表表1为为2004年广东年广东10个城市金融机构本外个城市金融机构本外币存款、贷款的统计币存款、贷款的统计 情况。试分析他们财情况。试分析他们财务情况的相似性。务情况的相似性。数据标准化采取极差变换数据标准化采取极差变换;相似矩阵的建立采取夹角余弦法相似矩阵的建立采取夹角余弦法.动态聚类图如下动态聚类图如下:lamd=0.9447 1 0 0 0 2 0 0 0 3 6 7 8 4 5 9 0 10 0 0 0作业作业:企业综合竞争力评价分类企业综合竞争力评价分类 5个公司个公司6个指标的样品数据如下,试根个指标的样品数据如下,试根据以下数据评价据以下数据评价5个公司的综合竞争力。个公司的综合竞争力。
限制150内