模糊聚类分析课件.ppt
《模糊聚类分析课件.ppt》由会员分享,可在线阅读,更多相关《模糊聚类分析课件.ppt(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七讲 模糊聚类分析17.1 聚类分析的基本概念聚类分析的基本概念“聚聚类类”就就是是按按照照一一定定的的要要求求和和规规律律对对事事物物进进行行区区分分和和分分类类的的过过程程,在在这这一一过过程程中中没没有有任任何何关关于于分分类类的的先先验验知知识识,仅仅靠靠事事物物间间的的相相似似性性作作为为类类属属划分的准则划分的准则,属于无监督分类的范畴。属于无监督分类的范畴。“聚聚类类分分析析”是是指指用用数数学学的的方方法法研研究究和和处处理理给给定对象的分类。定对象的分类。2聚聚类类分分析析是是多多元元统统计计分分析析的的一一种种,它它把把一一个个没没有有类类别别标标记记的的样样本本集集按按
2、某某种种准准则则划划分分成成若若干干个个子子集集(类类),使使相相似似的的样样本本尽尽可可能能归归为为一一类类,而而不不相相似似的样本尽量划分到不同的类中。的样本尽量划分到不同的类中。传传统统的的聚聚类类分分析析是是一一种种硬硬划划分分,它它把把每每个个待待辨辨识识的的对对象象严严格格地地划划分分到到某某类类中中,具具有有非非此此即即彼彼的的性性质质,因因此此这这种种类类别别划划分分的的界界限限是是分分明明的的。而而实实际际上上大大多多数数对对象象并并没没有有严严格格的的属属性性,它它们们在在性性态态和和类类属属方方面面存存在在着着中中介介性性,具具有有亦亦此此亦亦彼彼的的性性质质,因因此适合
3、进行此适合进行软划分软划分。3模模糊糊集集理理论论的的提提出出为为软软划划分分提提供供了了有有力力的的分分析析工工具具,用用模模糊糊数数学学的的方方法法来来处处理理聚聚类类问问题题,被被称称之之为为模模糊糊聚聚类类分分析析。由由于于模模糊糊聚聚类类得得到到了了样样本本属属于于各各个个类类别别的的不不确确定定性性程程度度,表表达达了了样样本本类类属属的的中中介介性性,更更能能客客观观地地反反映映现现实实世世界界,从从而而成成为为聚类分析研究的主流。聚类分析研究的主流。模模糊糊聚聚类类已已经经在在诸诸多多领领域域获获得得了了广广泛泛的的应应用用,如如模模式式识识别别、图图像像处处理理、信信道道均均
4、衡衡、矢矢量量量量化化编编码码、神神经经网网络络的的训训练练、参参数数估估计计、医医学学诊诊断断、天气预报、食品分类、水质分析等。天气预报、食品分类、水质分析等。4常常用用的的模模糊糊聚聚类类分分析析方方法法大大致致可可分分为为两两大大类类:其其一一是是基基于于模模糊糊关关系系(矩矩阵阵)的的聚聚类类分分析析方方法法,而而作作为为其其中中核核心心步步骤骤的的模模糊糊分分类类,有有下下述述的的主主要要方方法法:模模糊糊传传递递闭闭包包法法、直直接接聚聚类类法法、最最大大树树法法和和编编网网法法;其其二二是是基基于于目目标标函函数数的的聚聚类类分分析析方方法法,称称为为模模糊糊C均均值值(FCM)
5、聚聚类类算算法法(或或称称为为模模糊糊ISODATA聚类分析法聚类分析法)。第第一一类类方方法法,作作为为准准备备先先讲讲解解模模糊糊关关系系传传递递闭闭包包的基本概念。的基本概念。57.2 模糊关系的传递闭包模糊关系的传递闭包设设R F(X X).则则R是是模模糊糊等等价价关关系系当当且且仅仅当当对对任意任意 0,1,R 是等价关系。是等价关系。论论域域X上上的的经经典典等等价价关关系系可可以以导导出出X的的一一个个分分类类。论论域域X上上的的一一个个模模糊糊等等价价关关系系R对对应应一一族族经经典典等等价价关关系系R:0,1.这这说说明明模模糊糊等等价价关关系系给给出出X的的一一个个分分类
6、类的的系系列列。这这样样,在在实实际际应应用用问问题题中中可可以以选选择择“某某个个水水平平”上上的的分分类类结结果果,这这就就是是模模糊聚类分析的理论基础。糊聚类分析的理论基础。实实际际问问题题中中建建立立的的模模糊糊关关系系常常常常不不是是等等价价关关系系而而是是相相似似关关系系,这这就就需需要要将将模模糊糊相相似似关关系系改改造造为为模糊等价关系模糊等价关系,传递闭包正是这样一种工具。传递闭包正是这样一种工具。6定定义义 设设R F(X X).若若R1 F(X X)是是传传递递的的且且满满足:足:1)R R1,2)若若S是是X上的模糊传递关系且上的模糊传递关系且R S,必有必有R1 S.
7、则称则称R1为为R的传递闭包的传递闭包,记为记为t(R).模糊关系模糊关系R的传递闭包是包含的传递闭包是包含R的最小传递关系的最小传递关系。定理定理 设设R F(X X).则则 t(R)=n=1 Rn.7(n=1 Rn)(m=1 Rm)=n=1 Rn (m=1 Rm)=n=1 m=1 (Rn Rm)=k=2 (n+m=k Rn+m)=k=2 Rk k=1 Rk.这这说说明明n=1 Rn是是传传递递的的。又又,显显然然R n=1 Rn.即即n=1 Rn是包含是包含R的模糊传递关系。的模糊传递关系。若有若有X上的模糊传递关系上的模糊传递关系S满足满足R S,下证下证n=1 Rn S (即证明即证明
8、n=1 Rn“最小最小”)由由R S得得 R2 S2 S,R3=R R2 R S S2 S,证明:证明:8 一般地一般地,Rn S,n N.于是于是n=1 Rn S.综综上上所所述述,n=1 Rn是是包包含含R的的最最小小传传递递关关系系,因因而是而是R的传递闭包的传递闭包,即即t(R)=n=1 Rn.在论域有限的情况下在论域有限的情况下,传递闭包的计算更简捷传递闭包的计算更简捷:定理定理 设设|X|=n,R F(X X).则则 t(R)=k=1nRk.计计算算有有限限论论域域上上自自反反模模糊糊关关系系R的的传传递递闭闭包包的的方方法法:从从R出出发发,反反复复自自乘乘,依依次次计计算算出出
9、R2,R4,当第一次出现当第一次出现Rk Rk=Rk时得时得t(R)=Rk.9定定理理 设设R F(X X).则则R的的传传递递闭闭包包t(R)具具有有以以下性质下性质:(1)若若I R,则则 I t(R);(2)(t(R)1=t(R 1);(3)若若R=R 1,则则(t(R)1=t(R).上上述述结结论论表表明明:自自反反关关系系的的传传递递闭闭包包是是自自反反的的,对对称称关关系系的的传传递递闭闭包包是是对对称称的的。于于是是,模模糊糊相相似似关系的传递闭包是模糊等价关系。关系的传递闭包是模糊等价关系。例例 设设|X|=5,R是是X上上的的模模糊糊关关系系,R可可表表示示为为如如下下的的5
10、5模糊矩阵。求模糊矩阵。求R的传递闭包。的传递闭包。10解解 容容易易看看出出R是是自自反反的的对对称称模模糊糊关关系系(即即模模糊糊相相似似关关系系)。依依次次计计算算R2,R4,R8知知:R8=R4 R4=R4(参参见下页计算结果见下页计算结果),所以所以R的传递闭包的传递闭包 t(R)=R4.11127.3 7.3 基于模糊关系的聚类分析基于模糊关系的聚类分析基基于于模模糊糊关关系系的的聚聚类类分分析析的的一一般般步步骤骤:(1)数数据据规格化规格化;(2)构造模糊相似矩阵构造模糊相似矩阵;(3)模糊分类。模糊分类。上上述述第第三三步步又又有有不不同同的的算算法法,以以下下先先介介绍绍利
11、利用用模模糊传递闭包进行模糊分类的方法。糊传递闭包进行模糊分类的方法。设设被被分分类类对对象象的的集集合合为为X=x1,x2,xn,每每一一个个对对象象xi有有m个个特特性性指指标标(反反映映对对象象特特征征的的主主要要指指标标),即即xi可由如下可由如下m维维特性指标向量特性指标向量来表示来表示:xi=(xi1,xi1,xim),i=1,2,n其其中中xij表表示示第第i个个对对象象的的第第j个个特特性性指指标标。则则n个个对对象象的的所所有有特特性性指指标标构构成成一一个个矩矩阵阵,记记作作X*=(xij)nm,称称X*为为X的的特性指标矩阵特性指标矩阵。13步骤一:数据规格化步骤一:数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模糊 聚类分析 课件
限制150内