聚类方法第十一章优秀课件.ppt
《聚类方法第十一章优秀课件.ppt》由会员分享,可在线阅读,更多相关《聚类方法第十一章优秀课件.ppt(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、聚类方法第十一章第1页,本讲稿共38页划分聚类划分聚类一、按最邻近规则的简单试探法一、按最邻近规则的简单试探法 给N个待分类的模式样本 ,要求按距离阈值T分类到聚类中心v算法过程:算法过程:vStep 1:取任意的样本x xi i作为一聚类中的初始值,如令z z1 1=x=x1 1,计算若D21T,确定一新的聚类中心z z2 2=x=x2 2否则x x2 2以z z1 1为中心的聚类;第2页,本讲稿共38页vStep 2:假如已有聚类中心z z1 1和z z2 2,计算 若D31T和D32T,则确定一新的聚类中心z z3 3=x=x3 3;vStep i:第3页,本讲稿共38页v讨论讨论v这种
2、方法的优点:计算简单,若模式样本的集合分布的先验知识已知,则可获得较好的聚类结果。v在实际中,对于高维模式样本很难获得准确的先验知识,因此只能选用不同的阈值和起始点来试探,并对结果进行验证。v这种方法在很大程度上依赖于以下因素:v第一个聚类中心的位置(初始化问题初始化问题)v待分类模式样本排列次序(聚类样本的选择问题聚类样本的选择问题)v距离阈值T的大小(判决准则问题判决准则问题)v样本分布的几何性质(样本的固有特性问题样本的固有特性问题)第4页,本讲稿共38页层次聚类层次聚类v系统聚类:系统聚类:先把每个样本作为一类,然后根据它们间的相似性或相邻性聚合,类别由多到少,直到获得合适的分类要求为
3、止;相似性、相邻性用距离表示。聚合的关键就是每次迭代中形成的聚类之间以及它们和样本之间距离的计算,不同的距离函数会得到不同结果。v两类间距离计算准则两类间距离计算准则:v1.最短距离:两类中相距最近的两样本间的距离第5页,本讲稿共38页 2.最长距离 :两类中相距最远的两个样本间的距离。3.类平均距离:两类中各个元素两两之间的距离平方相加后取平均值 4.类中心距离第6页,本讲稿共38页算法过程描述:算法过程描述:Step1:初始距离矩阵的计算D(0)说明:(1)距离矩阵元素的值是类与类之间的距离,距离的定义有多种。(2)距离矩阵,是对称矩阵。对角线上的元值表示同类之间的距离,即为0。Step2
4、:对于第n次迭代的距离矩阵D(n)进行聚合说明:距离矩阵中选择距离最小的,如果有相同的可以任选其中一个,要忽略对角线上的元素。第7页,本讲稿共38页 vStep3:根据第n次聚合结果,计算合并后的新类别之间的距离矩阵D(n+1)说明:合并类的距离计算应该符合距离的运算规则。如,距离反映的是两类的重心距离,那么合并后,应该仍然反映的重心的距离。vStep4:收敛性判决 说明:算法的收敛条件判断准则的确定。第8页,本讲稿共38页例例1:如下图所示(简单的一维情况)1、设全部样本分为6类,2、计算距离矩阵D(0)第9页,本讲稿共38页123456102903116044916640525436406
5、642581190第10页,本讲稿共38页3、求最小元素:4、把1,3合并7=(1,3)4,6合并8=(4,6)5、作距离矩阵D(1),按最小距离准则728570290849160525440第11页,本讲稿共38页6、若合并的类数没有达到要求,转3。否则停止。3、求最小元素:4、8,5,2合并,9=(2,5,4,6)第12页,本讲稿共38页分解聚类分解聚类v分解聚类:把全部样本作为一类,然后根据相似性、相邻性分解。v目标函数:两类中心的距离 N:总样本数,:1类样本数 :2类样本数,第13页,本讲稿共38页分解聚类框图分解聚类框图初始分类初始分类调整分类方案调整分类方案最终结果最终结果目标函
6、数目标函数达到最优先?达到最优先?第14页,本讲稿共38页例例2:已知21个样本,每个样本取二个特征,如下表:样本号 12345678910 x10022445667x2655343121011 12 13 14 15 16 17 18 19 20 21-4-2-3-3-5100-1-1-3322021-1-2-1-3-5第15页,本讲稿共38页目标函数解:第一次分类时计算所有样本,分别划到 时的E值,找出最大E值对应的样本。1、开始时,第16页,本讲稿共38页 2、分别计算当 划入 时的E值把 划入 时有第17页,本讲稿共38页 然后再计算把 划入 时对应的E值,找出一个最大的E值。一直计算
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方法 第十一 优秀 课件
限制150内