误差分析课件聚类分析之谱系聚类法精.ppt
《误差分析课件聚类分析之谱系聚类法精.ppt》由会员分享,可在线阅读,更多相关《误差分析课件聚类分析之谱系聚类法精.ppt(27页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、误差分析课件聚类分析之谱系聚类法第1页,本讲稿共27页类间距离及其递推公式谱系聚类法的应用分析谱系聚类法的步骤谱系聚类第2页,本讲稿共27页引言 谱系聚类法也称为系统聚类法,是目前应用较为广泛的一种聚类方法,它根据植物分类学的思想对研究对象进行分类。在植物分类学中,分类的单位是:门、纲、目、科、属、种,其中种是分类的基本单位。分类单位越小,它所包含的植物就越少,植物间的共同特征就越多。谱系聚类第3页,本讲稿共27页 利用这种分类思想,谱系聚类法首先视各样品自成一类,然后把最相似的样品聚为小类,再将已聚合的小类按其相似性再聚合,随着相似性的减弱,最后将一切子类都聚合成一个大类,从而得到一个按相近
2、性大小聚结起来的谱系图,再进一步根据实际情况确定合适的分类个数。谱系聚类第4页,本讲稿共27页问题判断两个样品最相似的依据是什么?谱系聚类第5页,本讲稿共27页类间距离及其递推公式 常用的类间距离有四种:最短距离 最长距离 类平均距离 重心距离类间距离谱系聚类第6页,本讲稿共27页 以 分别表示样品 ,以 简记 与 的距离 ,设 分别表示两个类,它们分别含有 个样品.我们用 来表示类 与 之间的距离.最短距离 即用两类中样品之间距离最短者作为两类间的距离.谱系聚类第7页,本讲稿共27页最长距离 即用两类中样品之间距离最长者作为这两类间的距离.类平均距离 即用两类中所有两两样品之间的距离的平均作
3、为两类之间的距离.或者 即用两类中所有两两样品之间的平方距离的平均作为两类间的平方距离.谱系聚类第8页,本讲稿共27页重心距离设类 中的样品为 ,则其均值称为类 的重心.其中,分别是 的重心,即用两类的重心之间的距离作为两类间的距离.谱系聚类第9页,本讲稿共27页 按照谱系聚类的思想,先将样品聚合成小类,再逐步聚为大类.设类 由类 合并所得,则 包含 个样品.为了更方便地实现谱系聚类,我们需要建立类间距离的递推公式,即计算类 与其他类 之间的距离.类间距离的递推公式谱系聚类第10页,本讲稿共27页常用的四种类间距离的递推公式最短距离最长距离谱系聚类第11页,本讲稿共27页类平均距离对于类平均距
4、离的下列定义方式 同理可得递推公式如下:谱系聚类第12页,本讲稿共27页重心距离由 的合并集 的重心是 而 由,有 谱系聚类第13页,本讲稿共27页 若采用欧氏距离的距离,以上介绍的4种类间距离的递推公式可统一表示为 计算样品之间 谱系聚类第14页,本讲稿共27页各种类间距离的参数如下表所示谱系聚类第15页,本讲稿共27页谱系聚类法的步骤(1)n个样品开始时作为n个类,计算两两之间的距离,构成一个对称距离矩阵 此时,谱系聚类第16页,本讲稿共27页 (2)选择 中主对角线以下(或以上)的最小距离,设这个元素是 ,这时 ,首先将 合并为一个新类 .在 中消去 ,所对应的行与列,并加入由新类 与剩
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 误差 分析 课件 聚类分析 谱系 聚类法精
限制150内