误差分析课件 聚类分析之快速聚类法.ppt
《误差分析课件 聚类分析之快速聚类法.ppt》由会员分享,可在线阅读,更多相关《误差分析课件 聚类分析之快速聚类法.ppt(26页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、聚类分析的聚类分析的快速聚类法快速聚类法聚类分析样品间相似性的度量快速聚类分析及实例目录分类分类俗语说,物以类聚、人以群分。俗语说,物以类聚、人以群分。但什么是分类的根据呢?但什么是分类的根据呢?比如,要想把中国的县分成若干类,就有很比如,要想把中国的县分成若干类,就有很 多种分类法;多种分类法;可以按照自然条件来分,可以按照自然条件来分,比如考虑降水、土地、日照、湿度等各方面;比如考虑降水、土地、日照、湿度等各方面;也可以考虑收入、教育水准、医疗条件、基也可以考虑收入、教育水准、医疗条件、基础设施等指标;础设施等指标;既可以用某一项来分类,也可以同时考虑多既可以用某一项来分类,也可以同时考虑
2、多项指标来分类。项指标来分类。基本思想是:通过定义样品或变量间“接近程度”的度量,以此为基础,将“相近”的样品或变量归为一类。聚类分析的介绍聚类分析的介绍聚类分析聚类分析和判别分析判别分析是研究分类问题的数据分析方法。聚类分析和判别分析的比较聚类分析聚类分析判别分析判别分析区别区别进行聚类分析前进行聚类分析前对总体有几种类对总体有几种类型并不知道型并不知道总体分类已给定,总体分类已给定,在总体分布或来自在总体分布或来自总体训练样本基础总体训练样本基础上,对新样品判定上,对新样品判定属于哪个总体属于哪个总体联系联系判别分析中的训练样本往往是从聚类判别分析中的训练样本往往是从聚类分析中得到的分析中
3、得到的引入引入:如何度量远近如何度量远近?如如果果想想要要对对100个个学学生生进进行行分分类类,如如果果仅仅仅仅知知道道他他 们们的的数数学学成成绩绩,则则只只好好按按照照数数学学成成绩绩来来分分类类;这这些些成成绩绩在在直直线线上上形形成成100个个点点。这这样样就就可可以以把把接接近的点放到一类。近的点放到一类。如如果果还还知知道道他他们们的的物物理理成成绩绩,这这样样数数学学和和物物理理成成绩绩就就形形成成二二维维平平面面上上的的100个个点点,也也可可以以按按照照距距离离远近来分类。远近来分类。三三维维或或者者更更高高维维的的情情况况也也是是类类似似;只只不不过过三三维维以以上的图形
4、无法直观地画出来而已。上的图形无法直观地画出来而已。设X=为所关心的p个指 标,对此指标作n次观测得n组观测值 称这n组观测数据为n个样品样品。这样,每个样品可看成p维空间的一个点,n个样品组成p维空间的n个点,我们可以用各点之间的距离来衡量个样品点之间的靠近程度。样品间相似性的度量样品间相似性的度量1 欧氏距离欧氏距离2 绝对绝对距离距离3 Minkowski距离距离其中m1,又称为Lm距离。4 Chebyshev距离距离是Minkowski距离当m时的极限。广义的广义的“距离距离”:由于不同指标通常有不同的由于不同指标通常有不同的量纲量纲量纲量纲,这会引起各取值的分散程度差异,这会引起各取
5、值的分散程度差异较大,有时会造成很不合理的结果,为了消除此种影响,常需要在较大,有时会造成很不合理的结果,为了消除此种影响,常需要在分析前对数据进行标准化处理分析前对数据进行标准化处理。5 方差加权距离方差加权距离 标准化数据的欧氏距离就是方差加权距离。?6 马马氏距离氏距离通常都是尝试各种不同距离分析,最终采用最有利于分类的距离定义。=-=-=-=-niiTniiinjiTjijixnxxxxxnSxxxSxxSxxxxd11212111)(11,)()()(其中算得的协方差矩阵:是由样品其中L令形成n个样品两两之间的距离矩距离矩阵阵:其中 思想思想:首先将样品粗糙得分类,然后再依据样品间的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 误差分析课件 聚类分析之快速聚类法 误差 分析 课件 聚类分析 快速 聚类法
限制150内