第12章-聚类分析课件.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第12章-聚类分析课件.pptx》由会员分享,可在线阅读,更多相关《第12章-聚类分析课件.pptx(17页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第12章 聚类分析 聚类分析13.1.1 聚类分析的基本原理13.1.2 层次聚类13.1.3 K-均值聚类13.1.4 聚类分析的Stata命令n把把“对象对象”分成不同的类别分成不同的类别l这这些些类类不不是是事事先先给给定定的的,而而是是直直接接根根据据数数据据的的特特征征确定的确定的n把把相相似似的的东东西西放放在在一一起起,从从而而使使得得类类别别内内部部的的“差差异异”尽可能小,而类别之间的尽可能小,而类别之间的“差异差异”尽可能大尽可能大n聚聚类类分分析析就就是是按按照照对对象象之之间间的的“相相似似”程程度度把把对对象象进进行行分类分类什么是聚类分析?(cluster anal
2、ysis)n聚聚类类分分析析的的“对对象象”可可以以是是所所观观察察的的多多个个样样本本,也也可可以以是针对每个样本测得的多个变量是针对每个样本测得的多个变量n按照变量对所观察的样本进行分类称为按照变量对所观察的样本进行分类称为Q型聚类型聚类l按按照照多多项项经经济济指指标标(变变量量)对对不不同同的的地地区区(样样本本)进进行行分分类类n按照样本对多个变量进行分类,则称为按照样本对多个变量进行分类,则称为R型聚类型聚类l按照不同地区的样本数据对多个经济变量进行分类按照不同地区的样本数据对多个经济变量进行分类n两两种种聚聚类类没没有有什什么么本本质质区区别别,实实际际中中人人们们更更感感兴兴趣
3、趣的的通通常是根据变量对样本进行分类常是根据变量对样本进行分类(Q型聚类型聚类)什么是聚类分析?(两种分类方式)n按对象的按对象的“相似相似”程度分类程度分类n根根据据样样本本的的观观测测数数据据测测度度变变量量之之间间的的相相似似性性程程度度可可以以使使用用夹夹角角余余弦弦、Pearson相相关关系系数数等等工工具具,也也称称为为相相似似系系数数l变量间的相似系数越大,说明它们越相近变量间的相似系数越大,说明它们越相近n根据变量来测度样本之间的相似程度则使用根据变量来测度样本之间的相似程度则使用“距离距离”l把把离离得得比比较较近近的的归归为为一一类类,而而离离得得比比较较远远的的放放在在不
4、不同的类同的类什么是聚类分析?(按什么分类)相似性的度量(样本点间距离的计算方法)Euclidean距离距离Squared Euclidean距离距离Block距离距离Chebychev距离距离Minkovski距离距离n在在对对变变量量进进行行分分类类时时,度度量量变变量量之之间间的的相相似似性性常常用用相相似似系数,测度方法有系数,测度方法有相似性的度量(变量相似系数的计算方法)夹角余弦夹角余弦 Pearson相关系数相关系数 n层次聚类又称系统聚类层次聚类又称系统聚类n事事先先不不确确定定要要分分多多少少类类,而而是是先先把把每每一一个个对对象象作作为为一一类类,然后一层一层进行分类然后
5、一层一层进行分类n根根据据运运算算的的方方向向不不同同,层层次次聚聚类类法法又又分分为为合合并并法法和和分分解解法法,两种方法的运算原理一样,只是方向相反,两种方法的运算原理一样,只是方向相反层次聚类(hierarchical cluster)n将每一个样本作为一类,如果是将每一个样本作为一类,如果是k个样本就分个样本就分k成类成类n按按照照某某种种方方法法度度量量样样本本之之间间的的距距离离,并并将将距距离离最最近近的的两两个样本合并为一个类别,从而形成了个样本合并为一个类别,从而形成了k-1个类别个类别n再再计计算算出出新新产产生生的的类类别别与与其其他他各各类类别别之之间间的的距距离离,
6、并并将将距距离离最最近近的的两两个个类类别别合合并并为为一一类类。这这时时,如如果果类类别别的的个个数数仍仍然然大大于于1,则则继继续续重重复复这这一一步步,直直到到所所有有的的类类别别都都合合并成一类为止并成一类为止n总是先把离得最近的两个类进行合并总是先把离得最近的两个类进行合并l合并越晚的类,距离越远合并越晚的类,距离越远l事事先先并并不不会会指指定定最最后后要要分分成成多多少少类类,而而是是把把所所有有可可能能的的分分类类都都列列出出,再再视视具具体体情情况况选选择择一一个个合合适适的的分分类结果类结果 层次聚类(合并法)n分解方法原理与合并法相反分解方法原理与合并法相反n先先把把所所
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 12 聚类分析 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内