第12章-聚类分析--Stata统计分析与应用课件.ppt
《第12章-聚类分析--Stata统计分析与应用课件.ppt》由会员分享,可在线阅读,更多相关《第12章-聚类分析--Stata统计分析与应用课件.ppt(17页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、STATA 从入门到精通第第12章章 聚类分析聚类分析Page 2STATA从入门到精通从入门到精通 聚类分析聚类分析n1 13.1.1 3.1.1 聚类分析的基本原理聚类分析的基本原理n13.1.2 13.1.2 层次聚类层次聚类n13.1.3 K-13.1.3 K-均值聚类均值聚类n13.1.4 13.1.4 聚类分析的聚类分析的StataStata命令命令Page 3STATA从入门到精通从入门到精通n把把“对象对象”分成不同的类别分成不同的类别l这这些些类类不不是是事事先先给给定定的的,而而是是直直接接根根据据数数据据的的特特征征确定的确定的n把把相相似似的的东东西西放放在在一一起起,
2、从从而而使使得得类类别别内内部部的的“差差异异”尽可能小,而类别之间的尽可能小,而类别之间的“差异差异”尽可能大尽可能大n聚聚类类分分析析就就是是按按照照对对象象之之间间的的“相相似似”程程度度把把对对象象进进行行分类分类什么是聚类分析?什么是聚类分析?(cluster analysis)Page 4STATA从入门到精通从入门到精通n聚聚类类分分析析的的“对对象象”可可以以是是所所观观察察的的多多个个样样本本,也也可可以以是针对每个样本测得的多个变量是针对每个样本测得的多个变量n按照变量对所观察的样本进行分类称为按照变量对所观察的样本进行分类称为Q Q型聚类型聚类l按按照照多多项项经经济济指
3、指标标(变变量量)对对不不同同的的地地区区(样样本本)进进行行分类分类n按照样本对多个变量进行分类,则称为按照样本对多个变量进行分类,则称为R R型聚类型聚类l按照不同地区的样本数据对多个经济变量进行分类按照不同地区的样本数据对多个经济变量进行分类n两两种种聚聚类类没没有有什什么么本本质质区区别别,实实际际中中人人们们更更感感兴兴趣趣的的通通常是根据变量对样本进行分类常是根据变量对样本进行分类(Q(Q型聚类型聚类)什么是聚类分析?什么是聚类分析?(两种分类方式两种分类方式)Page 5STATA从入门到精通从入门到精通Page 6STATA从入门到精通从入门到精通相似性的度量相似性的度量(样本
4、点间距离的计算方法样本点间距离的计算方法)Euclidean距离距离Squared Euclidean距离距离Block距离距离Chebychev距离距离Minkovski距离距离Page 7STATA从入门到精通从入门到精通n在在对对变变量量进进行行分分类类时时,度度量量变变量量之之间间的的相相似似性性常常用用相相似似系数,测度方法有系数,测度方法有相似性的度量相似性的度量(变量相似系数的计算方法变量相似系数的计算方法)夹角余弦夹角余弦 Pearson相关系数相关系数 Page 8STATA从入门到精通从入门到精通n层次聚类又称系统聚类层次聚类又称系统聚类n事事先先不不确确定定要要分分多多少
5、少类类,而而是是先先把把每每一一个个对对象象作作为为一一类类,然后一层一层进行分类然后一层一层进行分类n根根据据运运算算的的方方向向不不同同,层层次次聚聚类类法法又又分分为为合合并并法法和和分分解解法法,两种方法的运算原理一样,只是方向相反,两种方法的运算原理一样,只是方向相反层次聚类层次聚类(hierarchical clusterhierarchical cluster)Page 9STATA从入门到精通从入门到精通Page 10STATA从入门到精通从入门到精通n分解方法原理与合并法相反分解方法原理与合并法相反n先先把把所所有有的的对对象象(样样本本或或变变量量)作作为为一一大大类类,然
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 12 聚类分析 Stata 统计分析 应用 课件
限制150内