2022年SPSS实战之聚类分析 .pdf
《2022年SPSS实战之聚类分析 .pdf》由会员分享,可在线阅读,更多相关《2022年SPSS实战之聚类分析 .pdf(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、SPSS19.0实战之聚类分析这篇文章与上一篇的回归分析是一次实习作业整理出来的。所以参考文献一并放在该文最后。CNBlOG网页排版太困难了,又不喜欢live writer聚类分析是将物理或者抽象对象的集合分成相似的对象类的过程。本次实验我将对同一批数据做两种不同的类型的聚类;它们分别是系统聚类和K-mean聚类。其中系统聚类的聚类方法也采用3 种不同方法,来考察对比它们之间的优劣。由于没有样本数据,因此不能根据其数据做判别分析。评价标准主要是观察各聚类方法的所得到的类组间距离和组内聚类的大小。分析数据依然采用线性回归所使用的标准化后的能源消费数据。1.1 系统聚类本次实验的系统聚类都是凝聚系
2、统聚类,为了控制变量,都采用平方Euclidean距离。1.1.1 最短距离聚类法最短距离法聚类步骤如下:1.规定样本间的距离,计算样本两两之间的距离,得到对称矩阵。开始每个样品自成一类。2.选择对称矩阵中的最小非零元素。将两个样品之间最小距离记为D1,将这两个样品归并成为一类,记为G1。3.计算 G1 与其他样品距离。重复以上过程直到所有样品合并为一类。我们在 SPSS 中实现最短距离分析非常简单。单击“”-“”-“”。将弹出如图1-1 所示的对话框,设置相应的参数即可。图 1-1 最短距离法名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 8 页 -我们的数据已经做过标准化,在
3、“转化值”-“标准化”选项上选无。在统计量的聚类成员中选择“无”,因为这是非监督分类,不需要指定最终分出的类个数。在绘制中选择绘制“树状图”。单击确定,得到以下结果。1.表 3-1显示了数据的缺失情况:案例处理汇总a案例有效缺失总计N 百分比N 百分比N 百分比30 100.0 0.0 30 100.0 表 1-1 数据汇总我们的数据经过预处理,所以缺失值个数为0.2.由于相关矩阵过于庞大,无法在文档中贴出,得到的是一个非相似矩阵。表1-2 是样品聚类过程。样品21 和 28 在第一步合并为一类,它们之间的非相关系数最小,为0.211。在下一次合并是第十步。在第五步的时候,样品2、27、14
4、组成一类,出现群集,样品个数为 3。如上类推,可以解释表格。表 1-2 聚类过程我们可以通过更加形象直观的树状图来观察整个聚类过程和聚类效果。如图1-2所示,最短距离法组内距离小,但组间距离也较小。分类特征不够明显,无法凸显各个省份的能源消耗的特点。但是我们可以看到广东省能源消耗组成和其他省份特别不同,在其他方法中也显现出来。聚类表阶群集组合系数首次出现阶群集下一阶群集1 群集2 群集 1 群集2 1 21 28.211 0 0 10 2 12 24.465 0 0 6 3 2 27.491 0 0 5 4 13 20.585 0 0 9 5 2 14.645 3 0 6 6 2 12.678
5、 5 2 7 7 2 7.702 6 0 8 8 2 25.773 7 0 9 9 2 13.916 8 4 11 10 21 29 1.085 1 0 12 11 2 18 1.106 9 0 12 12 2 21 1.115 11 10 13 13 2 17 1.360 12 0 14 14 2 26 1.564 13 0 15 15 2 22 1.627 14 0 16 16 2 5 1.649 15 0 17 17 2 8 1.877 16 0 18 18 2 16 3.027 17 0 19 19 2 30 3.543 18 0 20 20 2 11 4.930 19 0 21 21
6、 2 4 5.024 20 0 22 22 2 10 6.445 21 0 24 23 1 9 8.262 0 0 26 24 2 15 10.093 22 0 25 25 2 23 10.096 24 0 26 26 1 2 10.189 23 25 27 27 1 6 11.387 26 0 28 28 1 3 13.153 27 0 29 29 1 19 32.367 28 0 0 名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 8 页 -图 1-2 最短距离法聚类图1.1.2 组间联接聚类组间联接聚类法定义为两类之间的平均平方距离,即。类 CK和 CL 合并为下一步的CM
7、 则 CM 与 CJ距离的递推公式为:。我们依然贴出组间联接法的聚类表和树状图。1.聚类表如表1-3所示,相关解释类似于表1-1 所述。聚类表阶群集组合系数首次出现阶群集下一阶群集 1 群集 2 群集 1 群集2 名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 8 页 -1 21 28.211 0 0 10 2 12 24.465 0 0 5 3 2 27.491 0 0 6 4 13 20.585 0 0 8 5 7 12.840 0 2 7 6 2 14.937 3 0 7 7 2 7 1.105 6 5 11 8 13 25 1.331 4 0 11 9 17 18 1.3
8、60 0 0 14 10 21 29 1.495 1 0 13 11 2 13 1.703 7 8 15 12 8 26 1.877 0 0 15 13 21 22 2.133 10 0 18 14 5 17 2.378 0 9 16 15 2 8 3.715 11 12 16 16 2 5 3.926 15 14 18 17 4 16 5.024 0 0 23 18 2 21 5.526 16 13 21 19 10 11 6.445 0 0 22 20 1 9 8.262 0 0 25 21 2 30 8.744 18 0 23 22 6 10 11.508 0 19 24 23 2 4
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年SPSS实战之聚类分析 2022 SPSS 实战 聚类分析
限制150内