试论R软件在系统聚类分析中的应用.docx
《试论R软件在系统聚类分析中的应用.docx》由会员分享,可在线阅读,更多相关《试论R软件在系统聚类分析中的应用.docx(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、试论R软件在系统聚类分析中的应用试论R软件在系统聚类分析中的应用摘要:多元统计聚类方法已被广泛应用于自然科学和社会科学的各个领域,而在现实处理多元数据聚类分析中,离不开统计软件的支持;R软件由于其免费、开源、强大的统计分析及其完美的作图功能已得到越来越多人的关注与应用;本文结合实例介绍了R软件在多元统计系统分析中的应用。关键词:R软件;系统聚类分析;多元统计引言多元统计分析是统计学的一个重要分支,也称多变量统计分析;在现实生活中,受多种指标共同作用和影响的现象大量存在,多元统计分析就是研究多个随机变量之间互相依靠关系及其内在统计规律的重要学科,其中最常用聚类分析方法,由于多元统计聚类分析方法一
2、般涉及复杂的数学理论,一般无法用手工计算,必须有计算机和统计软件的支持。在统计软件方面,常用的统计软件有SPSS、SAS、STAT、R、S-PLUS,等等。R软件是一个自由、免费、开源的软件,是一个具有强大统计分析功能和优秀统计制图功能的统计软件,现已是国内外诸多统计学者喜欢的数据分析工具。本文结合实例介绍R软件在多元统计聚类分析中的应用。一、系统聚类分析聚类分析又称群分析,它是研究(样品或指标)分类问题的一种多元统计方法,所谓类,通俗地讲,就是指类似元素的集合。在社会经济领域中存在着大量分类问题,比方若对某些大城市的物价指数进行考察,而物价指数很多,有农用生产物价指数、服务项目价指数、食品消
3、费物价指数、建材零售价格指数等等。由于要考察的物价指数很多,通常先对这些物价指数进行分类。总之,需要分类的问题很多,因而聚类分析这个有用的工具越来越遭到人们的重视,它在很多领域中都得到了广泛的应用。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等;最常用最成功的聚类分析为系统聚类法,系统聚类法的基本思想为先将n个样品各自看成一类,然后规定样品之间的距离和类与类之间的距离。选择距离近期的两类合并成一个新类,计算新类和其他类(各当前类)的距离,再将距离近期的两类合并。这样,每次合并减少一类,直至所有的样品都归成一类为止。系统聚类法的基本步骤:1、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 试论 软件 系统 聚类分析 中的 应用
限制150内