2022年模糊C均值聚类算法及实现.docx
《2022年模糊C均值聚类算法及实现.docx》由会员分享,可在线阅读,更多相关《2022年模糊C均值聚类算法及实现.docx(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精品学习资源模糊 C均值聚类算法及实现摘要 :模糊聚类是一种重要数据分析和建模的无监督方法;本文对模糊聚类进行了概述,从理论和试验方面讨论了模糊c 均值聚类算法,并对该算法的优点及存在的问题进行了分析;该算法设计简洁,应用范畴广,但仍存在简洁陷入局部极值点等问题,仍需要进一步讨论;关键词: 模糊 c 均值算法;模糊聚类;聚类分析Fuzzy c-Means Clustering Algorithm and ImplementationAbstract: Fuzzy clustering is a powerful unsupervised method for the analysis of d
2、ata and construction of models.This paper presents an overview of fuzzy clustering and do some study of fuzzyc-means clustering algorithminterms oftheory and experiment.This algorithm is simple in design,can be widely used,but there are still some problems in it,and therefore,it is necessary to be s
3、tudied further.Key words: fuzzy c-Mean algorithm;fuzzy clustering; clustering analysis1 引言20 世纪 90 岁月以来,随着信息技术和数据库技术的迅猛进展,人们可以特别便利地猎取和储备大量的数据; 但是, 面对大规模的数据, 传统的数据分析工具只能进行一些表层的处理, 比方查询、 统计等, 而不能获得数据之间的内在关系和隐含的信息;为了摆脱“数据丰富,学问贫乏”的困境,人们迫切需要一种 能够智能地、 自动地把数据转换成有用信息和学问的技术和工具,这种对强有力数据分析工具的迫切需求使得数据挖掘技术应运而生;将
4、物理或抽象对象的集合分组成由类似的对象组成的多个类的过程称为聚类;由聚类所生成的簇是一组数据对象的集合, 这些对象与同一个簇中的对象彼此相像,与其它簇中的对象相异;聚类是一种重要的数据分析技术, 搜寻并且识别一个有限的种类集合或簇集合,进而描述数据;聚类分析作为统计学的一个分支, 己经被广泛讨论了很多年;欢迎下载精品学习资源而且,聚类分析也已经广泛地应用到诸多领域中,包括数据分析、模式识别、图 像处理以及市场讨论 1;通过聚类,人们能够识别密集的和稀疏的区域,因而发觉全局的分布模式, 以及数据属性之间的好玩的相互关系; 在商务上, 聚类能帮忙市场分析人员从客户基本信息库中发觉不同的客户群,并且
5、用购买模式来刻画不同的客户群的特点; 在生物学上, 聚类能用于推导植物和动物的分类, 对基因进行分类, 获得对种群中固有结构的熟悉; 聚类在地球观测数据库中相像地区的确定,汽车保险单持有者的分组, 及依据房屋的类型、 价值和地理位置对一个城市中房屋的分组上也可以发挥作用;聚类也能用于对Web 上的文档进行分类, 以发觉信息;基于层次的聚类算法文献中最早显现的Single-Linkage 层次聚类算法是 1957 年在 Lloyd 的文章中最早显现的,之后 MacQueen 独立提出了经典的模糊 C 均值聚类算法, FCM 算法中模糊划分的概念最早起源于Ruspini 的文章中,但关于 FCM
6、的算法的具体的分析与改良就是由Dunn 和 Bezdek 完成的;聚类分析是多元统计分析的一种,也是非监督模式识别的一个重要分支,在 模式分类、图像处理和模糊规章处理等众多领域中获得最广泛的应用;它把一个没有类别标记的样本集按某种准就划分为假设干个子集类 ,使相像的样本尽可能的归为一类, 而将不相像的样本尽量划分到不同的类中; 硬聚类把每个待辨识的对象严格地划分到某类中, 具有非此即彼的性质, 模糊聚类由于能够描述样本类属的中介性, 能够客观地反映现实世界, 已逐步成为聚类分析的主流 2 - 3 ;在众多的模糊聚类算法中,模糊 c 均值聚类算法 FCM应用最为广泛;它依据某种判别准就,将数据的
7、聚类转化为一个非线性优化问题, 并通过迭代来进行求解, 目前已成为非监督模式识别的一个重要分支;数据挖掘中的聚类分析主要集中在针对海量数据的有一效和有用的聚类方法讨论, 聚类方法的可伸缩性, 高维聚类分析, 分类属性数据聚类和具有混合属性数据的聚类, 非距离模糊聚类等; 因此,数据挖掘对聚类分析有其特别的要求 ; 可伸缩性,能够处理不同类型属性,强抗噪性,高维性,对输入次序不敏锐性,可说明性和可用性等;本文正是在此背景下对数据挖掘中的聚类分析进行论述,并着重讨论了 FCM算法;2 模糊聚类算法欢迎下载精品学习资源2.1 模糊聚类算法概述模糊聚类算法是一种基于函数最优方法的聚类算法,使用微积分运
8、算技术求最优代价函数; 在基于概率算法的聚类方法中将使用概率密度函数,为此要假定合适的模型,模糊聚类算法的向量可以同时属于多个聚类,从而摆脱上述问题; 在模糊聚类算法中, 定义了向量与聚类之间的近邻函数, 并且聚类中向量的隶属度由隶属函数集合供应; 对模糊方法而言, 在不同聚类中的向量隶属函数值是相互关联的;硬聚类可以看成是模糊聚类方法的一个特例;2.2 模糊聚类算法的分类模糊聚类分析算法大致可分为三类 4:1分类数不定,依据不同要求对事物进行动态聚类,此类方法是基于模糊等价矩阵聚类的,称为模糊等价矩阵动态聚类分析法;2分类数给定,查找出对事物的最正确分析方案,此类方法是基于目标函数聚类的,称
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 模糊 均值 算法 实现
限制150内