改进的K-means聚类算法及应用.doc
《改进的K-means聚类算法及应用.doc》由会员分享,可在线阅读,更多相关《改进的K-means聚类算法及应用.doc(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、改进的K-means聚类算法及应用摘 要:传统的k-means算法需要事先确定初始聚类中心,聚类精确程度不高。针对以上问题,本文结合熵值法和动态规划算法来对传统的k-means算法进行改进,提出了基于熵值法及动态规划的改进k-means算法。熵值法用来修订算法的距离计算公式,以提高算法的聚类精确程度, 动态规划算法用来确定算法的初始聚类中心。将改进算法应用于矿井监测传感器聚类中,结果显示较传统的k-means算法,改进算法效率有了明显提高,聚类精确程度有较大增强。关键词:k-means;动态规划;熵值法;聚类精确度;矿井监测传感器【abstract】the traditional k-mean
2、s has sensitivity to the initial clustering centers, and its clustering accuracy is low. to against these short comings, an improved k-means algorithm based on the combination of dynamic programming algorithm and entropy method is proposed. the entropy method is used to amend the distance calculatin
3、g formula to improve the clustering accuracy, and dynamic programming algorithm is used to define the initial cluster centers. the result of the simulation on the clustering in the mine monitoring sensors shows that the proposed algorithm has better performance than the traditional k-means algorithm
4、 in terms of efficiency and clustering accuracy .【key words】k-means; dynamic programming; entropy; clustering accuracy; mine monitoring sensors 0 引 言k-means算法是数据挖掘技术中基于分裂法的一个经典的聚类算法,因为该算法的理论可靠、算法简单、收敛迅速而被广泛应用1-2。但是,k-means算法的聚类结果对初始聚类中心的依赖性导致聚类结果不稳定,并且仅依据对象间的欧式距离而忽略数据对象不同属性对对象间差异程度的影响也使得k-means算法的聚类
5、精确度降低。在实际应用中,如果可以同时从初始聚类中心的选取和对象间欧式距离计算公式的修订两个方面对算法进行改进,将对降低传统k-means算法聚类结果的波动性以及获得一个较好的聚类效果具有重要意义。文献3基于每个数据对象的密度参数选取处于高密度分布的点作为k-means算法的初始聚类中心,提高了聚类的准确率和稳定性。文献4利用贪心算法参照数据样本的分布特征将数据划分为k个集合,选取各集合中数据的平均值作为初始聚类中心。文献5 提出了基于kruskal算法的改进kmeans算法,该算法利用最小生成树的构造原理依次向聚类中心集合中加入当前数据对象中距离最远的两个对象,如此迭代直至集合中包含k个聚类
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 改进 means 算法 应用
限制150内