大数据解析与应用导论 (29).pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《大数据解析与应用导论 (29).pdf》由会员分享,可在线阅读,更多相关《大数据解析与应用导论 (29).pdf(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1第五章 聚类分析5.4 高斯混合模型2高斯混合模型的英文全称为“Gaussian Mixture Model”,缩写为GMM。利用GMM来区分GMM算法介绍 GMM算法主要是通过研究数据的分布对数据进行聚类。GMM是将若干个概率分布为高斯分布的模型(高斯元,Gaussian component)混合在一起的模型。简单地说,k-means 的结果是每个数据点被 assign 到其中某一个 cluster 了,而 GMM 则给出这些数据点被 assign 到每个cluster 的概率,又称作 soft assignment 3GMM算法介绍 GMM的模型:其中被称为权重系数,它代表了第k个高斯元
2、在这个模型中所占的比重。GMM模型中需要训练的参数为:在离线训练时,利用EM算法可以估算出相应的训练参数值4()1|,KkkkkPN X=k,(1,2,.,),kkkkK=GMM算法的公式表达5 利用GMM进行聚类,需要计算出每个待聚类样本属于每个高斯元的概率。在GMM中,我们习惯性用一个变量来表示高斯元。因此,我们可以有计算公式如下:上式表示了当取到样本后,又取到(该样本点隶属于)第i个高斯元的后验概率。经过计算,最终可以得到K个,并认为该样本属于概率最大的高斯元。()()()1|,|,iiiiKiiiip xp Yy xp x=x x()Y|ipy x=Y利用GMM算法进行聚类GMM聚类大
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据解析与应用导论 29 数据 解析 应用 导论 29
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内