基于模糊C均值的聚类分析ppt课件.ppt
1 模糊c均值聚类(FCM)方法 模糊C均值聚类(FCM)方法是一种在已知聚类数的情况下,利用隶属度函数和迭代算法将有限的数据集分别聚类的方法。其目标函数为: 式中, 为样本数; 为聚类数; 为第 个 样本相对于第 个聚类中心的隶属度; 为 第 个类别的聚类中心; 为样本到聚类中心的欧式距离。聚类的结果使目标函数 最小,因此,构造如下新的目标函数: (2) 这里 , =1, ,n,是等式的n个约束式的拉格朗日乘子。对所有输入参量求导,使式(1)达到最小的必要条件为: (3) (4) 由上述两个必要条件,模糊c均值聚类算法是一个简单的迭代过程。在批处理方式运行时,FCM采用下列步骤确定聚类中心 和隶属矩阵 U: 步骤1 用值在0,1间的随机数初始化隶属矩阵U,使其满足式(2)中的约束条件。 步骤2 用式(3)计算c个聚类中心 ,i=1, ,c。 步骤3 根据式(1)计算目标函数。如果它小于某个确定的阈值,或它相对上次价值函数值的改变量小于某个阈值,则算法停止。 步骤4 用式(4)计算新的U阵。近回步骤2。 当算法收敛时,就得到了各类的聚类中心和各个样本对于各类的隶属度值,从而完成了模糊聚类划分。 上述算法中,由于引入 的归一化条件,在样本集不理想的情况下可能导致结果不好。比如,如果某个野值样本远离各类的聚类中心,本来它严格属于各类的隶属度都很小,但由于归一化条件的限制,将会使它对各类都有较大的隶属度(比如两类情况下各类的隶属度都是05),这种野值的存在将影响迭代的最终结果。程序 if nargin = 2 & nargin = 3, error(Too many or too few input arguments!); end data_n = size(data, 1); in_n = size(data, 2); default_options = 2;%u矩阵分割指数 100; %迭代的最大次数 1e-5;%改进的最小值 1;%迭代时显示信息 if nargin = 2, options = default_options; else if length(options) 4, tmp = default_options; tmp(1:length(options) = options; options = tmp; end nan_index = find(isnan(options)=1); options(nan_index) = default_options(nan_index); if options(1) 1, if abs(obj_fcn(i) - obj_fcn(i-1) min_impro, break; end, end end iter_n = i;% obj_fcn(iter_n+1:max_iter) = ;调用上述程序建立起来的模糊聚类函数,得到以下运行程序:A=1739.94 1675.152395.96; 373.3 3087.052429.47; 1756.77 16521514.98; 864.45 1647.312665.9; 222.85 3059.542002.33; 877.88 2031.663071.18; 1803.58 1583.122163.05; 2352.12 2557.041411.53; 401.3 3259.942150.98; 363.34 3477.952462.86; 1571.171731.041735.33;104.8 3389.832421.83;499.853305.752196.22;2297.283340.14535.62;2092.623177.21584.32;1418.791775.892772.9;1845.591918.812226.49;2205.363243.741202.69;2949.163244.44662.42;1692.621867.52108.97;1680.671575.781725.1;2802.883017.111984.98;172.783084.492328.65;2063.543199.761257.21;1449.581641.583405.12;1651.521713.281570.38;341.593076.622438.63;291.023095.682088.95;237.633077.782251.96;1702.81639.792068.74;1877.931860.961975.3;867.812334.682535.1;1831.491713.111604.68;460.693274.772172.99;2374.983346.98975.31;2271.893482.97946.7;1783.641597.992261.31;198.833250.452445.08;1494.632072.592550.51;CENTER2, U2, OBJ_FCN2=FCM(A,4)得出聚类中心及隶属度矩阵: CENTER2 =314.72 3194.7 2283.52330.5 3250 958.331748.8 1733.2 1927.71211.8 1879 2821.1 U2 = Columns 1 through 6 0.033201 0.97007 0.029789 0.056082 0.92626 0.071666 0.029521 0.0058525 0.047123 0.020886 0.017596 0.0203680.64897 0.0088617 0.84987 0.11948 0.023937 0.076162 0.28831 0.015217 0.073223 0.80355 0.032208 0.8318 Columns 7 through 12 0.01486 0.070257 0.97808 0.931 0.015668 0.94372 0.015919 0.54463 0.0055741 0.017272 0.018067 0.01343 0.88683 0.2854 0.0068329 0.020349 0.91889 0.0167910.082394 0.099713 0.009517 0.031376 0.047375 0.026058 Columns 13 through 18 0.95896 0.024654 0.03003 0.014714 0.026868 0.0150670.010641 0.91928 0.90032 0.0081124 0.029539 0.94815 0.012668 0.035832 0.045317 0.061914 0.80249 0.02370 0.017729 0.020235 0.024333 0.91526 0.1411 0.013072 Columns 19 through 24 0.041413 0.013279 0.013603 0.10616 0.97534 0.0350020.84263 0.013456 0.017119 0.50326 0.005104 0.88240.074423 0.9069 0.92614 0.24253 0.0074904 0.0533150.041534 0.066363 0.043141 0.14805 0.012066 0.029278 Columns 25 through 30 0.068372 0.026621 0.96861 0.96367 0.98434 0.006666 0.036258 0.03739 0.0060731 0.0085095 0.0033354 0.00693660.14864 0.86903 0.0092717 0.011597 0.0048348 0.952540.74673 0.066961 0.016046 0.016226 0.007487 0.033862 Columns 31 through 36 0.0077799 0.21467 0.020132 0.96956 0.0019406 0.0098372 0.010602 0.043571 0.032947 0.007787 0.99341 0.96934 0.95265 0.15798 0.89416 0.0094531 0.0029726 0.013040.02897 0.58378 0.052762 0.013204 0.001678 0.0077779 Columns 37 through 39 0.022453 0.97193 0.0483980.022367 0.0061355 0.0285220.80825 0.0083348 0.232140.14693 0.013595 0.69094 OBJ_FCN2 = 1.9285e+007 1.352e+007 8.2142e+006 5.4477e+006 4.9316e+006 4.85e+006 4.8367e+006 4.8344e+006 4.834e+006 4.8339e+006 4.8339e+006 4.8339e+006 4.8339e+006 4.8339e+006 4.8339e+006 4.8339e+006 4.8339e+006 4.8339e+006 4.8339e+006 4.8339e+006 4.8339e+006 4.8339e+006 4.8339e+006 此时,目标函数在4.8339e+006处收敛,算法结速 由得出的聚类中心矩阵及隶属度矩阵就可以进行分类了:聚类中心矩阵有4行,每一行代表一类及四类,3列,每一列代表一种颜色;由隶属度矩阵中Columns 1 through 6为例: 0.033201 0.97007 0.029789 0.056082 0.92626 0.071666 0.029521 0.0058525 0.047123 0.020886 0.017596 0.020368 0.64897 0.0088617 0.84987 0.11948 0.023937 0.076162 0.28831 0.015217 0.073223 0.80355 0.032208 0.8318 先看上述矩阵的第一列,从中找出最大值是0.64897 ,在第三行,由最大隶属度原则可得:样本1属于第三类,以此类 推,可将39 个样本值进行分类,最终分类结果如下: Blue Green Red Type 1739.94 1675.15 2395.961 373.33087.05 2429.472 1756.77 1652 1514.981 864.451647.31 2665.93 222.853059.54 2002.332 877.882031.66 3071.183 1803.581583.12 2163.051 2352.12 2557.04 1411.534 401.33259.94 2150.982363.343477.952462.8621571.171731.041735.331104.83389.832421.832499.853305.752196.2222297.283340.14535.6242092.623177.21584.3241418.791775.892772.931845.591918.812226.4912205.363243.741202.6942949.163244.44662.4241692.621867.52108.971 1680.67 1575.78 1725.1 1 2802.88 3017.11 1984.984 172.78 3084.49 2328.652 2063.54 3199.76 1257.214 1449.58 1641.58 3405.123 1651.52 1713.28 1570.381 341.59 3076.62 2438.632 291.02 3095.68 2088.952 237.63 3077.78 2251.962 1702.8 1639.79 2068.741 1877.93 1860.96 1975.31 867.81 2334.68 2535.13 1831.49 1713.11 1604.681 460.69 3274.77 2172.992 2374.98 3346.98 975.314 2271.89 3482.97 946.74 1783.64 1597.99 2261.311 198.83 3250.45 2445.082 1494.63 2072.59 2550.513参考文献 1孙即祥现代模式识别M长沙:国防科技 大学出版社,20012吴晓莉林哲辉MATLAB辅助模糊系统设计 M西安:西安电子科技大学出版社, 20O23薛忠,谢维信模糊c均值聚类算法的一种方法 J系统工程与电子技术,1995,11 6469 初始化Thank you