模式识别复习资料.pptx
《模式识别复习资料.pptx》由会员分享,可在线阅读,更多相关《模式识别复习资料.pptx(45页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、复习复习2 模式识别系统组成 学习过程判决过程分类规则训练分类决策数据获取预处理特征选择 或提取模式识别系统框图 第1页/共45页复习复习1)监督分类:需要依靠已知类别的训练样本集,按照他们特征向量的分布来确定判别函数,然后利用判别函数对未知模式进行分类。需要足够的先验知识。判别。需要有足够的先验知识。2)非监督分类:用于没有先验知识的情况,通常采用聚类分析的方法。3 监督分类和无监督分类第2页/共45页复习复习4 模式识别整体知识结构第3页/共45页5 最大最小距离算法(小中取大距离算法)算法描述 选任意一模式样本做为第一聚类中心Z1。选择离Z1距离最远的样本作为第二聚类中心Z2。逐个计算各
2、模式样本与已确定的所有聚类中心之间的距离,并选出其中的最小距离。例当聚类中心数k=2时,计算min(Di1,Di2),i=1,N(N个最小距离)复习复习第4页/共45页 将样本 按最近距离划分到相应聚类中心对应的类别中。重复步骤,直到没有新的聚类中心出现为止。在所有最小距离中选出最大距离,如该最大值达到 的一定分数比值(阈值T)以上,则相应的样本点取为新的聚类中心,返回;否则,寻找聚类中心的工作结束。(:用试探法取为一固定分数,如1/2。)则Z3存在。例k=2时复习复习第5页/共45页例2.1 对图示模式样本用最大最小距离算法进行聚类分析。选Z1=X1距Z1最远,选为Z2。计算T。对应最小距离
3、中的最大值,且T,选作Z3。结果:Z1=X1;Z2=X6;Z3=X7。用全体模式对三个聚类中心计算最小距离中的最大值,无T 情况,停止寻找中心。聚类10个最小距离中,X7对应的距离T,第6页/共45页算法描述1)N个初始模式样本自成一类,即建立N 类:计算各类之间(即各样本间)的距离,得一NN维距离矩阵D(0)。“0”表示初始状态。(G_Group)6 层次聚类法2)假设已求得距离矩阵D(n)(n为逐次聚类合并的次数),找出D(n)中的最小元素,将其对应的两类合并为一类。由此建立新的分类:3)计算合并后新类别之间的距离,得D(n+1)。4)跳至第2步,重复计算及合并。复习复习第7页/共45页
4、结束条件:1)取距离阈值T,当D(n)的最小分量超过给定值 T 时,算法停 止。所得即为聚类结果。2)或不设阈值T,一直将全部样本聚成一类为止,输出聚类的分 级树。复习复习第8页/共45页例:给出6个五维模式样本如下,按最短距离准则进行系统聚类分类。计算各类间欧氏距离:解:(1)将每一样本看作单独一类,得:,;第9页/共45页D D(0)(0)0 00 00 00 00 00 0(2)将最小距离 对应的类 和 合并为1类,得 新的分类。计算聚类后的距离矩阵D(1):由D(0)递推出D(1)。得距离矩阵D(0):第10页/共45页D D(0)(0)0 00 00 00 00 00 0 D D(1
5、)(1)0 0 0 0 0 0 0 0 0 0(3)将D(1)中最小值 对应的类合为一类,得D(2)。D D(2)(2)0 0 0 0 0 0 0 0第11页/共45页(4)将D(2)中最小值 对应的类合为一类,得D(3)。D D(2)(2)0 0 0 0 0 0 0 0 D D(3)(3)0 0 0 0 0 0若给定的阈值为 ,D(3)中的最小元素 ,聚类结束。若无阈值,继续分下去,最终全部样本归为一类。可给出聚类过程的树状表示图。第12页/共45页 层次聚类法的树状表示 类间距离类间距离阈值增大,阈值增大,分类变粗。分类变粗。第13页/共45页7 K-均值算法 算法描述(1)任选K个初始聚
6、类中心:Z1(1),Z2(1),ZK(1)(2)按最小距离原则将其余样品分配到K个聚类中心中的某一 个。Nj:第j类的样本数。(3)计算各个聚类中心的新向量值:(4)如果 ,则回到(2),将模式 样本逐个重新分类,重复迭代计算。,算法收敛,计算完毕。如果复习复习第14页/共45页例2.3:已知20个模式样本如下,试用K-均值算法分类。解:取K=2,并选:计算距离,聚类:第15页/共45页:,可得到:计算新的聚类中:判断:,故返回第步。第16页/共45页 从新的聚类中心得:有:计算聚类中心:第17页/共45页 返回第步,以Z1(3),Z2(3)为中心进行聚类。以新的聚类中心分类,求得的分类结果与
7、前一次迭代结果相 同:计算新聚类中心向量值,聚类中心与前一次结果相同,即:,故算法收敛,得聚类中心为结果图示:第18页/共45页图2.10 K-均值算法聚类结果X1X4X3X5X8X9X7X10X2X6x1x213579135790X11X12X13X14X15X16X17X18X19X20第19页/共45页 上述K-均值算法,其类型数目假定已知为K个。当K未知时,可以令K逐渐增加,此时J j 会单调减少。最初减小速度快,但当K 增加到一定数值时,减小速度会减慢,直到K=总样本数N 时,Jj=0。JjK关系曲线如下图:8 聚类准则函数Jj与K的关系曲线JjA135724608109K 曲线的拐
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 复习资料
限制150内