2-模式识别原理课件-第3章--判别函数及几何分类法.ppt
《2-模式识别原理课件-第3章--判别函数及几何分类法.ppt》由会员分享,可在线阅读,更多相关《2-模式识别原理课件-第3章--判别函数及几何分类法.ppt(115页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2-模式模式识别原理原理课件件-第第3章章-判判别函函数及几何分数及几何分类法法第第3章章 判别函数及几何分类法判别函数及几何分类法3.1 判别函数判别函数3.2 线性判别函数线性判别函数3.3 广义线性判别函数广义线性判别函数3.4 线性判别函数的几何性质线性判别函数的几何性质3.5 感知器算法感知器算法3.6 梯度法梯度法3.7 最小平方误差算法最小平方误差算法3.8 非线性判别函数非线性判别函数2021/5/222021/5/222 23.1 判别函数判别函数聚类分析法(第二章)判决函数法几何分类法确定性事件分类(第三章)概率分类法随机事件分类(第四章)线性判决函数法统 计 决 策 方
2、法非线性判决函数法复习与引申:复习与引申:模式识别统计2021/5/222021/5/223 3若分属于1,2的两类模式可用一方程d(X)=0来划分,那么称d(X)为判别函数,或称判决函数、决策函数。3.1 判别函数判别函数(discriminant function)直接用来对模式进行分类的准则函数。例:一个二维的两类判别问题,模式分布如图示,这些分属于1,2两类的模式可用一直线方程 d(X)=0来划分。为坐标变量,为方程参数。式中:图3.2 两类二维模式的分布1判别函数的定义判别函数的定义2021/5/222021/5/224 4若 ,则若 ,则 类;若 ,则 类;或拒绝将某一未知模式 X
3、 代入:维数=3时:判别边界为一平面。维数3时:判别边界为一超平面。2021/5/222021/5/225 5 d(X)表示的是一种分类的标准,它可以是1、2、3维的,也可以是更高维的。判别界面的正负侧,是在训练判别函数的权值时确定的。2判别函数正负值的确定判别函数正负值的确定图3.3 判别函数正负的确定2021/5/222021/5/226 61)判决函数d(X)的几何性质。它可以是线性的或非线性的函 数,维数在特征提取时已经确定。如:已知三维线性分类 判决函数的性质就确定了判决函数 的形式:3.确定判别函数的两个因素确定判别函数的两个因素例:非线性判决函数2)判决函数d(X)的系数。用所给
4、的模式样本确定。2021/5/222021/5/227 73.2 线性判别函数线性判别函数3.2.1 线性判别函数的一般形式线性判别函数的一般形式将二维模式推广到n维,线性判别函数的一般形式为:(3-2)式中:权向量,即参数向量。增广向量的形式:式中:为增广权向量,为增广模式向量。2021/5/222021/5/228 83.2.2 线性判别函数的性质线性判别函数的性质1.两类情况d(X)=0:不可判别情况,可以)对M个线性可分模式类,1,2,M,有三种划分方式:2.多类情况 两分法两分法两分法特例2021/5/222021/5/229 9两分法(1)多类情况1:用线性判别函数将属于i类的模式
5、与其余不属于i类的模式分开。将某个待分类模式 X 分别代入 M 个类的d(X)中,若只有di(X)0,其他d(X)均0,则判为i类。识别分类时:2021/5/222021/5/221010 全部不属任何类 IR,可能 属于1w或3w 1w2w3w0)(2=Xd0)(3=Xd+IR,可能 属于3w或2w+-0)(1=Xd0,0312ddd0,0321ddd0,0,321dddIR,可能属于1w或2w 0,0213ddd2x1x+对某一模式区,di(X)0的条件超过一个,或全部的di(X)dd001312dd002321dd3w+-d23(X)=0d12(X)=0d13(X)=0IR0002313
6、12dd001312dd002321dd3w+-d23(X)=0d12(X)=0d13(X)=0IR000231312dj(X)就相当于多类情况2中的dij(X)0。两分法特例(3)多类情况3:因此对具有判别函数 的M类情况,判别函数性质为:或:2021/5/222021/5/222020识别分类时:判别界面需要做差值。对i类,应满足:di其他所有d2313dddd01w2w2x1x()0)(21=-XdXd+-()0)(31=-XdXd()0)(32=-XdXd3212dddd3121dddd3w2021/5/222021/5/222121 除边界区外,没有不确定区域。特点:是第二种情况的特
7、例。由于dij(X)=di(X)dj(X),若在第三种情况下可分,则在第二种情况下也可分,但反过来不一定。2313dddd01w2w2x1x()0)(21=-XdXd+-()0)(31=-XdXd()0)(32=-XdXd3212dddd3121dddd3w 把 M 类情况分成了(M-1)个两类问题。并且 类的判别界面全部与 类的判别界面相邻(向无穷远处延伸的区域除外)。2021/5/222021/5/222222例例3.5 一个三类模式(M=3)分类器,其判决函数为:试判断X0=1,1T属于哪一类,且分别给出三类的判决界面。解:2021/5/222021/5/222323类的判决函数:判决界
8、面如图所示。类的判决函数:类的判决函数:-()0)(21=-XdXd2313dddd0.5x2+-()0)(31=-XdXd()0)(32=-XdXd3212dddd3121dddd110.5w1w2w3x1+2021/5/222021/5/222424-O2x1x()0)(21=-XXdd+-()0)(31=-XXdd()0)(32=-XXdd例例3.6 已知判决界面的位置和正负侧,分析三类模式的分布 区域。2021/5/222021/5/222525(1)明确概念:线性可分。一旦线性判别函数的系数Wk被确定以后,这些函数就可以作为模式分类的基础。3.小结小结(2)分法的比较:对于M类模式的
9、分类,两分法共需要M个判别函数,但 两分法需要M(M-1)/2个。当时M3时,后者需要更多个判别式(缺点),但对模式的线性可分的可能性要更大一些(优点)。原因:一种类别模式的分布要比M-1类模式的分布更为聚集,分法受到的限制条件少,故线性可分的可能性大。2021/5/222021/5/2226261非线性多项式函数非线性多项式函数 非线性判别函数的形式之一是非线性多项式函数。3.3 广义线性判别函数广义线性判别函数目的:对非线性边界:通过某映射,把模式空间X变成X*,以便将X空间中非线性可分的模式集,变成在X*空间中线性可分的模式集。设一训练用模式集,X在模式空间X中线性不可分,非线性判别函数
10、形式如下:(3-9)式中 是模式X的单值实函数,。fi(X)取什么形式及d(X)取多少项,取决于非线性边界的复杂程度。2021/5/222021/5/222727广义形式的模式向量定义为:(3-10)这里X*空间的维数k高于X空间的维数n,(3-9)式可写为上式是线性的。讨论线性判别函数并不会失去一般性的意义。(3-11)随着小样本学习理论和支持向量机的迅速发展,广义线性判别函数的“维数灾难”问题在一定程度上找到了解决的办法。非线性变换可能非常复杂。问题:维数大大增加:维数灾难。2021/5/222021/5/222828例例3.7 假设X为二维模式向量,fi(X)选用二次多项式函数,原判别函
11、数为定义:d(X)线性化为:即:广义线性判别函数:2021/5/222021/5/2229293.4 线性判别函数的几何性质线性判别函数的几何性质3.4.1 模式空间与超平面模式空间与超平面模式空间:以n维模式向量X的n个分量为坐标变量的欧氏空间。模式向量的表示:点、有向线段。线性分类:用d(X)进行分类,相当于用超平面d(X)=0把模式空 间分成不同的决策区域。2.讨论1.概念式中,。设判别函数:超平面:2021/5/222021/5/223030(1)模式向量X1和X2在超平面上 W0是超平面的法向量,方向由超平面的负侧指向正侧。设超平面的单位法线向量为U:2021/5/222021/5/
12、223131(2)X不在超平面上 将X向超平面投影得向量Xp,构造向量R:r:X到超平面的垂直距离。有(r)判别函数d(X)正比于点X到超平面的代数距离。2021/5/222021/5/223232X到超平面的距离:点X到超平面的代数距离(带正负号)正比于d(X)函数值。(3)X在原点得 超平面的位置由阈值权wn+1决定:wn+1 0时,原点在超平面的正侧;wn+1 0时。用负梯度向量的值对权向量W进行修正,实现使准则函数达到极小值的目的。2021/5/222021/5/225555基本思路:定义一个对错误分类敏感的准则函数J(W,X),在J的梯度方向上对权向量进行修改。一般关系表示成从W(k
13、)导出W(k+1):其中c是正的比例因子。梯度法求解步骤:(1)将样本写成规范化增广向量形式,选择准则函数,设置初始权向量W(1),括号内为迭代次数k=1。2021/5/222021/5/225656权向量修正为:迭代次数k加1,输入下一个训练样本,计算新的权向量,直至对全部训练样本完成一轮迭代。(3)在一轮迭代中,如果有一个样本使 ,回到(2)进行下 一轮迭代。否则,W不再变化,算法收敛。(2)依次输入训练样本X。设第k次迭代时输入样本为Xi,此时 已有权向量W(k),求 :2021/5/222021/5/225757例例3.10 选择准则函数,简单地考虑X为一维增广模式的情况X=1,此时W
14、=w,两者均为标量,错误分类时:,对权向量校正。正确分类时:,对权向量不做修正。2021/5/222021/5/225858说明:随着权向量W向理想值接近,准则函数关于W的导数()越来越趋近于零,这意味着准则函数J 越来越接近最小值。当 最终 时,J达到最小值,此时W不再改变,算法收敛。将感知器算法中联立不等式求解W的问题,转换为求函数J极小值的问题。c)梯度算法是求解权向量的一般解法,算法的具体计算形式取决于准则函数J(W,X)的选择,J(W,X)的形式不同,得到的具体算法不同。a)b)c值的选择很重要,如c值太小,收敛太慢;但若太大,搜索又可能过头,甚至引起发散。2021/5/222021
15、/5/2259593.6.2 固定增量法固定增量法准则函数:求W(k)的递推公式:1.求J的梯度方法:函数对向量求导=函数对向量的分量求导,即该准则函数有唯一最小值“0”,且发生在 的时候。设 ,2021/5/222021/5/226060部分:首先求另:矩阵论中有2021/5/222021/5/226161其中 由的结论 有:2021/5/222021/5/2262622.求W(k+1)将 代入得:2021/5/222021/5/226363 由此可以看出,感知器算法是梯度法的特例。即:梯度法是将感知器算法中联立不等式求解W的问题,转换为求函数J极小值的问题,将原来有多个解的情况,变成求最优
16、解的情况。上式即为固定增量算法,与感知器算法形式完全相同。即:只要模式类是线性可分的,算法就会给出解。2021/5/222021/5/2264643.7 最小平方误差算法最小平方误差算法(least mean square error,LMSE;亦称Ho-Kashyap算法)上述的感知器算法、梯度算法、固定增量算法或其他类似方法,只有当模式类可分离时才收敛,在不可分的情况下,算法会来回摆动,始终不收敛。当一次次迭代而又不见收敛时,造成不收敛现象的原因分不清,有两种可能:a)迭代过程本身收敛缓慢b)模式本身不可分对可分模式收敛。对于类别不可分的情况也能指出来。LMSE算法特点:2021/5/22
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 原理 课件 判别函数 几何 分类法
限制150内