第四章非线性判别函数精选PPT.ppt
《第四章非线性判别函数精选PPT.ppt》由会员分享,可在线阅读,更多相关《第四章非线性判别函数精选PPT.ppt(70页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章非线性判别函数第1页,此课件共70页哦4.7.1 分段线性判别函数的基本概念 n分段线性判别函数是一种特殊的非线性判别函数。它确定的决策面是由若干超平面段组成的。n由于它的基本组成仍然是超平面,因此,与一般超曲面(例如贝叶斯决策面)相比,仍然是简单的;又由于它是由多段超平面组成的,所以它能逼近各种形状的超曲面,具有很强的适应能力。第2页,此课件共70页哦n图4.7.1中分别给出了采用线性判别函数,分段线性判别函数和二次判别函数所得到的分界面。112:线性判别:分段线性判别:二次判别图 4.7.1第3页,此课件共70页哦n当类条件概率密度函数为正态分布,各特征统计独立且同方差时,贝叶斯决策
2、规则可得到线性判别函数,特别是当P(1)=P(2)时,决策规则可以写成n这时的决策面是两类期望连线的垂直平分面,如图4.7.2所示。这样的分类器叫做最小距离分类。第4页,此课件共70页哦12x1x2xg(x)=00图 4.7.2这一判别函数虽然是在十分特殊的条件下推出来的,但它却给了我们一个相当重要的启示,这就是可以把均值作为各类的代表点,用距离作为判别函数进行分类。第5页,此课件共70页哦1112212232:线性距离判别m1m2n现在考虑图4.7.3所示的两类分布情况。n1类和2类都是多峰分布。n如果利用上面方法,把各类均值仍作为代表点,设计最小距离分类器,则得到分界面。n缺点是错误率较大
3、。第6页,此课件共70页哦:分段线性距离判别图 4.7.31112212232如果每类不是只取一个代表点,而是取多个代表点,例如,1类取两个代表点,2类取三个代表点,仍利用上面定义的距离判别函数,它是由多段超平面组成的,其中每一段都是最小距离分类器。这样的结果是令人满意的。把未知样本x归到离它最近的代表点所属的类别,则可得到如图中折线(即分界面所示的分段线性分界面,第7页,此课件共70页哦一般地,如果对于i类取li个代表点,或者说,把属于i类的样本区域Ri分为li个子区域,即 ,n其中 表示第i类的第l个子区域,用 表示该子区域中样本的均值向量,并以此作为该子区域的代表点,这样可以定义如下判别
4、函数n 这样的分类器叫做分段线性距离分类器。n 若有则把x归到j类。第8页,此课件共70页哦4.7.2 分段线性判别函数分段线性判别函数 n把上述基于距离的分段线性判别函数概念加以推广。n在前面,把每一类都分为若干子区域,并选择各子区域的均值向量作为代表点以设计最小距离分类器。n但这种方法只在某些特殊情况下才能得到较好的分类结果,在很多情况下往往不适用。第9页,此课件共70页哦例如图4.4所示的样本分布情况。n图中各类样本服从正态但非等协方差分布,其等概率密度面为超椭球面,用虚线表示。n利用贝叶斯决策规则对样本x进行分类,应决策x2类;n但若以i作为代表点,按到i的欧氏距离进行分类,则应决策x
5、1类。n这与贝叶斯决策相矛盾。12x1x20 x图 4.7.4第10页,此课件共70页哦n只考虑作为各类或各子区域代表点所提供的信息是很不够的。n如何利用整个样本集所提供的全部信息是需要考虑的问题。n把每一类分为若干个子类,即令n 不是选择各子类的均值作为代表点设计最小距离分类器,而是对于每个子类定义一个线性判别函数第11页,此课件共70页哦n则对于c类问题可定义c个判别函数gi(x),i=1,2,c,并得到决策规则:l=1,2,li,i=1,2,cn式中 和 分别为子类 的权向量和阈值权。如果定义i的线性判别函数为则决策xj n对于任意样本x,必有某个子类的判别函数值较其它的判别函数值为最大
6、。第12页,此课件共70页哦n得到的决策面也是分段线性的,其决策面方程是由各子类的判别函数确定的,n如果第i类的第n个子类和第j类的第m个子类相邻,则该决策面方程是n 关键问题是如何利用样本集确定子类数目以及如何求各子类的权向量和阈值权。假如具有最大值的判别函数是 ,则把x归到子类所属的类 ,即类 。第13页,此课件共70页哦4.7.3分段线性分类器设计的一般考虑分段线性分类器设计的一般考虑 n分类器设计的基本问题是,在一定判别函数类内利用训练样本集确定分类器的参数,即确定判别函数中的系数。n设计线性分类器,就是确定权向量w和阈值权w0或广义权向量 a。n 而设计分段线性分类器,则是利用样本集
7、确定一组 和 。第14页,此课件共70页哦利用多类线性判别函数算法设计分段线利用多类线性判别函数算法设计分段线性分类器性分类器n若已知样本的子类划分情况,可把子类看作独立的类,然后利用多类线性判别函数算法把各个子类分开,自然也就把各类分开了。n这种方法必须以已知子类划分为前提。n划分子类的一种方法是根据先验知识直观判定,如字符识别中,可把同一字符看作一类,而把其中不同的字体看作它的不同子类。n另一种方法则借助于聚类分析方法来解决。第15页,此课件共70页哦已知子类数目时的分段线性判别函数已知子类数目时的分段线性判别函数 n当已知子类数目,但不知子类划分情况时,可利用下面的错误修正算法设计分段线
8、性分类器,它与多类线性判别函数的固定增量算法很相似,其步骤如下:n步骤1首先给定各子类的初始权向量。假设i类中有li个子类,则任意给定,i=1,2,c后面用 表示第k次迭代时,第i类第l个子类的权向量。第16页,此课件共70页哦步骤2 利用训练样本集进行迭代,并按下列规则修改权向量:n若在第k次迭代时,j类(j=1,2,c)中的样本yi与j类的某个权向量 的内积值为最大,即n而且满足n其中i=1,2,c,ij,l=1,2,li,则说明权向量组,n不影响yi正确分类,因此各权向量保持不变。第17页,此课件共70页哦n则说明yj被错误分类,需要对权向量进行修正。设n如果存在某个或几个子类不满足上述
9、条件,即存在 ,使得 n 则修正算法为第18页,此课件共70页哦n步骤3重复上面的迭代过程,直到算法收敛或达到规定的迭代次数为止。n当样本集对于给定的子类数目能用分段线性判别函数完全正确分类时,算法将在有限步内收敛,否则算法将不收敛,这时可以考虑用递减的k序列令算法收敛,但不可避免地会增大分类错误率。第19页,此课件共70页哦未知子类数目时的分段线性判别函数未知子类数目时的分段线性判别函数 n最一般的情况是每类应分成的子类数目未知。这时,设计分段线性分类器的方法很多,以树状分段线性分类器为例说明。n对于图4.7.5所示的两类情况,可先用两类线性判别函数算法找一个权向量。它所对应的超平面H1把整
10、个样本集分成两部分,称之为样本子集。第20页,此课件共70页哦1122图 4.7.5H1H4H2H3n 该分类器是分段线性的。“”表示权向量 ai 的方向,它指向超平面Hi的正侧。第21页,此课件共70页哦n它的识别过程是一个树状结构,如图4.7.6所示。图中用虚线显示了对未知样本y的决策过程,经过三步,判断y1。11212图 4.7.6YYYYNNNNaT1y0aT2y0aT3y0aT4y0第22页,此课件共70页哦n 通常可以选择分属两类的欧氏距离最小的一对样本,取其垂直平分面的法向量 ai 作为初始值,然后求得局部最优解ai*作为第一段超平面的法向量。n 这种方法对初始权向量的选择很敏感
11、,其结果随初始权向量ai 的不同而大不相同。在每个节点上所用的寻找权向量的方法不同,结果也将各异。n 对包含两类样本的各子类的划分也可以采用同样的方法。第23页,此课件共70页哦4.7.4 用凹函数的并表示分段线性判别函数 n分段线性判别函数的表示分段线性判别函数的表示 n设Li是线性函数,i=1,2,r,则分段线性函数可以递归地定义如下:nL1,L2,Lr都是分段线性函数。n如果A和B都是分段线性函数,则AB和AB也是分段线性函数。这里符号“”表示求小,符号“”表示求大。n分段线性函数只能由和的形式给出。第24页,此课件共70页哦任何分段线性函数都可以表示为如下两种一般形式:n分段线性函数的
12、析取范式nP=(L11L12L1,m1)(Lq1Lq2Lq,mq)n分段线性函数的合取范式nQ=(L11L12L1,m1)(Lq1Lq2Lq,mq)n用析取范式P表示一个分段线性函数,其中每个(L11L12Li,mi)称为一个凹函数,P是q个凹函数的并,即在q个凹函数中求最大凹函数。第25页,此课件共70页哦n对于多峰分布的两类问题,可以用分段线性判别函数P把其分开,P中的每个凹函数粗略地规定了某个类的一个峰,假设第一类呈现q个峰的分布,则P由q个凹函数Pi的并构成,记为 P=(P1P2Pq)n其中每个凹函数Pi又是mi个线性判别函数Lij的交构成的,记为Pi=(Li1Li2Li,mi)第26
13、页,此课件共70页哦假定对于每个线性判别函数Lij,都使i=1,2,qj=1,2,min则r个权向量 ,就能对样本集正确分类,这里 n分段线性判别函数P是样本集X和权向量 ,的函数,记为P(X;a1,a2,ar )第27页,此课件共70页哦n 这样,设计分段线性分类器的问题就转化为求r个权向量a的问题了。而对于任何x2,都有P(x;a1,a2,ar 0,n 如果对于任何x1,都有 P(x;a1,a2,ar)0,若n 则分段线性判别函数P就能对两类样本正确分类,即存在决策规则 第28页,此课件共70页哦例如,对于图4.7所示的分布,q=3,m1=5,m2=4,m3=4。因此分段线性判别函数L11
14、L12L13L14L15L21L22L23L24L31L32L33L34图 4.7第29页,此课件共70页哦P=(L11L12L13L14L15)(L21L22L23L24)(L31L32L33L34)nP=maxmin(L11,L12,L13,L14,L15)min(L21,L22,L23,L24)min(L31,L32,L33,L34)n在这儿,共有r=m1+m2+m3=13个线性判别函数。n对于任意xi1,即x落入第一类的第i个子类中,所有的Lij 0,j=1,2,mi,故Pi 0,因而P 0。第30页,此课件共70页哦而对于任意x2,因为所有的Pi0,i=1,2,3,因而P0。n对于未
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 非线性 判别函数 精选 PPT
限制150内