第2章线性判别函数优秀课件.ppt
《第2章线性判别函数优秀课件.ppt》由会员分享,可在线阅读,更多相关《第2章线性判别函数优秀课件.ppt(92页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第2章线性判别函数第1页,本讲稿共92页2.1 2.1 线性判别函数和决策面线性判别函数和决策面 模式的表示模式的表示 在分类识别方法中,首先应该把代表事物的在分类识别方法中,首先应该把代表事物的那些那些特征特征抽取出来,构成代表这个模式的抽取出来,构成代表这个模式的特征特征向量向量。现在假定已经抽取到模式的若干特征:现在假定已经抽取到模式的若干特征:如果这如果这 个特征能够较好地描述原始的待识个特征能够较好地描述原始的待识别的事物,则可以用别的事物,则可以用 维空间的一个列向量来维空间的一个列向量来代表:代表:第2页,本讲稿共92页1.问题与解决思路问题与解决思路问题:问题:设有由设有由N个
2、待分类的个待分类的两类别两类别模式组成的一个模式组成的一个样本集,样本集,如何实现对样本集中的两类样本分类?如何实现对样本集中的两类样本分类?第3页,本讲稿共92页在一般情况下样本在特征空间的分布情况:在一般情况下样本在特征空间的分布情况:(二维两类别模式的例子)第4页,本讲稿共92页二维三类别模式的例子第5页,本讲稿共92页可以看出可以看出:不同类别的典型样本在特征空间中明显处于不同不同类别的典型样本在特征空间中明显处于不同的区域。的区域。表明表明:由于相同类别的模式具有由于相同类别的模式具有相似或相近的特征相似或相近的特征,因而,因而一类模式在特征空间中的某一区域分布,而另一一类模式在特征
3、空间中的某一区域分布,而另一类则在另外区域分布。类则在另外区域分布。第6页,本讲稿共92页 我们可以得到启发我们可以得到启发:用用已知类别的模式样本已知类别的模式样本产生一个代数表示产生一个代数表示的分界面的分界面 ,将特征空间分成两个互不,将特征空间分成两个互不重叠的区域,使不同类别的模式样本位于不同重叠的区域,使不同类别的模式样本位于不同的区域,再用的区域,再用 作为判别函数,对待作为判别函数,对待识别的模式进行分类。识别的模式进行分类。在特征空间可看作一个决策面。在特征空间可看作一个决策面。第7页,本讲稿共92页归纳解决问题的思路归纳解决问题的思路:(1)分类问题分类问题 特征空间的分布
4、特征空间的分布 寻找寻找 子区域的分界面子区域的分界面 确定判别函数确定判别函数(2)待识别模式待识别模式 判别函数判别函数 分类分类解决方法?解决方法?代入代入 判别判别第8页,本讲稿共92页 判别函数判别函数 可以有多种形式,哪种形式可以有多种形式,哪种形式最简单最简单呢?呢?线性函数线性函数 在二维空间是一条直线;在三维空间是一个在二维空间是一条直线;在三维空间是一个平面;在高维空间也是一个平面,由于是非平面;在高维空间也是一个平面,由于是非直观的,称为直观的,称为超平面超平面。第9页,本讲稿共92页 线性判别函数是所有模式特征的线性组合。线性判别函数是所有模式特征的线性组合。或或 式中
5、式中 是特征的系数,称为权,是特征的系数,称为权,称为阈值权。称为阈值权。用什么方法来确定用什么方法来确定 呢?呢?第10页,本讲稿共92页2.线性判别函数的确定方法线性判别函数的确定方法设有已知类别的两类别样本集,分布如下:设有已知类别的两类别样本集,分布如下:第11页,本讲稿共92页线性判别函数可以写成:线性判别函数可以写成:参数参数 决定了决定了 的方向和位置的方向和位置第12页,本讲稿共92页如何根据已知样本确定如何根据已知样本确定?由于要用由于要用 对两类样本在特征空间正确划对两类样本在特征空间正确划分两类模式的区域,我们可以假定一个规则:分两类模式的区域,我们可以假定一个规则:当样
6、本为一个类别时,当样本为一个类别时,使使 当样本为另一个类别时,使当样本为另一个类别时,使 第13页,本讲稿共92页 对全部样本都按这个规则来做,不满足时,对全部样本都按这个规则来做,不满足时,调整调整 ,最终可以找到一个,最终可以找到一个 ,使全,使全部样本都满足这个规则。部样本都满足这个规则。这个过程称为这个过程称为训练学习训练学习,已知类别的样本称,已知类别的样本称为为训练样本训练样本。用训练学习的方法确定线性判别函数。用训练学习的方法确定线性判别函数。如何训练学习?如何训练学习?第14页,本讲稿共92页3.线性判别函数的一般表示线性判别函数的一般表示 对于对于n维模式向量维模式向量 ,
7、其线性,其线性判别函数是所有模式特征的线性组合,即判别函数是所有模式特征的线性组合,即 可以写成可以写成其中其中,称为权向量。称为权向量。第15页,本讲稿共92页4.在向量空间的几何表示在向量空间的几何表示 取取 作为决策面。作为决策面。如果两个向量如果两个向量 和和 都在决策面上,则有:都在决策面上,则有:或写成或写成 由于由于 和和 是决策面上的任意两点,所以是决策面上的任意两点,所以 也是在决策面上的任意向量。也是在决策面上的任意向量。表明了什么?表明了什么?第16页,本讲稿共92页 两个两个n维向量相互正交的充要条件是两维向量相互正交的充要条件是两向量的内积为零。即向量的内积为零。即
8、所以所以,表明表明:权向量和决策面上的任一向量正交。所以权向量的权向量和决策面上的任一向量正交。所以权向量的方向就是决策面的法线方向。方向就是决策面的法线方向。第17页,本讲稿共92页 在两维模式下,决策面在两维模式下,决策面 把模式空间分成两个子空间,分把模式空间分成两个子空间,分别是对别是对 类的决策域类的决策域 和对和对 类的决策域类的决策域 。如果我们规定:如果我们规定:在在 中,中,;在;在 中,中,决策面的,决策面的法向量的方向指向法向量的方向指向 。第18页,本讲稿共92页 第19页,本讲稿共92页我们可以把向量我们可以把向量 表示为:表示为:待求的距离待求的距离 决策面决策面
9、上一点上一点 与与 有什么样的关系有什么样的关系?第20页,本讲稿共92页 则有:则有:或或判别函数值判别函数值 是是 到决策面的距离的度量。到决策面的距离的度量。第21页,本讲稿共92页同理,可以得出:同理,可以得出:从原点到决策面从原点到决策面 的距离为的距离为 。如果如果 ,原点在,原点在 的正面;的正面;如果如果 ,原点在,原点在 的反面;的反面;如果如果 ,判别函数有齐次形式,判别函数有齐次形式 决策面通过原点。决策面通过原点。第22页,本讲稿共92页二类模式的线性分类器的决策法则是:二类模式的线性分类器的决策法则是:如果如果 则决策则决策 ,即把,即把 归到归到 类;类;如果如果
10、则决策则决策 ,即把,即把 归到归到 类;类;对于线性判别函数,关键的问题是求对于线性判别函数,关键的问题是求如何求?如何求?第23页,本讲稿共92页2.2 2.2 感知准则函数和梯度下降法感知准则函数和梯度下降法1.感知准则函数感知准则函数 由前面介绍的知识,我们知道,由前面介绍的知识,我们知道,对于一组两类别样本集:对于一组两类别样本集:我们可以设线性判别函数为:我们可以设线性判别函数为:决策面方程为:决策面方程为:即即 第24页,本讲稿共92页 求得权向量求得权向量 ,就可确定决策面方程。,就可确定决策面方程。由数学知识,知由数学知识,知 的齐次形式比较容易。的齐次形式比较容易。能否将能
11、否将 变换成齐次形式呢?变换成齐次形式呢?令令 ,则,则,n维维X空间空间 (n+1)维)维Y空间空间 Y称为增广模式向量,称为增广模式向量,A称为增广权向量称为增广权向量 第25页,本讲稿共92页 经过这样的变换,求解的问题就变为:经过这样的变换,求解的问题就变为:设有一组两类模式的增广模式向量样本集,设有一组两类模式的增广模式向量样本集,利用这些样本确定一个线性判别函数利用这些样本确定一个线性判别函数的权向量的权向量 ,使,使 能够对能够对 正确分类。正确分类。第26页,本讲稿共92页训练规则为:训练规则为:对于属于对于属于 类的所有样本,有类的所有样本,有:对于属于对于属于 类的所有样本
12、,有类的所有样本,有:注意到注意到 和和能否使能否使?在属于在属于 类的样本前加上负号,则类的样本前加上负号,则第27页,本讲稿共92页这样处理后,问题变为:这样处理后,问题变为:求使对于所有训练样本都满足:求使对于所有训练样本都满足:,的权向量的权向量如何求如何求?是一个线性不等式组,而是一个线性不等式组,而 是是 维的,样本数量为维的,样本数量为 ,一般,一般 比比 大的多,大的多,这样,这样,的解不唯一。的解不唯一。第28页,本讲稿共92页 为了解线性不等式组为了解线性不等式组 ,需要构造一个准则,需要构造一个准则函数,并希望构造的准则函数有极值的形式。函数,并希望构造的准则函数有极值的
13、形式。是由于使用权向量是由于使用权向量 而被误分类的样本集合。而被误分类的样本集合。当一个样本当一个样本 被误分类时,就有被误分类时,就有 ,所以所以 。仅当。仅当 时,时,达到最小值。达到最小值。第29页,本讲稿共92页我们称我们称为为感知准则函数感知准则函数。有了准则函数之后,我们就可以用最优化方法寻找有了准则函数之后,我们就可以用最优化方法寻找使准则函数达到极小值的解权向量使准则函数达到极小值的解权向量 。如何求如何求?第30页,本讲稿共92页2.梯度下降法v 梯度的定义梯度的定义 梯度是函数梯度是函数 的一阶偏导数组成的向量的一阶偏导数组成的向量,记为记为v 二元函数的等值线二元函数的
14、等值线 定义定义:坐标面上函数相等的各点的连线叫等值线坐标面上函数相等的各点的连线叫等值线,也也称等高线。称等高线。第31页,本讲稿共92页 函数函数 为不同值时,得到一系列的等值线,构成为不同值时,得到一系列的等值线,构成 的的等值线族等值线族 。在极值处的等值线在极值处的等值线聚成一点,并位于等值聚成一点,并位于等值线的中心,当该中心为线的中心,当该中心为极小值时,离开它越远,极小值时,离开它越远,值越大,反之,若值越大,反之,若该中心为极大值时,离开该中心为极大值时,离开它越远,它越远,的值越小。的值越小。第32页,本讲稿共92页v 梯度方向梯度方向 由梯度的定义知,由梯度的定义知,梯度
15、的方向就是函数的法线的方向。梯度的方向就是函数的法线的方向。第33页,本讲稿共92页 梯度方向的性质梯度方向的性质:沿梯度方向,函数值增长最快,为最速沿梯度方向,函数值增长最快,为最速上升方向;上升方向;沿负梯度方向,函数值下降最快,为最沿负梯度方向,函数值下降最快,为最速下降方向。速下降方向。第34页,本讲稿共92页梯度下降法的基本思想:梯度下降法的基本思想:函数函数 在某点在某点 的梯度的梯度 是一个向量,它的方向是一个向量,它的方向与过点与过点 的等量面的等量面 的法线方向重合,指向的法线方向重合,指向 增加的一方,是准则函数变化率最大的方向。反之,负梯度的增加的一方,是准则函数变化率最
16、大的方向。反之,负梯度的方向则是函数方向则是函数 减少的最快的方向。所以在求准则函数减少的最快的方向。所以在求准则函数 的极小值时,的极小值时,沿负梯度方向搜索有可能最快的找到最小值。沿负梯度方向搜索有可能最快的找到最小值。第35页,本讲稿共92页梯度下降法的实现:梯度下降法的实现:先任意选择一个初始的权向量先任意选择一个初始的权向量 ,计算,计算 上的梯上的梯度度 ,从,从 出发在最陡方向(即负梯度方向)出发在最陡方向(即负梯度方向)上移动一个距离以得到下一个权向量上移动一个距离以得到下一个权向量 。可采用下面的迭代方法从可采用下面的迭代方法从 推出推出 。比例因子,叫做步长或增量比例因子,
17、叫做步长或增量 因为因为 的第的第 个梯度分量是个梯度分量是 。第36页,本讲稿共92页 所以,可得到梯度下降法的迭代公式:所以,可得到梯度下降法的迭代公式:当第当第 步迭代用权向量步迭代用权向量 来分类时被误分类的样本集合来分类时被误分类的样本集合 这种寻找解权向量的梯度下降法简述如下这种寻找解权向量的梯度下降法简述如下:把第把第 次的权向量加上被误分类的样本的和与某个常次的权向量加上被误分类的样本的和与某个常数数 的乘积,就得到第的乘积,就得到第 次的权向量。次的权向量。第37页,本讲稿共92页 优点:优点:只要二类样本线性可分的,这个算只要二类样本线性可分的,这个算法总可收敛。法总可收敛
18、。缺点:缺点:每次迭代必须遍历全部样本,才能每次迭代必须遍历全部样本,才能得到当前权向量得到当前权向量 下的误分样本集下的误分样本集 ,从而再对从而再对 的值进行修正。的值进行修正。第38页,本讲稿共92页用用训练样本集训练样本集求线性决策面方法要点:求线性决策面方法要点:v求线性决策面函数v转化成齐次形式v感知准则函数v梯度下降法v迭代公式第39页,本讲稿共92页2.3 固定增量算法及其收敛性 针对梯度下降法的缺点,作以下两点改变,得到针对梯度下降法的缺点,作以下两点改变,得到固定增量算法:固定增量算法:(1)把全部样本看作是一个序列,每当前一步迭)把全部样本看作是一个序列,每当前一步迭代的
19、权向量把某个样本错误分类时,就对这一个权代的权向量把某个样本错误分类时,就对这一个权向量作一次修正,而不是等当前权向量向量作一次修正,而不是等当前权向量 对全部样对全部样本计算后再找出错分类样本集本计算后再找出错分类样本集 去进行修改。去进行修改。(2)考虑每次迭代时)考虑每次迭代时 保持不变。保持不变。第40页,本讲稿共92页二类模式下用固定增量法求解权向量:二类模式下用固定增量法求解权向量:设设已已知知二二类类模模式式的的样样本本集集 和和 ,这这些些样样本本都都已已被被变变成成增增广广模模式式向向量量的的形形式式,要要求求用用固固定定增增量量的的方方法法决决定定一一个个超超平平面面 ,使
20、使它它能能正正确确划划分分样本集样本集 和和 。开开始始时时可可以以任任意意假假定定 和和 位位于于决决策策面面的的哪一边。同样可以任意选择广义向量哪一边。同样可以任意选择广义向量 的初始值的初始值 。然后把训练集然后把训练集 和和 中的增广模式向量中的增广模式向量 依次取出,计算依次取出,计算 与与 的内积的内积 。第41页,本讲稿共92页假定假定 在在 的正面,的正面,在它的反面在它的反面权向量权向量 用以下规则调整:用以下规则调整:v如果如果 ,而,而 ,则用,则用 代替代替 ;v如果如果 ,而,而 ,则用,则用 代替代替 ;v如果如果 ,而,而 ,则,则 保持不变。保持不变。v如果如果
21、 ,而,而 ,则,则 保持不变。保持不变。把属于把属于 和和 的全部模式都用上述方法处理一遍,的全部模式都用上述方法处理一遍,称为一次迭代。称为一次迭代。这个算法重复执行,直至权向量这个算法重复执行,直至权向量 不再变化,则不再变化,则 ,即求得解权向量,即求得解权向量 。第42页,本讲稿共92页 2.7 Fisher 线性判别函数 在应用统计方法进行模式识别时,许多问题在应用统计方法进行模式识别时,许多问题涉及维数,在低维空间行得通的方法,往往在高涉及维数,在低维空间行得通的方法,往往在高维空间行不通。因此,发展了一些降低特征空间维空间行不通。因此,发展了一些降低特征空间维数的方法,维数的方
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性 判别函数 优秀 课件
限制150内