模式识别第讲特征的选择与提取.ppt
《模式识别第讲特征的选择与提取.ppt》由会员分享,可在线阅读,更多相关《模式识别第讲特征的选择与提取.ppt(97页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、现在学习的是第1页,共97页第10讲 特征的选择与提取(2)现在学习的是第2页,共97页本节课主要内容n n1 1 类别可分离性判据类别可分离性判据n n2 2 特征提取特征提取n n3 3 特征选择特征选择现在学习的是第3页,共97页3 3 特征选择特征选择n n1 1 最优搜索算法最优搜索算法n n2 2 次优搜索法次优搜索法n n3 3 可分性判据的递推计算可分性判据的递推计算n n4.4.特征选择的几种新方法特征选择的几种新方法现在学习的是第4页,共97页n n 特征选择的任务是从一组数量为特征选择的任务是从一组数量为特征选择的任务是从一组数量为特征选择的任务是从一组数量为D D的特征
2、中选择出的特征中选择出 数量为数量为数量为数量为d d(DdDd)的一组最优特征来)的一组最优特征来)的一组最优特征来)的一组最优特征来.n n 利用穷举法总可以找出最优的特征集利用穷举法总可以找出最优的特征集利用穷举法总可以找出最优的特征集利用穷举法总可以找出最优的特征集,但计算量太但计算量太但计算量太但计算量太 大大.从从从从D D个特征中选取个特征中选取个特征中选取个特征中选取d d个个个个,共共 种组合。种组合。如如:若若D=20,d=10,D=20,d=10,则从则从则从则从D D个特征中选取个特征中选取d d个特征的个特征的个特征的个特征的组合数组合数组合数组合数q=184756,
3、对每一种组合需要计算判据值对每一种组合需要计算判据值对每一种组合需要计算判据值对每一种组合需要计算判据值J(x)J(x)最优特征的选择,要解决最优特征的选择,要解决两个问题两个问题两个问题两个问题:选择的标准选择的标准选择的标准选择的标准,这可以用类可分离性判据,这可以用类可分离性判据,这可以用类可分离性判据,这可以用类可分离性判据.确定一个较好的算法确定一个较好的算法确定一个较好的算法确定一个较好的算法,以便找出最优的特征集,以便找出最优的特征集,以便找出最优的特征集,以便找出最优的特征集.现在学习的是第5页,共97页本节主要讨论第二个问题,简单介绍几种优化算法本节主要讨论第二个问题,简单介
4、绍几种优化算法本节主要讨论第二个问题,简单介绍几种优化算法本节主要讨论第二个问题,简单介绍几种优化算法.自下而上法自下而上法 特征数从特征数从0逐步增加到逐步增加到d用优化算法进行特征选择的两种策略用优化算法进行特征选择的两种策略:自上而下法自上而下法 从特征数从从特征数从D开始逐步减少到开始逐步减少到d现在学习的是第6页,共97页1.1.最优搜索算法最优搜索算法到目前为止唯一能获得最优结果的搜索方法是到目前为止唯一能获得最优结果的搜索方法是到目前为止唯一能获得最优结果的搜索方法是到目前为止唯一能获得最优结果的搜索方法是“分支定界分支定界”算法,它是一种算法,它是一种算法,它是一种算法,它是一
5、种“自上而下自上而下自上而下自上而下”的方法,但具有回溯功能,的方法,但具有回溯功能,的方法,但具有回溯功能,的方法,但具有回溯功能,可使所有可能的特征组合都被考虑到。可使所有可能的特征组合都被考虑到。可使所有可能的特征组合都被考虑到。可使所有可能的特征组合都被考虑到。由于合理的组织搜索过程,使得有可能避免计算某些特由于合理的组织搜索过程,使得有可能避免计算某些特由于合理的组织搜索过程,使得有可能避免计算某些特由于合理的组织搜索过程,使得有可能避免计算某些特征组合而不影响结果为最优。征组合而不影响结果为最优。征组合而不影响结果为最优。征组合而不影响结果为最优。整个搜索过程可用树来表示整个搜索过
6、程可用树来表示整个搜索过程可用树来表示整个搜索过程可用树来表示树的根结点表示原始特征集树的根结点表示原始特征集树的根结点表示原始特征集树的根结点表示原始特征集,其他结点表示从其父结点所其他结点表示从其父结点所其他结点表示从其父结点所其他结点表示从其父结点所代表的特征子集中去掉某一特征后所得到的特征子集代表的特征子集中去掉某一特征后所得到的特征子集代表的特征子集中去掉某一特征后所得到的特征子集代表的特征子集中去掉某一特征后所得到的特征子集,结点结点结点结点上的标号是去掉的特征的编号上的标号是去掉的特征的编号上的标号是去掉的特征的编号上的标号是去掉的特征的编号.现在学习的是第7页,共97页分支定界
7、法的搜索树示意图分支定界法的搜索树示意图(D=6(D=6(D=6(D=6,d=2)d=2)X根结点根结点根结点根结点:原始特征集原始特征集原始特征集原始特征集结点标号结点标号结点标号结点标号:去掉的特征去掉的特征去掉的特征去掉的特征35 645 6654253466 6545566665345544321每一结点表示去掉若干每一结点表示去掉若干每一结点表示去掉若干每一结点表示去掉若干特征后得到的子集特征后得到的子集特征后得到的子集特征后得到的子集.从左到右同一级结点对从左到右同一级结点对从左到右同一级结点对从左到右同一级结点对应的特征子集的类可分应的特征子集的类可分应的特征子集的类可分应的特征
8、子集的类可分性判据值递增性判据值递增性判据值递增性判据值递增.说明说明说明说明现在学习的是第8页,共97页分支定界法之所以有效分支定界法之所以有效,这主要是利用了可分离性判据这主要是利用了可分离性判据的单调性,即对有包含关系的特征组的单调性,即对有包含关系的特征组 A Ak k,k=1=1,2,I I,即有:,即有:,即有:,即有:可分性判据满足:可分性判据满足:现在学习的是第9页,共97页2.2.次优搜索法次优搜索法最优搜索法在有些情况下计算量太大而难以实现,这时最优搜索法在有些情况下计算量太大而难以实现,这时不得不放弃最优解而采取计算量较小的次优搜索方法。不得不放弃最优解而采取计算量较小的
9、次优搜索方法。下面我们介绍一些不同的算法,面对实际问题时可灵活下面我们介绍一些不同的算法,面对实际问题时可灵活选择。选择。(1 1)单独最优特征组合)单独最优特征组合最简单的方法是计算各特征单独使用时的判据值并加以排队,最简单的方法是计算各特征单独使用时的判据值并加以排队,取前取前d d个作为选择结果。但我们需要注意的是,即使各特征是个作为选择结果。但我们需要注意的是,即使各特征是统计独立的,这一结果也不一定就是最优结果。统计独立的,这一结果也不一定就是最优结果。只有当可分性判据只有当可分性判据J可写为如下两种形式时,这种方法才可写为如下两种形式时,这种方法才能选出一组最优的特征来:能选出一组
10、最优的特征来:现在学习的是第10页,共97页(2 2)顺序前进法()顺序前进法()顺序前进法()顺序前进法(SFSSFS)这是最简单的这是最简单的这是最简单的这是最简单的“自下而上自下而上自下而上自下而上”的搜索方法。每次从未入选的的搜索方法。每次从未入选的的搜索方法。每次从未入选的的搜索方法。每次从未入选的特征中选择一个特征,使得它与已入选的特征组合在一起特征中选择一个特征,使得它与已入选的特征组合在一起特征中选择一个特征,使得它与已入选的特征组合在一起特征中选择一个特征,使得它与已入选的特征组合在一起时所得判据时所得判据时所得判据时所得判据J J值为最大,直到特征数增加到值为最大,直到特征
11、数增加到值为最大,直到特征数增加到值为最大,直到特征数增加到d d d d为止为止为止为止现在学习的是第11页,共97页(3 3 3 3)顺序后退法()顺序后退法()顺序后退法()顺序后退法(SBSSBS)它与顺序前进法的思路刚好相反。这是一种它与顺序前进法的思路刚好相反。这是一种它与顺序前进法的思路刚好相反。这是一种它与顺序前进法的思路刚好相反。这是一种“自上而下自上而下自上而下自上而下”的方法,从全体特征开始每次剔除一个,所剔除的特征应的方法,从全体特征开始每次剔除一个,所剔除的特征应的方法,从全体特征开始每次剔除一个,所剔除的特征应的方法,从全体特征开始每次剔除一个,所剔除的特征应使仍然
12、保留的特征组的判据使仍然保留的特征组的判据使仍然保留的特征组的判据使仍然保留的特征组的判据J值最大,直到特征数减少到值最大,直到特征数减少到值最大,直到特征数减少到值最大,直到特征数减少到d d为止。为止。为止。为止。和顺序前进法比较,该方法用两个特点:一是在计算过程中可和顺序前进法比较,该方法用两个特点:一是在计算过程中可和顺序前进法比较,该方法用两个特点:一是在计算过程中可和顺序前进法比较,该方法用两个特点:一是在计算过程中可以估计每去掉一个特征所造成可分性的降低;二是由于它的计以估计每去掉一个特征所造成可分性的降低;二是由于它的计以估计每去掉一个特征所造成可分性的降低;二是由于它的计以估
13、计每去掉一个特征所造成可分性的降低;二是由于它的计算是在高维空间中进行的,所以计算量比较大。算是在高维空间中进行的,所以计算量比较大。算是在高维空间中进行的,所以计算量比较大。算是在高维空间中进行的,所以计算量比较大。现在学习的是第12页,共97页比方说,在第比方说,在第比方说,在第比方说,在第k k步可先用步可先用步可先用步可先用SFSSFS法一个个加入特征到法一个个加入特征到法一个个加入特征到法一个个加入特征到 k+l k+l 个,个,个,个,然后再用然后再用然后再用然后再用SBSSBS法一个个剔去法一个个剔去法一个个剔去法一个个剔去 r 个特征,我们把这样一种算法个特征,我们把这样一种算
14、法个特征,我们把这样一种算法个特征,我们把这样一种算法叫增叫增叫增叫增 l l 减减减减 r r 法(法(法(法(lr lr 法)法)(4)增)增 l 减减减减 r r 法(法(法(法(lr lr 法)法)法)法)这种方法是基于前两种算法的特点提出的这种方法是基于前两种算法的特点提出的这种方法是基于前两种算法的特点提出的这种方法是基于前两种算法的特点提出的.为了避免前面为了避免前面方法的一旦被选入方法的一旦被选入(或剔除或剔除或剔除或剔除)就不能再剔除就不能再剔除就不能再剔除就不能再剔除(或选入或选入或选入或选入)的缺点可的缺点可的缺点可的缺点可在选择过程中加入局部回溯过程。在选择过程中加入局
15、部回溯过程。在选择过程中加入局部回溯过程。在选择过程中加入局部回溯过程。现在学习的是第13页,共97页3.3.可分性判据的递推计算可分性判据的递推计算所有上述搜索算法都有一个共同点,即第所有上述搜索算法都有一个共同点,即第所有上述搜索算法都有一个共同点,即第所有上述搜索算法都有一个共同点,即第 k k 步特征组是在步特征组是在步特征组是在步特征组是在第第第第 k k1 1 1 1 步特征组上加入或剔除某些特征来构成的,因此我步特征组上加入或剔除某些特征来构成的,因此我步特征组上加入或剔除某些特征来构成的,因此我步特征组上加入或剔除某些特征来构成的,因此我们可以分析一下,是否有可能从们可以分析一
16、下,是否有可能从们可以分析一下,是否有可能从们可以分析一下,是否有可能从 k1 1 1 1 步的判据值步的判据值步的判据值步的判据值 J(k-1)J(k-1)推算出推算出 J(k),J(k),J(k),J(k),而不必完全重新计算而不必完全重新计算而不必完全重新计算而不必完全重新计算.事实上,对于有些情况,对于这些判据递推关系是存在的,事实上,对于有些情况,对于这些判据递推关系是存在的,事实上,对于有些情况,对于这些判据递推关系是存在的,事实上,对于有些情况,对于这些判据递推关系是存在的,即求即求即求即求J(k)J(k)J(k)J(k)时可在时可在时可在时可在 J(k-1)J(k-1)J(k-
17、1)J(k-1)的基础上把新加入(或剔除)特征的的基础上把新加入(或剔除)特征的的基础上把新加入(或剔除)特征的的基础上把新加入(或剔除)特征的影响加进去即可,不必从头算起,这样就大大简化了计算影响加进去即可,不必从头算起,这样就大大简化了计算影响加进去即可,不必从头算起,这样就大大简化了计算影响加进去即可,不必从头算起,这样就大大简化了计算工作工作工作工作.现在学习的是第14页,共97页我们注意到在进行特征选择时需要以可分性判据来度量特征我们注意到在进行特征选择时需要以可分性判据来度量特征我们注意到在进行特征选择时需要以可分性判据来度量特征我们注意到在进行特征选择时需要以可分性判据来度量特征
18、选择的好坏选择的好坏选择的好坏选择的好坏.特征选择是一个组合优化问题特征选择是一个组合优化问题特征选择是一个组合优化问题特征选择是一个组合优化问题,因此可以使用解因此可以使用解因此可以使用解因此可以使用解决优化问题的方法来解决特征选择问题决优化问题的方法来解决特征选择问题决优化问题的方法来解决特征选择问题决优化问题的方法来解决特征选择问题.优化问题是很多研究人员关注的一个热点问题,近年来出现了优化问题是很多研究人员关注的一个热点问题,近年来出现了优化问题是很多研究人员关注的一个热点问题,近年来出现了优化问题是很多研究人员关注的一个热点问题,近年来出现了一些有特色的解决方法一些有特色的解决方法一
19、些有特色的解决方法一些有特色的解决方法,如如如如:1)1)1)1)模拟退火算法模拟退火算法2)2)2)2)遗传算法遗传算法遗传算法遗传算法3)Tabu3)Tabu3)Tabu3)Tabu搜索算法搜索算法4.4.特征选择的几种新方法特征选择的几种新方法现在学习的是第15页,共97页来源于统计力学。材料粒子从高温开始,非常缓慢地来源于统计力学。材料粒子从高温开始,非常缓慢地降温降温(退火退火),粒子就可在每个温度下达到热平衡。假,粒子就可在每个温度下达到热平衡。假设材料在设材料在状态状态状态状态i i的能量为的能量为的能量为的能量为 E(i),那么材料在,那么材料在,那么材料在,那么材料在温度温度
20、温度温度 T T时时时时从状从状态态i进入状态进入状态j遵循如下规律遵循如下规律遵循如下规律遵循如下规律1)1)模拟退火算法模拟退火算法模拟退火算法模拟退火算法如果如果如果如果 E(j)E(i)E(j)E(i),接受该状态被转换。,接受该状态被转换。,接受该状态被转换。,接受该状态被转换。如果如果 E(j)E(i)E(j)E(i),则状态转换以如下概率被接受:,则状态转换以如下概率被接受:,则状态转换以如下概率被接受:,则状态转换以如下概率被接受:现在学习的是第16页,共97页1)1)1)1)模拟退火算法模拟退火算法模拟退火算法模拟退火算法模拟退火优化法:模拟退火优化法:模拟退火优化法:模拟退
21、火优化法:f f :xR:xR+,其中其中xS,表示优化问题的一个可行解。,表示优化问题的一个可行解。N(x)SN(x)S 表示表示表示表示x x的一个邻域集合。的一个邻域集合。的一个邻域集合。的一个邻域集合。现在学习的是第17页,共97页首先给定初始温度首先给定初始温度首先给定初始温度首先给定初始温度T T0 0和初始解和初始解和初始解和初始解 x(0)x(0),以概率,以概率,以概率,以概率P P生成下一个新生成下一个新生成下一个新生成下一个新解解解解x x 1)1)1)1)模拟退火算法模拟退火算法模拟退火算法模拟退火算法对于温度对于温度对于温度对于温度T Ti i和该优化问题的解和该优化
22、问题的解和该优化问题的解和该优化问题的解x(k)x(k),可以生成新解,可以生成新解,可以生成新解,可以生成新解xx经过多次转换,降低温度得到经过多次转换,降低温度得到 T T i+1i+1 dY空间空间 D 维维原始特征集原始特征集Y空间空间 d 维维新特征集新特征集变换变换确定变换的依据确定变换的依据确定变换的依据确定变换的依据:类别可分性判据类别可分性判据目标目标目标目标:在新的特征空间中在新的特征空间中在新的特征空间中在新的特征空间中,各类之间容易区分各类之间容易区分.2 特征提取特征提取现在学习的是第62页,共97页 根据前面提到的类别可分离性判据。我们可以依据这些判据根据前面提到的
23、类别可分离性判据。我们可以依据这些判据进行特征的提取。进行特征的提取。设原特征向量设原特征向量 ,对,对 作线性变换,产生作线性变换,产生 d d 维向量维向量 ,即,即 矩阵矩阵 称为特征提取矩阵或变换矩阵,称为特征提取矩阵或变换矩阵,称为二次特征。称为二次特征。现在学习的是第63页,共97页 s s阶阶MinkowskiMinkowski度量度量多维空间中两个向量之间有多种距离度量多维空间中两个向量之间有多种距离度量 欧氏距离欧氏距离在在MinkowskiMinkowski度量中,令度量中,令s=2s=2,得到常用的欧氏距离:,得到常用的欧氏距离:1.1.按欧氏距离度量的特征提取方法按欧氏
24、距离度量的特征提取方法现在学习的是第64页,共97页 Chebychev Chebychev距离距离:棋盘距离棋盘距离 Mahalanobis Mahalanobis距离距离:式中式中Q Q是给定的正定标尺矩阵是给定的正定标尺矩阵现在学习的是第65页,共97页在实际应用中,在计算的复杂性方面,在是否便于进行在实际应用中,在计算的复杂性方面,在是否便于进行解析分析以及用它进行特征提取的效果方面都各不相同。解析分析以及用它进行特征提取的效果方面都各不相同。由于欧氏距离在很多情况下便于分析和计算由于欧氏距离在很多情况下便于分析和计算.前面已经推导出了基于欧氏距离的一种度量函数,前面已经推导出了基于欧
25、氏距离的一种度量函数,其中其中S Sb b为类间离散度矩阵为类间离散度矩阵,S,Sw为类内离散度矩阵为类内离散度矩阵.同样的,我们还可以提出下面各种判据:同样的,我们还可以提出下面各种判据:现在学习的是第66页,共97页以以J J2 2为例为例,特征提取的步骤如下特征提取的步骤如下 作线性映射:作线性映射:其中其中其中其中Y为为D D维原始特征向量;维原始特征向量;X X为为d d维压缩后的特征向量维压缩后的特征向量维压缩后的特征向量维压缩后的特征向量 令令其中其中其中其中S Sw w,Sb b为原空间(即为原空间(即为原空间(即为原空间(即Y的)离散度矩阵,的)离散度矩阵,S S*w w,S
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 特征 选择 提取
限制150内