模式识别 第七章 特征提取与选择精选文档.ppt
《模式识别 第七章 特征提取与选择精选文档.ppt》由会员分享,可在线阅读,更多相关《模式识别 第七章 特征提取与选择精选文档.ppt(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、模式识别 第七章 特征提取与选择1本讲稿第一页,共四十九页第七章第七章 特征提取与选择特征提取与选择 7.1 7.1 概概 述述2本讲稿第二页,共四十九页 模式识别的三大核心问题模式识别的三大核心问题:第七章第七章 特征提取与选择特征提取与选择7.1概述概述特征数据采集特征数据采集分类识别分类识别特征提取与选择特征提取与选择 分类识别的正确率取决于对象的表示、训练学习和分类识别的正确率取决于对象的表示、训练学习和分类识别算法,我们在前面各章的介绍中详细讨论了后分类识别算法,我们在前面各章的介绍中详细讨论了后两方面的内容。本章介绍的特征提取与选择问题则是对两方面的内容。本章介绍的特征提取与选择问
2、题则是对象表示的一个关键问题。象表示的一个关键问题。3本讲稿第三页,共四十九页 通常在得到实际对象的若干具体特征之后,通常在得到实际对象的若干具体特征之后,再由这些原始特征产生出对分类识别最有效、再由这些原始特征产生出对分类识别最有效、数目最少的特征,这就是特征提取与选择的任数目最少的特征,这就是特征提取与选择的任务。从本质上讲,我们的目的是使在最小维数务。从本质上讲,我们的目的是使在最小维数特征空间中异类模式点相距较远(类间距离较特征空间中异类模式点相距较远(类间距离较大),而同类模式点相距较近(类内距离较小)大),而同类模式点相距较近(类内距离较小)。第七章第七章 特征提取与选择特征提取与
3、选择7.1概述概述4本讲稿第四页,共四十九页7.1概述概述特征提取与选择的两个基本途径特征提取与选择的两个基本途径主要方法有:主要方法有:分支定界法分支定界法、用回归建模技术确定相关特用回归建模技术确定相关特征征等方法。等方法。(1 1)直接选择法:)直接选择法:当实际用于分类识别的特征数目当实际用于分类识别的特征数目d d 确定后,确定后,直接从已获得的直接从已获得的n n 个原始特征中选出个原始特征中选出d d 个特征个特征 ,使可分性判据,使可分性判据J J 的值满足下式:的值满足下式:式中式中 是是n 个原始特征中的任意个原始特征中的任意d 个特征,个特征,上式表示直接寻找上式表示直接
4、寻找n 维特征空间中的维特征空间中的d 维子空间。维子空间。5本讲稿第五页,共四十九页(2 2)变换法)变换法,在使判据,在使判据J J 取最大的目标下,对取最大的目标下,对n n 个原个原始特征进行变换降维,即对原始特征进行变换降维,即对原n n 维特征空间进行坐标维特征空间进行坐标变换,然后再取子空间。变换,然后再取子空间。7.1概述概述特征提取与选择的两个基本途径特征提取与选择的两个基本途径主要方法有:主要方法有:基于可分性判据的特征选择基于可分性判据的特征选择、基于误判概率基于误判概率的特征选择的特征选择、离散离散K-LK-L变换法变换法(DKLT)(DKLT)、基于决策界的特基于决策
5、界的特征选择征选择等方法。等方法。6本讲稿第六页,共四十九页7.2 7.2 类别可分性判据类别可分性判据第七章第七章 特征提取与选择特征提取与选择7本讲稿第七页,共四十九页7.2 类别可分性判据类别可分性判据 为确立特征提取和选择的准则:引入类别可分性判据,来为确立特征提取和选择的准则:引入类别可分性判据,来刻划特征对分类的贡献。为此希望所构造的可分性判据满足刻划特征对分类的贡献。为此希望所构造的可分性判据满足下列要求:下列要求:构造可分性判据构造可分性判据(1)(1)与误判概率与误判概率(或误分概率的上界、下界或误分概率的上界、下界)有单调关系。有单调关系。(2)(2)当特征相互独立时,判据
6、有可加性,即当特征相互独立时,判据有可加性,即 :式中,式中,是对不同种类特征的测量值,是对不同种类特征的测量值,表示使用括号中特征时第表示使用括号中特征时第i 类与第类与第j类可分性判据函数。类可分性判据函数。8本讲稿第八页,共四十九页7.2 类别可分性判据类别可分性判据构造可分性判据构造可分性判据(3)(3)判据具有判据具有“距离距离”的某些特性,即的某些特性,即 :,当,当时;时;,当,当时;时;(4)(4)对特征数目是单调不减,即加入新的特征后,判据对特征数目是单调不减,即加入新的特征后,判据值不减。值不减。9本讲稿第九页,共四十九页7.2 类别可分性判据类别可分性判据构造可分性判据构
7、造可分性判据值得注意的是值得注意的是:上述的构造可分性判据的要求,即:上述的构造可分性判据的要求,即“单调单调性性”、“叠加性叠加性”、“距离性距离性”、“单调不减性单调不减性”。在。在实际应用并不一定能同时具备,但并不影响它在实际实际应用并不一定能同时具备,但并不影响它在实际使用中的价值。使用中的价值。10本讲稿第十页,共四十九页7.2 类别可分性判据类别可分性判据7.2.17.2.1基于几何距离的可分性判据基于几何距离的可分性判据一般来讲,不同类的模式可以被区分是由于它们所属类一般来讲,不同类的模式可以被区分是由于它们所属类别在特征空间中的类域是不同的区域。别在特征空间中的类域是不同的区域
8、。显然,区域重叠的部分越小或完全没有重叠,类别的显然,区域重叠的部分越小或完全没有重叠,类别的可分性就越好。可分性就越好。因此可以用距离或离差测度(散度)来构造类别的可分因此可以用距离或离差测度(散度)来构造类别的可分性判据。性判据。11本讲稿第十一页,共四十九页(一一)点与点的距离点与点的距离 (二二)点到点集的距离点到点集的距离用用均方欧氏距离均方欧氏距离表示表示7.2.17.2.1基于几何距离的可分性判据基于几何距离的可分性判据12本讲稿第十二页,共四十九页(三三)类内及总体的均值矢量类内及总体的均值矢量 各类模式的总体均值矢量各类模式的总体均值矢量 类的均值矢量:类的均值矢量:为相应类
9、的先验概率,为相应类的先验概率,当用统计量代替先验概当用统计量代替先验概率时,总体均值矢量可表示为:率时,总体均值矢量可表示为:7.2.17.2.1基于几何距离的可分性判据基于几何距离的可分性判据13本讲稿第十三页,共四十九页(四四)类内距离类内距离 类内均方欧氏距离类内均方欧氏距离 类内均方距离也可定义为:类内均方距离也可定义为:7.2.17.2.1基于几何距离的可分性判据基于几何距离的可分性判据14本讲稿第十四页,共四十九页(五五)类内离差矩阵类内离差矩阵 显然显然(六六)两类之间的距离两类之间的距离 7.2.17.2.1基于几何距离的可分性判据基于几何距离的可分性判据15本讲稿第十五页,
10、共四十九页(七七)各类模式之间的总的均方距离各类模式之间的总的均方距离 当取欧氏距离时,总的均方距离为当取欧氏距离时,总的均方距离为7.2.17.2.1基于几何距离的可分性判据基于几何距离的可分性判据16本讲稿第十六页,共四十九页(八八)多类情况下总的类内、类间及总体离差矩阵多类情况下总的类内、类间及总体离差矩阵 类内离差类内离差类间离差类间离差总体离差总体离差 易导出易导出7.2.17.2.1基于几何距离的可分性判据基于几何距离的可分性判据17本讲稿第十七页,共四十九页7.2.17.2.1基于几何距离的可分性判据基于几何距离的可分性判据18本讲稿第十八页,共四十九页7.2.17.2.1基于几
11、何距离的可分性判据基于几何距离的可分性判据在特征空间中,当类内模式较密聚,而不同类的模式相距在特征空间中,当类内模式较密聚,而不同类的模式相距较远时,从直觉上我们知道分类就较容易,由各判据的构较远时,从直觉上我们知道分类就较容易,由各判据的构造可知,这种情况下所算得的判据值也较大。由判据的构造可知,这种情况下所算得的判据值也较大。由判据的构造我们还可以初步了解运用这类判据的原则和方法。造我们还可以初步了解运用这类判据的原则和方法。19本讲稿第十九页,共四十九页7.2 7.2 类别可分性判据类别可分性判据7.2.27.2.2基于类的概率密度函数的可分性判据基于类的概率密度函数的可分性判据考虑两类
12、问题。上图是一维的两类概率分布密度。考虑两类问题。上图是一维的两类概率分布密度。(a)(a)表示两类是完全可分的。表示两类是完全可分的。(b)(b)是完全不可分的。是完全不可分的。20本讲稿第二十页,共四十九页可用两类概密函数的重叠程度来度量可分性,构可用两类概密函数的重叠程度来度量可分性,构造基于类概密的可分性判据。此处的所谓重叠程度是造基于类概密的可分性判据。此处的所谓重叠程度是指两个概密函数相似的程度。指两个概密函数相似的程度。7.2.27.2.2基于类的概率密度函数的可分性判据基于类的概率密度函数的可分性判据21本讲稿第二十一页,共四十九页7.2.27.2.2基于类的概率密度函数的可分
13、性判据基于类的概率密度函数的可分性判据(一一)BhattacharyyaBhattacharyya 判据判据(J JB B)受相关概念与应用的启发,我们可以构造受相关概念与应用的启发,我们可以构造B-判判据,它的计算式为据,它的计算式为 W W-=xdxpxpJBr rr rr r2121)()(ln 式中式中W W表示特征空间。在最小误判概率准则下,误判表示特征空间。在最小误判概率准则下,误判概率有概率有 BJPPeP-exp)()()(21210 22本讲稿第二十二页,共四十九页7.2.27.2.2基于类的概率密度函数的可分性判据基于类的概率密度函数的可分性判据(二)(二)Chernoff
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 第七章 特征提取与选择精选文档 第七 特征 提取 选择 精选 文档
限制150内