第六章模式特征的选择与提取精选文档.ppt
《第六章模式特征的选择与提取精选文档.ppt》由会员分享,可在线阅读,更多相关《第六章模式特征的选择与提取精选文档.ppt(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章模式特征的选择与提取1 1本讲稿第一页,共三十一页内容目录内容目录第六章第六章第六章第六章 特征抽取与选择特征抽取与选择特征抽取与选择特征抽取与选择 6.1 特征抽取和选择的基本概念特征抽取和选择的基本概念 3245 6.2 类别可分离性判据类别可分离性判据6.3 特征抽取方法特征抽取方法 6.4 特征选择方法特征选择方法6.5 讨论讨论1模式识别本讲稿第二页,共三十一页6.1 特征抽取和选择的基本概念 l特征的选择与提取是模式识别中重要而困难的一个特征的选择与提取是模式识别中重要而困难的一个特征的选择与提取是模式识别中重要而困难的一个特征的选择与提取是模式识别中重要而困难的一个环节:环
2、节:环节:环节:n n分析各种特征的有效性并选出最有代表性的特征是模式分析各种特征的有效性并选出最有代表性的特征是模式分析各种特征的有效性并选出最有代表性的特征是模式分析各种特征的有效性并选出最有代表性的特征是模式识别的关键一步识别的关键一步识别的关键一步识别的关键一步n n降低特征维数在很多情况下是有效设计分类器的重要课题降低特征维数在很多情况下是有效设计分类器的重要课题降低特征维数在很多情况下是有效设计分类器的重要课题降低特征维数在很多情况下是有效设计分类器的重要课题l l三大类特征:三大类特征:三大类特征:三大类特征:物理、结构和数学特征物理、结构和数学特征物理、结构和数学特征物理、结构
3、和数学特征n n物理和结构特征物理和结构特征物理和结构特征物理和结构特征:易于为人的直觉感知,但有时难于定量易于为人的直觉感知,但有时难于定量易于为人的直觉感知,但有时难于定量易于为人的直觉感知,但有时难于定量描述,因而不易用于机器判别描述,因而不易用于机器判别描述,因而不易用于机器判别描述,因而不易用于机器判别n n数学特征数学特征数学特征数学特征:易于用机器定量描述和判别,如基于统计的易于用机器定量描述和判别,如基于统计的易于用机器定量描述和判别,如基于统计的易于用机器定量描述和判别,如基于统计的特征特征特征特征本讲稿第三页,共三十一页特征的形成l特征形成特征形成(acquisition)
4、:n n信号获取或测量信号获取或测量原始测量原始测量n n原始特征原始特征l实例:实例:n n数字图象中的各像素灰度值数字图象中的各像素灰度值n n人体的各种生理指标人体的各种生理指标l l原始特征分析:原始特征分析:原始特征分析:原始特征分析:n n原始测量不能反映对象本质原始测量不能反映对象本质n n高维原始特征不利于分类器设计:计算量大,冗高维原始特征不利于分类器设计:计算量大,冗余,样本分布十分稀疏余,样本分布十分稀疏引言引言本讲稿第四页,共三十一页特征的选择与提取特征的选择与提取l l两类提取有效信息、压缩特征空间的方法:特征提取和两类提取有效信息、压缩特征空间的方法:特征提取和两类
5、提取有效信息、压缩特征空间的方法:特征提取和两类提取有效信息、压缩特征空间的方法:特征提取和特征选择特征选择特征选择特征选择l特征提取特征提取特征提取特征提取 (extraction)(extraction):用映射(或变换)的方法把原用映射(或变换)的方法把原用映射(或变换)的方法把原用映射(或变换)的方法把原始特征变换为较少的新特征始特征变换为较少的新特征始特征变换为较少的新特征始特征变换为较少的新特征l特征选择特征选择特征选择特征选择(selection)(selection):从原始特征中挑选出一些最有代从原始特征中挑选出一些最有代从原始特征中挑选出一些最有代从原始特征中挑选出一些最有
6、代表性,分类性能最好的特征表性,分类性能最好的特征表性,分类性能最好的特征表性,分类性能最好的特征l l特征的选择与提取与具体问题有很大关系,目前没有理特征的选择与提取与具体问题有很大关系,目前没有理特征的选择与提取与具体问题有很大关系,目前没有理特征的选择与提取与具体问题有很大关系,目前没有理论能给出对任何问题都有效的特征选择与提取方法论能给出对任何问题都有效的特征选择与提取方法论能给出对任何问题都有效的特征选择与提取方法论能给出对任何问题都有效的特征选择与提取方法引言引言本讲稿第五页,共三十一页特征的选择与提取举例l l细胞自动识别:细胞自动识别:细胞自动识别:细胞自动识别:n n原始测量
7、:(正常与异常)细胞的数字图像原始测量:(正常与异常)细胞的数字图像n n原始特征(特征的形成,找到一组代表细胞性质原始特征(特征的形成,找到一组代表细胞性质的特征):细胞面积,胞核面积,形状系数,光的特征):细胞面积,胞核面积,形状系数,光密度,核内纹理,和浆比密度,核内纹理,和浆比n n压缩特征:原始特征的维数仍很高,需压缩以便压缩特征:原始特征的维数仍很高,需压缩以便于分类于分类l l特征选择:挑选最有分类信息的特征特征选择:挑选最有分类信息的特征特征选择:挑选最有分类信息的特征特征选择:挑选最有分类信息的特征l l特征提取:数学变换特征提取:数学变换特征提取:数学变换特征提取:数学变换
8、n n傅立叶变换或小波变换傅立叶变换或小波变换傅立叶变换或小波变换傅立叶变换或小波变换n n用用用用PCAPCA方法(主元分析法)作特征压缩方法(主元分析法)作特征压缩方法(主元分析法)作特征压缩方法(主元分析法)作特征压缩引言引言本讲稿第六页,共三十一页6.2 类别可分离性判据l l类别可分离性判据类别可分离性判据类别可分离性判据类别可分离性判据:衡量不同特征及其组合对分类是否有衡量不同特征及其组合对分类是否有衡量不同特征及其组合对分类是否有衡量不同特征及其组合对分类是否有效的定量准则效的定量准则效的定量准则效的定量准则l l理想准则:理想准则:理想准则:理想准则:某组特征使分类器错误概率最
9、小某组特征使分类器错误概率最小某组特征使分类器错误概率最小某组特征使分类器错误概率最小l l实际的类别可分离性判据应满足的条件:实际的类别可分离性判据应满足的条件:实际的类别可分离性判据应满足的条件:实际的类别可分离性判据应满足的条件:n n度量特性:度量特性:度量特性:度量特性:n n与错误率有单调关系与错误率有单调关系与错误率有单调关系与错误率有单调关系n n当特征独立时有可加性:当特征独立时有可加性:当特征独立时有可加性:当特征独立时有可加性:n n单调性:单调性:单调性:单调性:l l常见类别可分离性判据:基于距离、概率分布、熵函数常见类别可分离性判据:基于距离、概率分布、熵函数常见类
10、别可分离性判据:基于距离、概率分布、熵函数常见类别可分离性判据:基于距离、概率分布、熵函数本讲稿第七页,共三十一页6.2.1基于距离的可分性判据l类间可分性类间可分性:=所有样本间的平均距离:所有样本间的平均距离:可分性可分性判据判据squared Euclidian类内平均距离类间距离本讲稿第八页,共三十一页基于距离的可分性判据矩阵形式可分性判可分性判据据基于距离的准则概念直观,计算方便,但与错误率没有直接联系样本类间样本类间样本类间样本类间离散度矩阵离散度矩阵离散度矩阵离散度矩阵样本类内样本类内样本类内样本类内离散度矩阵离散度矩阵离散度矩阵离散度矩阵类间可分离性类间可分离性类间可分离性类间
11、可分离性判据判据判据判据本讲稿第九页,共三十一页6.2.2基于概率的可分性判据l基于概率的可分性判据:用概率密度函数间基于概率的可分性判据:用概率密度函数间的距离来度量的距离来度量可分性可分性判据判据l散度:散度:本讲稿第十页,共三十一页正态分布的散度可分性可分性判据判据Mahalanobis本讲稿第十一页,共三十一页6.2.3基于熵函数的可分性判据l熵函数:熵函数:可分性可分性判据判据lShannon熵:熵:l平方平方熵:熵:l熵函数期望表征类别的分离程度:熵函数期望表征类别的分离程度:本讲稿第十二页,共三十一页类别可分离性判据应用举例l图像分割:图像分割:Otsu灰度图像阈值算法灰度图像阈
12、值算法(Otsu thresholding)l图像有图像有L阶灰度,阶灰度,ni i是灰度为是灰度为i的像素数,图像的像素数,图像总像素数总像素数 N=n1 1+n2 2+nL Ln n灰度为灰度为i的像素概率:的像素概率:pi i=ni i/Nn n类间方差:类间方差:可分性可分性判据判据本讲稿第十三页,共三十一页Otsu thresholdingl灰度图像阈值灰度图像阈值:可分性可分性判据判据lOtsu灰度图像二值化算法演示及程序分析灰度图像二值化算法演示及程序分析:本讲稿第十四页,共三十一页6.3 特征抽取方法l特征提取特征提取:用映射(或变换)的方法把原始用映射(或变换)的方法把原始特
13、征变换为较少的新特征特征变换为较少的新特征lPCA(Principle Component Analysis)PCA(Principle Component Analysis)方法:方法:进行特征降维变换,不能完全地表示原有的进行特征降维变换,不能完全地表示原有的对象,能量总会有损失。希望找到一种能量对象,能量总会有损失。希望找到一种能量最为集中的的变换方法使损失最小最为集中的的变换方法使损失最小lK-L(Karhunen-Loeve)K-L(Karhunen-Loeve)变换:变换:最优正交线性最优正交线性变换,相应的特征提取方法被称为变换,相应的特征提取方法被称为PCA方法方法本讲稿第十五
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六 模式 特征 选择 提取 精选 文档
限制150内