特征选择和特征提取.ppt
《特征选择和特征提取.ppt》由会员分享,可在线阅读,更多相关《特征选择和特征提取.ppt(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 模式识别原理与应用模式识别原理与应用 专专 业:业:模式识别与智能系统模式识别与智能系统 学生姓名:学生姓名:*任课教师:任课教师:余老师余老师一、基本概念u特征的选择与提取特征的选择与提取是模式识别中重要而困是模式识别中重要而困难的一个环节:难的一个环节:分析各种特征的有效性并选出最有代表性的特分析各种特征的有效性并选出最有代表性的特征是模式识别的关键一步。征是模式识别的关键一步。降低特征维数在很多情况下是有效设计分类器降低特征维数在很多情况下是有效设计分类器的重要课题。的重要课题。引言特征的形成uu特征形成特征形成 (acquisition)(acquisition):信号获取或测量原始
2、测量原始特征u实例:数字图象中的各像素灰度值人体的各种生理指标u原始特征分析:原始测量很大程度上不能反映对象本质高维原始特征不利于分类器设计:计算量大,冗余,样本分布十分稀疏。引言二、特征的选择与提取u两类提取有效信息、压缩特征空间的方法:两类提取有效信息、压缩特征空间的方法:特征提取和特征选择特征提取和特征选择u特征提取特征提取(extraction):用映射(或变换)用映射(或变换)的方法把原始特征变换为较少的新特征的方法把原始特征变换为较少的新特征。u特征选择特征选择(selection):从原始特征中挑选出从原始特征中挑选出一些最有代表性,分类性能最好的特征。一些最有代表性,分类性能最
3、好的特征。u特征的选择与提取与具体问题有很大关系,特征的选择与提取与具体问题有很大关系,目前没有理论能给出对任何问题都有效的特目前没有理论能给出对任何问题都有效的特征选择与提取方法。征选择与提取方法。特征的选择与提取举例u细胞自动识别:原始测量:(正常与异常)细胞的数字图像原始特征(特征的形成,找到一组代表细胞性质的特征):细胞面积,胞核面积,形状系数,光密度,核内纹理,核浆比压缩特征:原始特征的维数仍很高,需压缩以便于分类特征选择:挑选最有分类信息的特征特征提取:数学变换傅立叶变换或小波变换用PCA方法作特征压缩三、特征提取与K-L变换u特征提取:用映射(或变换)的方法把原始特征变换为较少的
4、新特征uPCA(PrincipleComponentAnalysis)方法:进行特征降维变换,不能完全地表示原有的对象,能量总会有损失。希望找到一种能量最为集中的的变换方法使损失最小。uK-L(Karhunen-Loeve)变换:最优正交线性变换,相应的特征提取方法被称为PCA方法特征值特征值特征向量特征向量K-L变换离散K-L变换:对向量x用标准正交向量系uj进行线性变换,得到新的向量Y.经过KL变换组合,输出Y的各分量之间将具有最小的相关性.特征提取离散K-L变换的均方误差u用有限项估计x:uu该估计的均方误差:该估计的均方误差:特征提取因为uj是确定性向量,所以有求解最小均方误差正交基u
5、用Lagrange乘子法,可以求出满足正交条件下的取极值时的坐标系统:u结论:以相关矩阵R R的d个特征向量uj为基向量来展开x x时,其截断均方误差取得最小值为:uK-L变换:当取矩阵R R的d个最大特征值对应的特征向量来展开x x时,其截断均方误差最小。这d个特征向量组成的正交坐标系称作x x所在的D维空间的d维K-L变换坐标系,x x在K-L坐标系上的展开系数向量y y称作x x的K-L变换特征提取K-L变换的表示uK-L变换的变换的向量展开表示向量展开表示:uK-L变换的变换的矩阵表示矩阵表示:特征提取K-L变换的性质uy的相关矩阵是对角矩阵:特征提取K-L变换的性质uK-L坐标系把矩
6、阵坐标系把矩阵R R对角化,即对角化,即通过通过K-L变换消除原有向量变换消除原有向量x的各分量间的相关的各分量间的相关性性,从而有可能去掉那些带有较少信息,从而有可能去掉那些带有较少信息的分量以达到降低特征维数的目的的分量以达到降低特征维数的目的特征提取主成分分析主成分分析(PCA)主分量分析(主分量分析(Primary Component Analysis,PCA)就)就是基于是基于K-L变换的提取图像特征的一种最优正交线性变变换的提取图像特征的一种最优正交线性变换,可以有效去掉一个随机向量中各元素间的相关性。换,可以有效去掉一个随机向量中各元素间的相关性。PCA的目的:寻找能够表示采样数
7、据的最好的投影子的目的:寻找能够表示采样数据的最好的投影子空间空间.PCA的求解:特征向量常被叫做的求解:特征向量常被叫做“主分量主分量”,每个样,每个样本被它在前几个主分量上的投影近似表示,本被它在前几个主分量上的投影近似表示,U张成的空张成的空间称为原空间的子空间,间称为原空间的子空间,PCA实际上就是在子空间上的实际上就是在子空间上的投影投影.从从几几何何意意义义来来看看,变变换换后后的的主主分分量量空空间间坐坐标标系系与与变变换换前前的的空空间间坐坐标标系系相相比比旋旋转转了了一一个个角角度度。而而且且新新坐坐标标系系的的坐坐标标轴轴一一定定指指向向数数据据信信息息量量较较大大的的方方
8、向向。以以二二维维空空间间为为例例,假假定定某某样样本本的的分分布布呈呈椭椭圆圆状状,那那么么经经过过旋旋转转后后,新新坐坐标标系系的的坐坐标标轴轴一一定定分分别别指指向向椭椭圆圆的的长长半半轴轴和和短短半半轴轴方方向向主主分量方向,因为长半轴这一方向的信息量最大。分量方向,因为长半轴这一方向的信息量最大。x1x2u2u1主成分是这个椭圆的长轴方向。短轴的方向和长轴垂直,是第二个主成分的方向。变换后的各分量,它们所包括的信息量不同,呈逐渐减少趋势。事实上,第一主分量集中了最大的信息量,常常占80以上。第二、三主分量的信息量依次很快递减,到了第n分量,信息几乎为零。Principalcompon
9、ent PCA对于椭球状分布的样本集有很好的效果对于椭球状分布的样本集有很好的效果,学习所学习所得的主方向就是椭球的主轴方向得的主方向就是椭球的主轴方向.PCA 是一种非监督的算法是一种非监督的算法,能找到很好地代表所有样能找到很好地代表所有样本的方向本的方向,但这个方向对于分类未必是最有利的但这个方向对于分类未必是最有利的人脸识别就是将已检测到的待识别人脸与数据库中的已知人脸进行比较匹配,得出相关信息,来鉴别该人是谁。这一过程的核心是选择恰当的人脸表征方式与匹配策略,即选择合适的人脸模式的特征,根据所提取的特征进行匹配。人脸图像所包含的模式特征十分丰富,它不仅包括一些能直观感觉到的特征,如肤
10、色、发色等颜色特征,脸的轮廓等轮廓特征,用到的更多的是不能感觉,只能通过变换等处理之后才表现出来的特征,如特征脸、小波特征等变换域特征,均值、方差等模板特征。人脸特征表述人脸特征表述基于基于PCA构建特征脸空间是对图像进行构建特征脸空间是对图像进行K-L变换,以去除样变换,以去除样本间的相关性,然后根据特征值的大小选择特征向量。本间的相关性,然后根据特征值的大小选择特征向量。这种方法首先将人脸图像映射为高维空间的向量,然后应这种方法首先将人脸图像映射为高维空间的向量,然后应用基于统计的离散用基于统计的离散K-L变换方法,构造一个各分量互不相关变换方法,构造一个各分量互不相关的特征空间,即特征脸
11、空间,再将人脸图像在高维空间中的特征空间,即特征脸空间,再将人脸图像在高维空间中的向量映射到特征脸空间,得到特征系数。的向量映射到特征脸空间,得到特征系数。PCA构建特征脸空间构建特征脸空间ORL标准人脸库由40人,每人10幅11292图像组成。这些图像是拍摄于不同时期的;人的脸部表情和脸部细节有着不同程度的变化,比如,笑或不笑,眼睛或睁或闭,戴或不戴眼镜;人脸姿态也有相当程度的变化,深度旋转和平面旋转可达20度;人脸的尺度也有多达10的变化。ORL人脸库人脸库(英国剑桥大学英国剑桥大学)M幅人脸图像样本,其图像矩阵,将它们转化为向量形式,得到M个维向量均值差值图像集的协方差矩阵特征值特征向量
12、可以从以上求得的M个特征向量中取出对构造图像影响最大的m个,这样就可以构造了一个原始图像空间的m维子空间,这个m维子空间称为特征脸空间。,图像集的协方差矩阵特征值特征向量,特征值与特征图像特征值与特征图像特征值ORL20人10幅特征脸空间特征提取LDA线性判别分析:线性判别分析:LinearDiscriminantAnalysis(LDA)Fisher(1936)在线性判别函数一章,我们讲过在线性判别函数一章,我们讲过Fisher线性判线性判别函数。它的思想是,找一个方向作投影,使得别函数。它的思想是,找一个方向作投影,使得投影后的数据类间距尽可能大,类内距尽可能小。投影后的数据类间距尽可能大
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 特征 选择 提取
限制150内