特征提取的原则和方法幻灯片.ppt
《特征提取的原则和方法幻灯片.ppt》由会员分享,可在线阅读,更多相关《特征提取的原则和方法幻灯片.ppt(115页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、特征提取的原则和方法第1页,共115页,编辑于2022年,星期一要点:特征提取的重要性特征提取的基本任务特征提取的基本要求特征提取的基本原则特征提取的基本方法课堂练习1,课堂练习2第2页,共115页,编辑于2022年,星期一特征提取的重要性在一个较完善的模式识别系统中,或者明显地或者隐含地要有特征提取的技术环节,通常其处于对象特征数据采集和分类识别两个环节之间,特征提取方法的优劣极大地影响着分类器的设计和性能。举例返回第3页,共115页,编辑于2022年,星期一模式识别系统的基本组成模式识别系统的基本组成一个完整的模式识别系统主要由5个基本部分组成:传感器预处理器特征提取器分类器后处理器输入决
2、策分割器上下文信息调整返回第4页,共115页,编辑于2022年,星期一正常细胞和癌细胞的识别试对如何区分正常细胞和癌细胞进行特征提取,并构造分类函数。返回想一想:有没有其他较好的解决办法?正常细胞异常细胞第5页,共115页,编辑于2022年,星期一细胞特征的提取过程找出各种对识别可能有用的细胞属性选择容易计算的细胞属性构成原始特征对易计算属性进行再次选择和重组产生合理、有效的关键特征返回第6页,共115页,编辑于2022年,星期一一些对识别有用的细胞属性细胞总面积、细胞总周长、总光密度、胞核密度、核浆比、细胞形状、核内文理等 这些属性的数目可能很多,有些不易计算和描述,通常需要进行选择,以保留
3、那些容易计算的属性。返回第7页,共115页,编辑于2022年,星期一一些容易计算的细胞属性细胞总面积、细胞总周长、胞核密度等。这些特征称为原始特征。返回第8页,共115页,编辑于2022年,星期一关键特征的生成返回第9页,共115页,编辑于2022年,星期一细胞分类函数的构造返回第10页,共115页,编辑于2022年,星期一特征提取的基本任务特征提取的基本任务是研究如何从众多的特征中求出那些对分类识别最有效的特征,从而实现特征空间维数的压缩。返回 第11页,共115页,编辑于2022年,星期一特征提取的基本要求区分度高,即样本类内距离应尽量小,类间距离尽量大。具有较高的稳定性和鲁棒性。易于提取
4、,在保证系统性能的前提下,特征的维数不宜过高,以减少运算量和提高系统的效率。返回第12页,共115页,编辑于2022年,星期一特征提取的基本原则目的性原则简约性原则返回第13页,共115页,编辑于2022年,星期一目的性原则以分类的目的为指导:当分类的目的决定之后,如何找到合适的特征就成为模式识别的核心问题。解决不同的分类问题通常需要提取不同的特征,需要具体问题具体分析。举例:例1,例2。返回第14页,共115页,编辑于2022年,星期一不同的问题需要不同的特征问题1问题2问题3返回第15页,共115页,编辑于2022年,星期一分类问题1返回第16页,共115页,编辑于2022年,星期一分类问
5、题2返回第17页,共115页,编辑于2022年,星期一分类问题3返回第18页,共115页,编辑于2022年,星期一言语识别和说话人识别在言语识别中,需要设法提取不同人语音中的共性在说话人识别中,则需要设法提取不同人语音中的区别返回第19页,共115页,编辑于2022年,星期一简约性原则寻找对分类最有效的特征:在保证所要求的分类识别的正确率和节省资源的前提下,使用最少的特征达到所要求的分类识别的正确率。通常需要构造准则函数,使得所选特征在该准则下最优。举例返回第20页,共115页,编辑于2022年,星期一特征提取准则函数举例如果设J是一个准则函数,那么从n个原始特征选择d个关键特征时,应满足其中
6、 是n个特征中的任意d个原始特征返回第21页,共115页,编辑于2022年,星期一特征提取的基本方法总结各种可能对分类和识别有帮助的可计算属性,从中生成原始特征对原始特征进行直接选择,变换选择或多级选择产生关键特征。返回第22页,共115页,编辑于2022年,星期一直接选择从n个特征中直接选择两个特征从n个特征中直接选择m个特征返回第23页,共115页,编辑于2022年,星期一从n个特征中直接选择两个特征返回其中第24页,共115页,编辑于2022年,星期一从n个特征中直接选择m个特征返回其中第25页,共115页,编辑于2022年,星期一变换选择对n个特征进行线性变换产生m个特征主成分分析 K
7、-L变换(Karhunen-Love变换)Fisher变换返回第26页,共115页,编辑于2022年,星期一主成分分析主成分分析的基本思想零维主成分分析一维主成分分析多维主成分分析主成分析的数学变换返回第27页,共115页,编辑于2022年,星期一主成分分析的基本思想寻找在最小均方差意义下最能够代表原始数据的投影方法。返回第28页,共115页,编辑于2022年,星期一零维主成分分析设有n个d维样本X1,X2,Xn,如何仅仅用一个d维向量X0来最好地表达这n个样本,使X0与其他样本Xk(k=1,2,n)的距离平方和最小。如果定义平方误差准则函数J0(X0)如下:那么当X0等于样本均值时J0(X0
8、)最小,即:试证明之。返回第29页,共115页,编辑于2022年,星期一零维主成分的证明返回第30页,共115页,编辑于2022年,星期一一维主成分分析作一条通过均值的直线,如果e表示直线方向的单位向量,那么直线的方程为:其中a表示直线上某点离开m的距离。如果用m+ake来代表Xk,那么通过最小化平方误差准则函数,可以求得一组最优的ak和最优的方向e:返回第31页,共115页,编辑于2022年,星期一最优的ak由于 ,将 对ak求偏导,并且令结果为0可得:返回第32页,共115页,编辑于2022年,星期一最优的方向e定义离散度矩阵(scatter matrix)为:将 代入 化简得:关键在 的
9、条件下求 的最大值返回第33页,共115页,编辑于2022年,星期一 的最大值计算构造拉格朗日函数:对e求偏导,并且令结果为0,得:因此,为 S的最大本征值,e为S的最大本征值对应的单位本征向量。返回第34页,共115页,编辑于2022年,星期一多维主成分分析如果考虑过样本均值的多维子空间:并定义新的平方误差准则函数:则可进行多维主成分分析,结果为:是S的前 个本征值对应的本征向量返回第35页,共115页,编辑于2022年,星期一主成分析的数学变换如果选择 个主成分,那么数学变换为:返回第36页,共115页,编辑于2022年,星期一对n个特征进行线性变换产生m个特征返回第37页,共115页,编
10、辑于2022年,星期一K-L变换K-L变换的计算过程K-L变换举例K-L变换的原理K-L变换的特点返回第38页,共115页,编辑于2022年,星期一K-L变换的计算过程1.把给定n维样本表示为X1,X2,XP2.计算样本均值3.计算协方差矩阵Snn4.计算Snn的特征根及特征向量5.生成变换矩阵 6.构造K-L变换7.计算均方误差 返回第39页,共115页,编辑于2022年,星期一计算样本均值返回第40页,共115页,编辑于2022年,星期一计算协方差矩阵返回第41页,共115页,编辑于2022年,星期一计算特征根及特征向量计算上式的所有特征根1,2,n及相应的单位化特征向量1,2,n。返回第
11、42页,共115页,编辑于2022年,星期一生成变换矩阵选择前m个(最大的m个)特征根对应的单位化特征向量1,2,m生成变换矩阵:返回第43页,共115页,编辑于2022年,星期一构造K-L变换其中yk代表第k主成分,第1主成分代表最分散的方向。返回第44页,共115页,编辑于2022年,星期一计算均方误差返回第45页,共115页,编辑于2022年,星期一K-L变换举例已知 计算从2维中选择1维的K-L变换计算过程计算结果示意图返回第46页,共115页,编辑于2022年,星期一计算过程计算样本均值计算协方差矩阵S22计算S22的特征根及特征向量生成变换矩阵 构造K-L变换计算均方误差 返回第4
12、7页,共115页,编辑于2022年,星期一计算样本均值返回第48页,共115页,编辑于2022年,星期一计算协方差矩阵返回第49页,共115页,编辑于2022年,星期一计算特征根及特征向量计算特征根计算特征向量返回第50页,共115页,编辑于2022年,星期一计算特征根返回第51页,共115页,编辑于2022年,星期一计算特征向量计算结果。返回第52页,共115页,编辑于2022年,星期一特征向量的计算结果返回第53页,共115页,编辑于2022年,星期一生成变换矩阵返回第54页,共115页,编辑于2022年,星期一构造K-L变换返回第55页,共115页,编辑于2022年,星期一计算均方误差返
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 特征 提取 原则 方法 幻灯片
限制150内