第6章 模式特征选择精选文档.ppt





《第6章 模式特征选择精选文档.ppt》由会员分享,可在线阅读,更多相关《第6章 模式特征选择精选文档.ppt(24页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第6章 模式特征选择本讲稿第一页,共二十四页2.模式特征选择模式特征选择 从一组模式特征中选出一些最有效和最具代表性的特从一组模式特征中选出一些最有效和最具代表性的特征,这个过程称为征,这个过程称为特征选择特征选择。3.模式特征抽取和选择的意义模式特征抽取和选择的意义 前面三章所介绍的前面三章所介绍的线性判别函数分类方法,线性判别函数分类方法,Bayes分类方分类方法,近邻分类方法和集群方法法,近邻分类方法和集群方法等都一直假定模式特征是已知的,等都一直假定模式特征是已知的,通过通过n个特征所代表的模式向量,实现模式识别任务。个特征所代表的模式向量,实现模式识别任务。所抽取和选择的模式特征的优
2、劣,对分类器的设计和所抽取和选择的模式特征的优劣,对分类器的设计和性能有重要影响,直接影响分类器的构造和识别效果。性能有重要影响,直接影响分类器的构造和识别效果。因此,特征抽取和选择是模式识别中的一个关键问题。因此,特征抽取和选择是模式识别中的一个关键问题。本讲稿第二页,共二十四页4.模式特征抽取和选择中的两个问题模式特征抽取和选择中的两个问题困难性困难性 迄今为止,所提出的模式特征和抽取方法都是迄今为止,所提出的模式特征和抽取方法都是面向问题面向问题的,的,也就是说,不同的模式识别问题(如字符识别,语音识别)可以有也就是说,不同的模式识别问题(如字符识别,语音识别)可以有不同的特征抽取和选择
3、方法,即使对同一模式识别问题,也可能用不同的特征抽取和选择方法,即使对同一模式识别问题,也可能用不同的方法。因此,不同的方法。因此,找到特征抽取和选择的一般方法是比较困难的。找到特征抽取和选择的一般方法是比较困难的。由于不是在任何情况下都能容易地抽取到最重要的特征,或由由于不是在任何情况下都能容易地抽取到最重要的特征,或由于条件限制而不能充分抽取特征,而使得于条件限制而不能充分抽取特征,而使得特征的抽取和选择有时特征的抽取和选择有时变得很困难。变得很困难。本讲稿第三页,共二十四页 特征的数量问题特征的数量问题 当用一组特征已经无法区分模式类别时,自然会想到增加新的特当用一组特征已经无法区分模式
4、类别时,自然会想到增加新的特征,那么,特征数量是不是越多越好呢?征,那么,特征数量是不是越多越好呢?当特征数量不多时,增加特征数量,问题不大。当特征数量不多时,增加特征数量,问题不大。但是,当特征数量比较大,达到一定的数量之后,增加特征数量反而但是,当特征数量比较大,达到一定的数量之后,增加特征数量反而会使分类器的性能变坏。会使分类器的性能变坏。产生这个问题的基本原因是用来设计分类器的样本数量是有限的产生这个问题的基本原因是用来设计分类器的样本数量是有限的。那么可不可以在增加特征的同时,也增加样本数量呢?那么可不可以在增加特征的同时,也增加样本数量呢?本讲稿第四页,共二十四页 当用一定数量的样
5、本估计出来的参数设计当用一定数量的样本估计出来的参数设计Bayes分类器分类器时,随着特征数量的增加时,随着特征数量的增加要求样本数急剧增加,要求样本数急剧增加,这样才能保这样才能保证一定的错误率。证一定的错误率。在实际问题中,由于样本数是有限的,所以为了保证在实际问题中,由于样本数是有限的,所以为了保证一定的错误率,就不能任意增加特征数。一定的错误率,就不能任意增加特征数。那么怎么办好呢?那么怎么办好呢?在很多特征中在很多特征中选择一些更有效的特征选择一些更有效的特征来压缩模式特征向量的来压缩模式特征向量的维数。维数。本讲稿第五页,共二十四页二二.离散的离散的K-L变换变换 从从n维特征选取
6、维特征选取m维特征,去掉的(维特征,去掉的(n-m)维特征不一定就是无维特征不一定就是无用的信息。如何在信息损失最小的情况下选取特征呢?用的信息。如何在信息损失最小的情况下选取特征呢?离散的离散的K-L变换又称主成分分析,是一种基于目标统计特性的最变换又称主成分分析,是一种基于目标统计特性的最佳正交变换,被广泛应用于数据压缩,特征降维等方面。离散的佳正交变换,被广泛应用于数据压缩,特征降维等方面。离散的K-L变换具有一些很好的性质:变换具有一些很好的性质:(1)可以使变换后所生成的新分量正交或不相关。)可以使变换后所生成的新分量正交或不相关。(2)用较少的新分量来表示原特征向量时,可达到均方误
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第6章 模式特征选择精选文档 模式 特征 选择 精选 文档

限制150内