特征的选择与提取特征提取.pptx





《特征的选择与提取特征提取.pptx》由会员分享,可在线阅读,更多相关《特征的选择与提取特征提取.pptx(91页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、学习指南 前面章节讨论的问题例如对苹果与梨的划分问题我们使用尺寸、重量和颜色三种度量来描述这种度量方法是已经确定好的在这种条件下研究用线性分类器好还是非线性分类器好,以及这些分类器的其它设计问题 第1页/共91页学习指南 本章讨论的问题对已有的特征空间进行改造,着重于研究对样本究竟用什么样的度量方法更好譬如用三种度量来描述苹果与梨那么是否运用这三种度量是最有效的呢?颜色:这一个指标对区分红苹果与梨很有效区分黄苹果与梨就会困难得多即,这个指标就不很有效了 第2页/共91页学习指南 本章讨论的问题使用什么样的特征描述事物,也就是说使用什么样的特征空间是个很重要的问题由于对特征空间进行改造目的在于提
2、高其某方面的性能,因此又称特征的优化问题 第3页/共91页学习指南 降维主要有两种途径 对特征空间的改造、优化、主要的目的是降维,即把维数高的特征空间改成维数低的特征空间,降维主要有两种途径 特征的选择:一种是删选掉一些次要的特征问题在于如何确定特征的重要性,以及如何删选特征的提取:另一种方法是使用变换的手段,在这里主要限定在线性变换的方法上,通过变换来实现降维第4页/共91页本章重点 1弄清对特征空间进行优化的含义2对特征空间进行优化的两种基本方法特征选择与特征的组合优化3对特征空间进行优化的一些常用判据4利用线段变换进行特征空间优化的基本方法第5页/共91页本章知识点 第6页/共91页8.
3、1 基本概念已经讨论的问题是在d维特征空间已经确定的前提下进行的讨论的分类器设计问题是:选择什么准则、使用什么方法,将已确定的d维特征空间划分成决策域的问题另一个重要问题如何确定合适的特征空间 如何描述每个样本和每个模式第7页/共91页基本概念第8页/共91页基本概念第9页/共91页基本概念问题的重要性如果所选用的特征空间能使同类物体分布具有紧致性,即各类样本能分布在该特征空间中彼此分割开的区域内,这就为分类器设计成功提供良好的基础。反之,如果不同类别的样本在该特征空间中混杂在一起,再好的设计方法也无法提高分类器的准确性。第10页/共91页基本概念三个不同的层次描述1.物理量的获取与转换 指用
4、什么样的传感器获取电信号摄取景物则要用摄像机 文字与数字识别首先要用扫描仪等设备 手写体文字所用传感器与印刷体文字也很可能不同 这些都属于物理量的获取,并且已转换成电信号,为计算机分析打下了基础 对从传感器中得到的信号,可称之为原始信息它要经过加工、处理才能得到对模式分类更加有用的信号人的认识层次第12页/共91页基本概念三个不同的层次描述2描述事物方法的选择与设计在得到了原始信息之后,要对它进一步加工,以获取对分类最有效的信息 这部分信息必须对原始信息进行加工,而设计所要信息的形式是十分关键的 例如:对阿拉伯数字的识别可以提出各种不同的想法*分析从框架的左边框到数字之间的距离变化反映了不同数
5、字的不同形状,这可以用来作为数字分类的依据*强调分析不同截面的信号,如在框架的若干部位沿不同方向截取截面分析从背景到字,以及从字到背景转换的情况第13页/共91页基本概念阿拉伯数字的识别可以提出各种不同的想法第14页/共91页基本概念三个不同的层次描述2描述事物方法的选择与设计设计对事物的描述方法是充分发挥设计者智慧的过程 这个层次的工作往往因事物而易,与设计者本人的知识结构也有关 这是一个目前还无法自动进行的过程 这个层次的工作是最关键的,但因为太缺乏共性,也不是本章讨论的内容 第15页/共91页基本概念三个不同的层次描述3.特征空间的优化这个层次的工作发生在已有了特征的描述方法之后,也就是
6、已有了一个初始的特征空间,如何对它进行改造与优化的问题所谓优化是要求既降低特征的维数,又能提高分类器的性能,这就是本章着重讨论的问题这里讨论的是一些不同模式识别系统中具有共性的问题,特征选择与特征提取 第16页/共91页基本概念例 用RGB颜色空间和HSI颜色空间 RGB和HSI是两种常用的颜色空间,虽然它们描述颜色的范围是一样的,也有确定的转换关系,但是用这两种不同的特征描述图像,对以后的识别工作会有很大影响 第17页/共91页基本概念第18页/共91页基本概念特征选择和特征提取对特征空间进行优化有两种基本方法一种为特征选择一种为特征提取两者区别特征选择:删掉部分特征特征提取:通过一种映射,
7、也就是说新的每一个特征是原有特征的一个函数 第19页/共91页基本概念特征选择和特征提取两者区别假设已有D维特征向量空间,特征选择:样本由d维的特征向量描述:dD由于X只是Y的一个子集,因此每个分量xi必然能在原特征集中找到其对应的描述量xiyj第20页/共91页基本概念特征选择和特征提取两者区别假设已有D维特征向量空间,特征提取:找到一个映射关系:A:YX使新样本特征描述维数比原维数降低。其中每个分量xi是原特征向量各分量的函数,即第21页/共91页基本概念特征选择和特征提取两者区别因此这两种降维的基本方法是不同的。在实际应用中可将两者结合起来使用,比如先进特征提取,然后再进一步选择其中一部
8、分,或反过来。第22页/共91页8.2 类别可分离性判据为什么需要类别可分离性判据特征选择,特征提取目的:获得最有效的特征 有效:是指在特征维数减少到同等水平时,其分类性能最佳 判断有效性:需要有定量分析比较的方法,判断所得到的特征维数及所使用特征是否对分类最有利这种用以定量检验分类性能的准则称为 类别可分离性判据 第23页/共91页类别可分离性判据为什么需要类别可分离性判据理想有效性判断标准:分类错误率 如果能用反映错误率大小的准则,在理论上是最合适的 难点:对错误率的计算是极其复杂的,以至于很难构筑直接基于错误率的判据 为此人们设法从另一些更直观的方法出发,设计出一些准则,用来检验不同的特
9、征组合对分类性能好坏的影响,甚至用来导出特征选择与特征提取的方法这些准则就是类别可分离性判据 第24页/共91页类别可分离性判据类别可分离性判据的种类基于距离度量的可分性判据 基于概率分布的可分性判据等 第25页/共91页8.2.1基于距离的可分性判据 基于距离的可分性判据 基于距离度量是人们常用来进行分类的重要依据一般情况下同类物体在特征空间呈聚类状态,即从总体上说同类物体内各样本由于具有共性因此类内样本间距离应比跨类样本间距离小Fisher准则正是以使类间距离尽可能大同时又保持类内距离较小这一种原理为基础的同样在特征选择与特征提取中也使用类似的原理,这一类被称为基于距离的可分性判据。第26
10、页/共91页基于距离的可分性判据基于距离的可分性判据在讨论Fisher准则时曾用过两个描述离散度的矩阵 一个是类间离散矩阵Sb另一个是类内离散度矩阵SWSWS1+S2第27页/共91页基于距离的可分性判据基于距离的可分性判据如果推广至c类别情况 其中为所有样本的总均值向量,Pi表示各类别的先验概率,Ei表示i类的期望符号。第28页/共91页基于距离的可分性判据1 计算特征向量间平均距离的判据该式可写成在欧氏距离情况下有第29页/共91页基于距离的可分性判据1 计算特征向量间平均距离的判据利用均值向量与总均值向量,有第30页/共91页基于距离的可分性判据2 考虑类内类间欧氏距离的其它判据判据Jd
11、(X)是计算特征向量的总平均距离以下一些判据则基于使类间离散度尽量大,类内离散度尽量小的考虑而提出:第31页/共91页8.2.2 基于概率分布的可分性判据 基于概率分布的可分性判据 上一节讨论的是样本在特征空间的分布距离作为特征提取的依据。该种原理直观,计算简便。但是这种原理没有考虑概率分布,因此当不同类样本中有部分在特征空间中交迭分布时,简单地按距离划分,无法表明与错误概率之间的联系。基于概率分布的可分性判据则依据如下观察到的现象。第32页/共91页8.2.2 基于概率分布的可分性判据 基于概率分布的可分性判据 观察现象:不考虑各类的先验概率,或假设两类样本的先验概率相等第33页/共91页基
12、于概率分布的可分性判据基于概率分布的可分性判据 观察现象如果两类条件概率分布互不交迭,即对p(X|2)0处都有p(X|1)0,则这两类就完全可分;另一种极端情况是对所有X都有p(X|1)p(X|2),则两类就完全不可分。第34页/共91页基于概率分布的可分性判据基于概率分布的可分性判据 因此人们设计出与概率分布交迭程度有关的距离度量方法,这些距离Jp有以下几个共同点:1.Jp是非负,即Jp02.当两类完全不交迭时Jp达到其最大值3.当两类分布密度相同时,Jp0这种函数的一般式可表示为:第35页/共91页基于概率分布的可分性判据一些常用的概率距离度量Bhattacharyya距离和Chernof
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 特征 选择 提取

限制150内