特征的选择与提取特征提取课件.ppt
《特征的选择与提取特征提取课件.ppt》由会员分享,可在线阅读,更多相关《特征的选择与提取特征提取课件.ppt(91页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于特征的选择与提取特征提取第1页,此课件共91页哦学习指南学习指南 n前面章节讨论的问题n主要讨论模式识别的重要概念 n贝叶斯分类器、线性分类器、非线性分类器、KNN等 n设计分类器时的讨论问题n在d维特征空间已经确定的前提下,讨论分类方法与分类器设计n即:对要分类的样本怎样描述这个问题是已经确定的第2页,此课件共91页哦学习指南学习指南 n前面章节讨论的问题n例如对苹果与梨的划分问题n我们使用尺寸、重量和颜色三种度量来描述n这种度量方法是已经确定好的n在这种条件下研究用线性分类器好还是非线性分类器好,以及这些分类器的其它设计问题 第3页,此课件共91页哦学习指南学习指南 n本章讨论的问题n
2、对已有的特征空间进行改造,着重于研究对样本究竟用什么样的度量方法更好n譬如用三种度量来描述苹果与梨n那么是否运用这三种度量是最有效的呢?n颜色:n这一个指标对区分红苹果与梨很有效n区分黄苹果与梨就会困难得多即,这个指标就不很有效了 第4页,此课件共91页哦学习指南学习指南 n本章讨论的问题n使用什么样的特征描述事物,也就是说使用什么样的特征空间是个很重要的问题n由于对特征空间进行改造目的在于提高其某方面的性能,因此又称特征的优化问题 第5页,此课件共91页哦学习指南学习指南 n降维主要有两种途径 n对特征空间的改造、优化、主要的目的是降维,即把维数高的特征空间改成维数低的特征空间,降维主要有两
3、种途径 n特征的选择:一种是删选掉一些次要的特征n问题在于如何确定特征的重要性,以及如何删选n特征的提取:另一种方法是使用变换的手段,在这里主要限定在线性变换的方法上,通过变换来实现降维第6页,此课件共91页哦本章重点本章重点 n1弄清对特征空间进行优化的含义n2对特征空间进行优化的两种基本方法特征选择与特征的组合优化n3对特征空间进行优化的一些常用判据n4利用线段变换进行特征空间优化的基本方法,第7页,此课件共91页哦本本章章知知识识点点 第8页,此课件共91页哦8.1 基本概念n已经讨论的问题n是在d维特征空间已经确定的前提下进行的n讨论的分类器设计问题是:选择什么准则、使用什么方法,将已
4、确定的d维特征空间划分成决策域的问题n另一个重要问题n如何确定合适的特征空间 n如何描述每个样本和每个模式第9页,此课件共91页哦基本概念第10页,此课件共91页哦基本概念第11页,此课件共91页哦基本概念第12页,此课件共91页哦基本概念n问题的重要性n如果所选用的特征空间能使同类物体分布具有紧致性,即各类样本能分布在该特征空间中彼此分割开的区域内,这就为分类器设计成功提供良好的基础。n反之,如果不同类别的样本在该特征空间中混杂在一起,再好的设计方法也无法提高分类器的准确性。第13页,此课件共91页哦基本概念n三个不同的层次描述n1.物理量的获取与转换 n指用什么样的传感器获取电信号n摄取景
5、物则要用摄像机 n文字与数字识别首先要用扫描仪等设备 n手写体文字所用传感器与印刷体文字也很可能不同 n这些都属于物理量的获取,并且已转换成电信号,为计算机分析打下了基础 n对从传感器中得到的信号,可称之为原始信息n它要经过加工、处理才能得到对模式分类更加有用的信号第14页,此课件共91页哦基本概念n三个不同的层次描述n2描述事物方法的选择与设计n在得到了原始信息之后,要对它进一步加工,以获取对分类最有效的信息 n这部分信息必须对原始信息进行加工,而设计所要信息的形式是十分关键的 n例如:对阿拉伯数字的识别可以提出各种不同的想法*分析从框架的左边框到数字之间的距离变化反映了不同数字的不同形状,
6、这可以用来作为数字分类的依据*强调分析不同截面的信号,如在框架的若干部位沿不同方向截取截面分析从背景到字,以及从字到背景转换的情况第15页,此课件共91页哦基本概念阿拉伯数字的识别可以提出各种不同的想法第16页,此课件共91页哦基本概念n三个不同的层次描述n2描述事物方法的选择与设计n设计对事物的描述方法是充分发挥设计者智慧的过程 n这个层次的工作往往因事物而易,与设计者本人的知识结构也有关 n这是一个目前还无法自动进行的过程 n这个层次的工作是最关键的,但因为太缺乏共性,也不是本章讨论的内容 第17页,此课件共91页哦基本概念n三个不同的层次描述n3.特征空间的优化n这个层次的工作发生在已有
7、了特征的描述方法之后,也就是已有了一个初始的特征空间,如何对它进行改造与优化的问题n所谓优化是要求既降低特征的维数,又能提高分类器的性能,这就是本章着重讨论的问题n这里讨论的是一些不同模式识别系统中具有共性的问题,特征选择与特征提取特征选择与特征提取 第18页,此课件共91页哦基本概念n例 用RGB颜色空间和HSI颜色空间 nRGB和HSI是两种常用的颜色空间,n虽然它们描述颜色的范围是一样的,n也有确定的转换关系,n但是用这两种不同的特征描述图像,n对以后的识别工作会有很大影响 第19页,此课件共91页哦基本概念第20页,此课件共91页哦基本概念n特征选择和特征提取n对特征空间进行优化有两种
8、基本方法n一种为特征选择,n一种为特征提取n两者区别n特征选择:删掉部分特征n特征提取:通过一种映射,也就是说新的每一个特征是原有特征的一个函数 第21页,此课件共91页哦基本概念n特征选择和特征提取n两者区别假设已有D维特征向量空间,特征选择:样本由d维的特征向量描述:dD由于X只是Y的一个子集,因此每个分量xi必然能在原特征集中找到其对应的描述量xiyj第22页,此课件共91页哦基本概念n特征选择和特征提取n两者区别假设已有D维特征向量空间,特征提取:找到一个映射关系:A:YX使新样本特征描述维数比原维数降低。其中每个分量xi是原特征向量各分量的函数,即第23页,此课件共91页哦基本概念n
9、特征选择和特征提取n两者区别n因此这两种降维的基本方法是不同的。n在实际应用中可将两者结合起来使用,比如先进特征提取,然后再进一步选择其中一部分,或反过来。第24页,此课件共91页哦8.2 类别可分离性判据n为什么需要类别可分离性判据n特征选择与特征提取的任务是求出一组对分类最有效的特征 n所谓有效是指在特征维数减少到同等水平时,其分类性能最佳 n因此需要有定量分析比较的方法,判断所得到的特征维数及所使用特征是否对分类最有利n这种用以定量检验分类性能的准则称为 类别可分离性判据类别可分离性判据 第25页,此课件共91页哦类别可分离性判据n为什么需要类别可分离性判据n一般说来分类器最基本的性能评
10、估是其分类的错误率 n如果能用反映错误率大小的准则,在理论上是最合适的 n对错误率的计算是极其复杂的,以至于很难构筑直接基于错误率的判据 n为此人们设法从另一些更直观的方法出发,设计出一些准则,用来检验不同的特征组合对分类性能好坏的影响,甚至用来导出特征选择与特征提取的方法这些准则就是类别可分离性判据 第26页,此课件共91页哦类别可分离性判据n类别可分离性判据的种类n基于距离度量的可分性判据 n基于概率分布的可分性判据等 第27页,此课件共91页哦8.2.1基于距离的可分性判据 n基于距离的可分性判据 n基于距离度量是人们常用来进行分类的重要依据n一般情况下同类物体在特征空间呈聚类状态,即从
11、总体上说同类物体内各样本由于具有共性n因此类内样本间距离应比跨类样本间距离小nFisher准则正是以使类间距离尽可能大同时又保持类内距离较小这一种原理为基础的n同样在特征选择与特征提取中也使用类似的原理,这一类被称为基于距离的可分性判据。第28页,此课件共91页哦基于距离的可分性判据n基于距离的可分性判据n在讨论Fisher准则时曾用过两个描述离散度的矩阵 一个是类间离散矩阵Sb另一个是类内离散度矩阵SWSWS1+S2第29页,此课件共91页哦基于距离的可分性判据n基于距离的可分性判据n如果推广至c类别情况 其中为所有样本的总均值向量,Pi表示各类别的先验概率,Ei表示i类的期望符号。第30页
12、,此课件共91页哦基于距离的可分性判据n1 计算特征向量间平均距离的判据该式可写成在欧氏距离情况下有第31页,此课件共91页哦基于距离的可分性判据n1 计算特征向量间平均距离的判据利用均值向量与总均值向量,有第32页,此课件共91页哦基于距离的可分性判据n2 考虑类内类间欧氏距离的其它判据n判据Jd(X)是计算特征向量的总平均距离n以下一些判据则基于使类间离散度尽量大,类内离散度尽量小的考虑而提出:第33页,此课件共91页哦8.2.2 基于概率分布的可分性判据 n基于概率分布的可分性判据 n上一节讨论的是样本在特征空间的分布距离作为特征提取的依据。n该种原理直观,计算简便。n但是这种原理没有考
13、虑概率分布,因此当不同类样本中有部分在特征空间中交迭分布时,简单地按距离划分,无法表明与错误概率之间的联系。n基于概率分布的可分性判据则依据如下观察到的现象。第34页,此课件共91页哦8.2.2 基于概率分布的可分性判据 n基于概率分布的可分性判据 观察现象:不考虑各类的先验概率,或假设两类样本的先验概率相等第35页,此课件共91页哦基于概率分布的可分性判据n基于概率分布的可分性判据 观察现象n如果两类条件概率分布互不交迭,即对p(X|2)0处都有p(X|1)0,则这两类就完全可分;n另一种极端情况是对所有X都有p(X|1)p(X|2),则两类就完全不可分。第36页,此课件共91页哦基于概率分
14、布的可分性判据n基于概率分布的可分性判据 n因此人们设计出与概率分布交迭程度有关的距离度量方法,这些距离Jp有以下几个共同点:n1.Jp是非负,即Jp0n2.当两类完全不交迭时Jp达到其最大值n3.当两类分布密度相同时,Jp0这种函数的一般式可表示为:第37页,此课件共91页哦基于概率分布的可分性判据n一些常用的概率距离度量nBhattacharyya距离和Chernoff界限 Bhattacharyya距离的定义用下式表示Chernoff界限的定义与其相似,为因此JB是JC的一个特例第38页,此课件共91页哦基于概率分布的可分性判据n一些常用的概率距离度量n散度另一种常用的基于概率距离度量的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 特征 选择 提取 课件
限制150内