模式识别讲义-特征提取和特征选择课件.ppt
《模式识别讲义-特征提取和特征选择课件.ppt》由会员分享,可在线阅读,更多相关《模式识别讲义-特征提取和特征选择课件.ppt(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、模式识别 第八讲特征选择与特征提取回顾:n贝叶斯分类的原理n最小错误率贝叶斯分类n最小风险贝叶斯分类n最大似然比贝叶斯分类n正态分布情况下的贝叶斯分类1、分类器的错误率错误率是评价一个分类器的重要指标错误率受分类决策方法、训练集、测试集和偶然因素的影响分类错误是一个概率事件,错误率应由概率方式表达Pe错误率Ped(n)训练集上利用n个样本得到的错误率估计Pet(n)测试集上利用n个样本得到的错误率估计 分类器的错误率2、二类贝叶斯分类中的错误率3、多类贝叶斯分类中的错误率模式识别 第八讲特征选择与特征提取内容n基本概念n距离定义n特征提取算法n特征选择算法一 基本概念复习(1)特征:特征是从对
2、应于一个模式类的所有信息中提取出来的,可以用来进行模式识别的部分属性。特征可以是数值型的,也可以是非数值型的。特征一定有确切的定义和表示方法。(2)特征空间:特征空间中的每一个点(每一种取值),都代表了一个模式。特征空间中的一个区域,则代表了一个模式类。特征:颜色形状特征值:颜色1.24形状0.37特征向量:x=x1,x2 =颜色,形状特征空间一、基本概念1、好的分类器:n特征具有良好的可分性n特征不要重复,去掉相关性高的特征2、特征提取和特征选择的目的n降低特征维数,减少信息冗余n提高特征对类别的分辨能力n寻找对分类最重要的特征3、特征提取n通过某种变换,将原始特征从高维空间映射到低维空间。
3、T:ER=ED T为特征提取器,通常是某种正交变换。4、特征选择n从一组特征中挑选出一些最有效的特征的过程。J(F*)=min J(F),集合F包含d个特征,J()是准则函数w(y)wy1y2x212一、基本概念5、模式类别可分性的测度(1)特征提取和特征选择准则n错误率是最佳的特征提取和特征选择准则函数,但难以计算。n可用的类别可分性测度标准应满足以下要求:n与错误率有单调关系n当特征独立时具有可加性n具有标量测度特性n对特征具单调性一、基本概念二、距离(1)类内类间距离二、距离(1)类内类间距离二、距离(1)类内类间距离二、距离(2)概率距离n类间的概率距离可用分布函数之间的距离来度量完全
4、可分:若p(x|1)0时,p(x|2)0;完全不可分:对任意x,都有 p(x|1)p(x|2);二、距离(2)概率距离二、距离(2)概率距离 几种常见的概率距离:Bhattacharyya(巴特查雅)距离Chernoff(切诺夫)距离二、距离(2)概率距离 散度似然比表达了两类之间的可分性,定义对数似然比为:则可用两类间的平均对数似然比来作为概率距离,称为散度:三、特征提取算法1、使用类内类间距离进行特征提取类内类间距离 Jd=Jw+Jbtr(SwSb)其中Jw是类内平均距离,Jb是类间平均距离p 通常给定一个训练集后,Jd是固定的,因此,在特征提取时,需要加大Jb,减小Jw,来获得满意的分类
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 讲义 特征 提取 选择 课件
限制150内