模式识别之特征选择与提取.ppt

资源ID：84151067 资源大小：2.75MB 全文页数：47页
资源格式： PPT 下载积分：15金币

快捷下载

会员登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要15金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

模式识别之特征选择与提取.ppt

关于模式识别之特征关于模式识别之特征选择与提取选择与提取现在学习的是第1页，共47页5.1 基本概念基本概念5.2 类别可分性测度类别可分性测度5.3 基于类内散布矩阵的单类模式特征提取基于类内散布矩阵的单类模式特征提取5.4 基于基于K-L变换的多类模式特征提取变换的多类模式特征提取第第5章章特征选择与特征提取特征选择与特征提取现在学习的是第2页，共47页5.1 基本概念基本概念由于测量上可实现性的限制或经济上的考虑，所获得的测量值为数不多。能获得的性质测量值很多。如果全部直接作为分类特征，耗费机时，且分类效果不一定好。有人称之为“特征维数灾难”。特征选择和提取的目的特征选择和提取的目的：经过选择或变换，组成识别特征，尽可能保留分类信息，在保证一定分类精度的前提下，减少特征维数，使分类器的工作即快又准确。1两种数据测量情况两种数据测量情况现在学习的是第3页，共47页(1)具有很大的识别信息量。即应具有很好的可分性。(2)具有可靠性。模棱两可、似是而非、时是时非等不易判别的特征应丢掉。(3)尽可能强的独立性。重复的、相关性强的特征只选一个。(4)数量尽量少，同时损失的信息尽量小。2对特征的要求对特征的要求3.特征选择和特征提取的异同特征选择和特征提取的异同（1）特征选择：从L个度量值集合中按一定准则选出供分类用的子集，作为降维（m维，m L）的分类特征。（2）特征提取：使一组度量值通过某种变换产生新的m个特征，作为降维的分类特征，其中。现在学习的是第4页，共47页(c)是具有分类能力的特征，故选(c)，扔掉(a)、(b)。BA解：法1 特征抽取：测量三个结构特征 (a)周长 (b)面积 (c)两个互相垂直的内径比特征选择：一般根据物理特征或结构特征进行压缩。分析：例：特征选择与特征提取的区别：对一个条形和圆进行识别。当模式在空间中发生移动、旋转、缩放时，特征值应保持不变，保证仍可得到同样的识别效果。现在学习的是第5页，共47页法2：特征抽取：测量物体向两个坐标轴的投影值，则A、B各有2个值域区间。可以看出，两个物体的投影有重叠，直接使用投影值无法将两者区分开。特征选择：将坐标系按逆时针方向做一旋转变化，或物体按顺时针方向变，并适当平移等。根据物体在轴上投影的坐标值的正负可区分两个物体。特征提取，一般用数学的方法进行压缩。BABA现在学习的是第6页，共47页5.2 类别可分性测度类别可分性测度5.2.1 基于距离的可分性测度基于距离的可分性测度类别可分性测度：衡量类别间可分性的尺度。相似性测度：衡量模式之间相似性的一种尺度类内距离和类间距离类概率密度函数类别可分性测度空间分布：随机模式向量：错误率与错误率有关的距离 1类内距离和类内散布矩阵类内距离和类内散布矩阵1)类内距离：同一类模式点集内，各样本间的均方距离。平方形式：Xi,，Xj：n维模式点集X中的任意两个样本。现在学习的是第7页，共47页特征选择和提取的结果应使类内散布矩阵的迹愈？愈好。特征选择和提取的结果应使类内散布矩阵的迹愈小小愈好。若X中的样本相互独立，有式中，R：该类模式分布的自相关矩阵；M：均值向量；C：协方差矩阵；：C主对角线上的元素，表示模式向量第k个分量的方差；tr：矩阵的迹（方阵主对角线上各元素之和）。2)类内散布矩阵：表示各样本点围绕均值的散布情况,即该类分布的协方差矩阵。类现在学习的是第8页，共47页类间散布矩阵的迹愈大大愈有利于分类。2类间距离和类间散布矩阵类间距离和类间散布矩阵1)类间距离：模式类之间的距离，记为。每类模式均值向量与模式总体均值向量之间平方距离的先验概率加权和。2)类间散布矩阵：表示c类模式在空间的散布情况，记为Sb。类间散布矩阵的迹愈？愈有利于分类。3)类间距离与类间散布矩阵的关系：注意：与类间距离的转置位置不同。现在学习的是第9页，共47页3多类模式向量间的距离和总体散布矩阵多类模式向量间的距离和总体散布矩阵1）两类情况的距离 q个 p个共pq个距离两个类区之间的距离=pq个距离的平均距离多类间任意两个点间距离的平均距离类似地多类情况多类间任意两个点间平方距离的平均值现在学习的是第10页，共47页（5-8）类的均值向量：（5-10）c类模式总体的均值向量：（5-11）2）多类情况的距离(2)Jd的另一种形式：将以下3式代入(5-8)式(1)多类模式向量间的平均平方距离Jd（5-9）平方距离：任意类的组合特定两类间任意样本的组合现在学习的是第11页，共47页得某类类内平方距离平均值某类类间平方距离多类模式向量之间的平方距离=各类平方距离的先验概率加权和某类的平方距离模式类间的距离模式类内的距离多类模式向量之间的距离3）多类情况的散布矩阵多类类间散布矩阵：现在学习的是第12页，共47页4）多类模式平均平方距离与总体散布矩阵的关系多类类内散布矩阵：各类模式协方差矩阵的先验概率加权平均值。多类模式的总体散布矩阵：得现在学习的是第13页，共47页距离与散布矩阵作为可分性测度的特点：*计算方便，概念直观（反映模式的空间分布情况）；*与分类错误率没有直接的联系。5.2.2 基于概率分布的可分性测度基于概率分布的可分性测度1散度散度出发点：对数似然比含有类别的可分性信息。1）散度的定义现在学习的是第14页，共47页对不同的X，似然函数不同，对数似然比体现的可分性不同，通常采用平均可分性信息对数似然比的期望值。类对数似然比的期望值：类对数似然比的期望值：散度等于两类的对数似然比期望值之和。现在学习的是第15页，共47页散度表示了区分i类和j 类的总的平均信息。2）散度的性质（1）特征选择和特征提取应使散度尽可能的？特征选择和特征提取应使散度尽可能的大。现在学习的是第16页，共47页（3）错误率分析中，两类概率密度曲线交叠越少，错误率越小。由散度的定义式可知，散度愈大，两类概率密度函数曲线相差愈大，交叠愈少，分类错误率愈小。现在学习的是第17页，共47页据此可估计每一个特征在分类中的重要性：散度较大的特征含有较大的可分信息保留。（5）可加性表明，加入新的特征，不会使散度减小。即3）两个正态分布模式类的散度设i类和j 类的概率密度函数分别为现在学习的是第18页，共47页两类模式之间马氏距离的平方一维正态分布时：两类均值向量距离越远，散度愈大每类自身分布愈集中，两类间的散度愈大模式识别导论（齐敏）p135现在学习的是第19页，共47页5.3 基于类内散布矩阵的单类模式特征提取基于类内散布矩阵的单类模式特征提取对某类模式：压缩模式向量的维数。对多类分类：压缩维数；保留类别间的鉴别信息，突出可分性。特征提取的目的：特征提取操作方法：m1 mn n1(m n)注意：维数降低后，在新的m维空间里各模式类之间的分布规律应至少保持不变或更优化。现在学习的是第20页，共47页讨论内容：*根据类内散布矩阵如何确定变换矩阵A；*通过A如何进行特征提取。1根据类内散布矩阵确定变换矩阵根据类内散布矩阵确定变换矩阵式中，X为n维向量，C为 nn 的实对称矩阵。现在学习的是第21页，共47页 n个特征向量相互正交，且都是单位长度。若选n个归一化特征向量作为A的行，则A为归一化正交矩阵：现在学习的是第22页，共47页(1)(2)Ann现在学习的是第23页，共47页(3)变换后的类内距离变换后：类内距离保持不变。现在学习的是第24页，共47页根据以上特点得到构造变换矩阵的方法：思路：目标：构造一变换矩阵，可以将n维向量X变换成m维（mn）。将变换前的C的n个特征值从小到大排队选择前m个小的特征值对应的特征向量作为矩阵A的行（mn）对X进行A变换优点：压缩了维数；类内距离减小，样本更密集相当去掉了方差大的特征分量。后续现在学习的是第25页，共47页2特征提取的方法特征提取的方法其中，第二步：计算C的特征值，对特征值从小到大进行排队，选择前m个。现在学习的是第26页，共47页第四步：利用A对样本集X进行变换。则m维（m n）模式向量X*就是作为分类用的模式向量。解：1)求样本均值向量和协方差矩阵。现在学习的是第27页，共47页由得由归一化特征向量u1构成变换矩阵A：现在学习的是第28页，共47页变换前变换后现在学习的是第29页，共47页5.4 基于基于K-L变换的多类模式特征提取变换的多类模式特征提取对一类模式：维数压缩。对多类模式：维数压缩，突出类别的可分性。特征提取的目的：卡洛南-洛伊（Karhunen-Loeve）变换（K-L变换）：*一种常用的特征提取方法；*最小均方误差意义下的最优正交变换；*适用于任意的概率密度函数；*在消除模式特征之间的相关性、突出差异性方面有最优的效果。离散K-L变换连续K-L变换分为：现在学习的是第30页，共47页1K-L展开式展开式aj：随机系数；用有限项估计X时：引起的均方误差：代入X、，利用现在学习的是第31页，共47页由两边左乘得。uj为确定性向量 R：自相关矩阵。：拉格朗日乘数现在学习的是第32页，共47页说明：当用X的自相关矩阵R的特征值对应的特征向量展开X 时，截断误差最小。选前d项估计X时引起的均方误差为因此，当用X的正交展开式中前d项估计X时，展开式中的uj应当是前d个较大的特征值对应的特征向量。现在学习的是第33页，共47页K-L变换方法：对R的特征值由大到小进行排队：均方误差最小的X的近似式：矩阵形式：式中，。其中：（5-49）K-L展开式对式(5-49)两边左乘U t：K-L变换系数向量a就是变换后的模式向量。自相关矩阵现在学习的是第34页，共47页2利用自相关矩阵的利用自相关矩阵的K-L变换进行特征提取变换进行特征提取第一步：求样本集X的总体自相关矩阵R。决定压缩后的维数现在学习的是第35页，共47页 3不同散布矩阵的不同散布矩阵的K-L变换变换根据不同的散布矩阵进行K-L变换，对保留分类鉴别信息的效果不同。多类类内散布矩阵：若要突出各类模式的主要特征分量：选用对应于大特征值的特征向量组成变换矩阵；若要使同一类模式聚集于最小的特征空间范围：选用对应于小特征值的特征向量组成变换矩阵。类间散布矩阵：现在学习的是第36页，共47页适用于类间距离比类内距离大得多的多类问题，选择与大特征值对应的特征向量组成变换矩阵。总体散布矩阵：把多类模式合并起来看成一个总体分布。适合于多类模式在总体分布上具有良好的可分性的情况。采用大特征值对应的特征向量组成变换矩阵，能够保留模式原有分布的主要结构。1）变换在均方误差最小的意义下使新样本集X*逼近原样本集 X的分布，既压缩了维数又保留了类别鉴别信息。利用K-L变换进行特征提取的优点：现在学习的是第37页，共47页2）变换后的新模式向量各分量相对总体均值的方差等于原样本集总体自相关矩阵的大特征值，表明变换突出了模式类之间的差异性。3）C*为对角矩阵说明了变换后样本各分量互不相关，亦即消除了原来特征之间的相关性，便于进一步进行特征的选择。K-L变换的不足之处：1）对两类问题容易得到较满意的结果。类别愈多，效果愈差。2）需要通过足够多的样本估计样本集的协方差矩阵或其它类型的散布矩阵。当样本数不足时，矩阵的估计会变得十分粗略，变换的优越性也就不能充分的地显示出来。现在学习的是第38页，共47页3）计算矩阵的本征值和本征向量缺乏统一的快速算法，给计算带来困难。例5.3 两个模式类的样本分别为利用自相关矩阵R作K-L变换，把原样本集压缩成一维样本集。解：第一步：计算总体自相关矩阵R。第二步：计算R的本征值，并选择较大者。由得现在学习的是第39页，共47页现在学习的是第40页，共47页多类类内散布矩阵Sw5.5 特征选择特征选择从n个特征中选择d个(d n)最优特征构成分类用特征向量。5.5.1 特征选取择的准则特征选取择的准则1散布矩阵准则散布矩阵准则类别可分性测度类间散布矩阵Sb多类总体散布矩阵St特征选择准则使tr(Sw)最小使tr(Sb)最大使J1J4最大现在学习的是第41页，共47页2散度准则散度准则用于正态分布的模式类。两类的散度表达式*平均散度选择使J最大的特征子集*变换散度*平均变换散度现在学习的是第42页，共47页5.5.2 特征选择的方法特征选择的方法从n个特征中挑选d个特征，所有可能的特征子集数为组合数很大穷举法：计算出各种可能特征组合的某个测度值，加以比较，选择最优特征组。特点：计算量大，难实现。采取搜索技术可降低计算量。可以得到最优特征组；1最优搜索算法最优搜索算法分支定界算法：唯一能获得最优结果的搜索方法。自上而下、具有回溯功能。现在学习的是第43页，共47页使用条件：可分性测度 J 对维数单调。方法：待选择的n个原特征为根；*将可能的特征组构成树结构。子结点的特征组元素个数逐级下降；叶结点按照规定的特征数构成特征组合。*从最右边的叶结点开始，根据选择的测度回溯搜索。*找到最优特征组，结束。现在学习的是第44页，共47页例：从5个特征中选出2个特征作为模式向量。现在学习的是第45页，共47页2次优搜索算法次优搜索算法虽然不能得到最优解，但可减少计算量。1）单独最优特征组合2）顺序前进法（Sequential Forward Selection，SFS）3）顺序后退法（Sequential Backward Selection，SBS）4）增l减r法（lr法）：SFS和SBS的组合。广义顺序前进法（Generalized SFS，GSFS）广义顺序后退法（Generalized SBS，GSBS）广义的lr法其他：模拟退火（Simulated Annealing）算法 Tabu搜索（Tabu Search）算法遗传算法（Genetic Algorithm）现在学习的是第46页，共47页感感谢谢大大家家观观看看现在学习的是第47页，共47页

注意事项

本文（模式识别之特征选择与提取.ppt）为本站会员（石***）主动上传，淘文阁 - 分享文档赚钱的网站仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知淘文阁 - 分享文档赚钱的网站（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。