04第四章 特征的选择与提取4.6-4.8.ppt
《04第四章 特征的选择与提取4.6-4.8.ppt》由会员分享,可在线阅读,更多相关《04第四章 特征的选择与提取4.6-4.8.ppt(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章 特征的选择和提取4.6 基于Karhunen-Loeve变换的特征提取K-L变换又称主分量分析,是一种正交变换,变换又称主分量分析,是一种正交变换,K-L变换常变换常用来作为数据压缩,这里我们用它作降维,学习这一节用来作为数据压缩,这里我们用它作降维,学习这一节主要要掌握以下几个问题:主要要掌握以下几个问题:1什么是正交变换什么是正交变换 2K-L变换是一种最佳的正交变换,要弄清是什么意义的变换是一种最佳的正交变换,要弄清是什么意义的最佳,也就是说它最佳的定义。最佳,也就是说它最佳的定义。3K-L变换的性质。变换的性质。4K-L变换的重要应用。变换的重要应用。12/20/20221中国
2、矿业大学 计算机科学与技术学院第四章 特征的选择和提取4.6.1 Karhunen-Loeve变换正交变换概念正交变换概念变换是一种工具,是用来描述事物,特别是描述信号用的。变换是一种工具,是用来描述事物,特别是描述信号用的。描述事物的基本方法之一是将复杂的事物化成简单事物的描述事物的基本方法之一是将复杂的事物化成简单事物的组合组合,或对其进行分解,分析其组成的成分。或对其进行分解,分析其组成的成分。变换的实质是一套度量用的工具。变换的实质是一套度量用的工具。对某一套完整的工具就称为某种变换,如傅里叶变换就是用对某一套完整的工具就称为某种变换,如傅里叶变换就是用一套随时间正弦、余弦信号作为度量
3、工具,这些正弦,余弦一套随时间正弦、余弦信号作为度量工具,这些正弦,余弦信号的频率是各不相同的,才能度量出信号中相应的不同频信号的频率是各不相同的,才能度量出信号中相应的不同频率成分。率成分。12/20/20222中国矿业大学 计算机科学与技术学院第四章 特征的选择和提取图图4.6-1 一个正弦信号一个正弦信号图图4.6-2(a)另一种信号另一种信号图图4.6-2(b)信号的基波与谐波信号的基波与谐波12/20/20223中国矿业大学 计算机科学与技术学院第四章 特征的选择和提取对事物可以有不同的描述对事物可以有不同的描述方法。方法。对复杂事物进行经济有效的对复杂事物进行经济有效的描述,我们希
4、望将其分解成描述,我们希望将其分解成相互独立的成分,相互独立的成分,用变换对信号进行分析,用变换对信号进行分析,所使用的数学工具是点积。所使用的数学工具是点积。12/20/20224中国矿业大学 计算机科学与技术学院第四章 特征的选择和提取对正交变换的定义归为:对正交变换的定义归为:如果将这种变换中的每一成分,用一个向量如果将这种变换中的每一成分,用一个向量ui表示,表示,i是是其下标,原理上可以到其下标,原理上可以到,则正交变换可表示成:,则正交变换可表示成:12/20/20225中国矿业大学 计算机科学与技术学院第四章 特征的选择和提取以样本特征向量在特征空间分布为原始数据,通过实行以样本
5、特征向量在特征空间分布为原始数据,通过实行Karhunen-Loeve变换,找到维数较少的组合特征,达到变换,找到维数较少的组合特征,达到降维的目的。由于样本的描述都是离散的向量,因此我们降维的目的。由于样本的描述都是离散的向量,因此我们只讨论只讨论Karhunen-Loeve变换变换(以后称以后称K-L变换变换)的离散情况。的离散情况。K-L变换的最佳变换的最佳:特征空间的降维,原特征空间是特征空间的降维,原特征空间是D维的,现希望降至维的,现希望降至d维维dD。要找的正交变换能使一组样本集的截均方误差的要找的正交变换能使一组样本集的截均方误差的期望值为最小。期望值为最小。K-L变换是一种正
6、交变换,即将一个向量变换是一种正交变换,即将一个向量X,在某一种坐标在某一种坐标系统中的描述,转换成用另一种基向量组成的坐标系表示。系统中的描述,转换成用另一种基向量组成的坐标系表示。这组基向量是正交的,其中每个坐标基向量用这组基向量是正交的,其中每个坐标基向量用ui表示,表示,j=1,,因此,一个向量因此,一个向量X可表示成:可表示成:(4.6-1)12/20/20226中国矿业大学 计算机科学与技术学院第四章 特征的选择和提取对一向量或一向量空间进行正交变换,可采用多种不同的对一向量或一向量空间进行正交变换,可采用多种不同的正交坐标系,关键在于使用正交变换要达到的目的,不同正交坐标系,关键
7、在于使用正交变换要达到的目的,不同的要求使用不同的正交变换。的要求使用不同的正交变换。如果将由如果将由(4.6-1)表示的无限多维基向量坐标系统改成有限表示的无限多维基向量坐标系统改成有限维坐标系近似,即维坐标系近似,即(4.6-2)表示表示X的近似值或估计量,我们希望在同样维数条件下,的近似值或估计量,我们希望在同样维数条件下,使向量使向量X的估计量误差最小。确切地说是使所引起的均方误差:的估计量误差最小。确切地说是使所引起的均方误差:(4.6-3)12/20/20227中国矿业大学 计算机科学与技术学院第四章 特征的选择和提取要找满足要找满足(4.6-3)式为最小是一个求极值的问题,求最佳
8、的式为最小是一个求极值的问题,求最佳的是正交变换的基是正交变换的基ui,i=1,。同时还要满足变换是正交归一这个条件,因此这是一个求同时还要满足变换是正交归一这个条件,因此这是一个求条件极值的问题。条件极值的问题。至于对某一个数据至于对某一个数据X的相应的相应cj值,可以通过值,可以通过X与每一个基与每一个基uj的点积来计算。由于不同的基之间是相互正交的,这个点的点积来计算。由于不同的基之间是相互正交的,这个点积值就是积值就是cj的值,即的值,即cj=ujTx 如果要求一组系数如果要求一组系数cj,并将其表示成一个向量形式并将其表示成一个向量形式C=(c1,c2,)T,则可得:则可得:(4.6
9、-4)12/20/20228中国矿业大学 计算机科学与技术学院第四章 特征的选择和提取则则U就是一个变换矩阵,其中每一行是某一个正交基向量就是一个变换矩阵,其中每一行是某一个正交基向量的转置。由的转置。由X计算计算C称为对称为对X的分解。反过来,如果希望用的分解。反过来,如果希望用C重构信号重构信号X,则它是各个成分之和。则它是各个成分之和。如果我们将对应于每个基如果我们将对应于每个基ui的成分表示成的成分表示成xi,则重构的信号则重构的信号又可表示成一个向量形式。又可表示成一个向量形式。(4.6-5)显然,与原向量显然,与原向量X是有差别的,是原向量的一个近似,要使是有差别的,是原向量的一个
10、近似,要使 与与X的差异越小,则要用更多维数的正交基。的差异越小,则要用更多维数的正交基。12/20/20229中国矿业大学 计算机科学与技术学院第四章 特征的选择和提取如果将如果将代入代入(4.6-3)可得到可得到 由于由于uj,j1,,是正交归一坐标系,有是正交归一坐标系,有(4.6-6)所以有所以有(4.6-7)系数系数cj可以利用正交坐标系的特性得到。如令某一基向量可以利用正交坐标系的特性得到。如令某一基向量uj与向量与向量X作点积,则有作点积,则有(4.6-8)利用利用(4.6-6)有有(4.6-9)12/20/202210中国矿业大学 计算机科学与技术学院第四章 特征的选择和提取(
11、4.6-9)代入代入(4.6-7)得得(4.6-10)如令如令则有则有欲使该均方误差欲使该均方误差为最小,就变成在确保正交变换的条为最小,就变成在确保正交变换的条件下,使件下,使达最小的问题,这可用拉格朗日乘子法求解。达最小的问题,这可用拉格朗日乘子法求解。为此设一函数:为此设一函数:并令其对并令其对uj求导数,得求导数,得(4.6-11)12/20/202211中国矿业大学 计算机科学与技术学院第四章 特征的选择和提取可见向量可见向量uj j=d+1,应是应是矩阵的特征值矩阵的特征值j的特征向的特征向量,而此时截断误差为量,而此时截断误差为如将如将j按其大小顺序排列,即按其大小顺序排列,即则
12、取前则取前d项特征值对应的特征向量组成的坐标系,可使向量项特征值对应的特征向量组成的坐标系,可使向量的均方误差为最小。的均方误差为最小。满足上述条件的变换就是满足上述条件的变换就是K-L变换。变换。12/20/202212中国矿业大学 计算机科学与技术学院第四章 特征的选择和提取4.6.2 K-L变换的性质(1)样本的样本的K-L变换系数变换系数ci与与cj是无关的是无关的(4.6-12)(2)K-L变换后的协方差矩阵为对角矩阵。变换后的协方差矩阵为对角矩阵。令在令在K-L变换后的变换后的D维坐标系统中样本向量为维坐标系统中样本向量为X,则则12/20/202213中国矿业大学 计算机科学与技
13、术学院第四章 特征的选择和提取 为一对角矩阵。为一对角矩阵。表明经过表明经过K-L变换后,原向量各分量之间存在的相关性变换后,原向量各分量之间存在的相关性已被消除。已被消除。图图4.2表示在用表示在用K-L变换变换后新的坐标系中各分量后新的坐标系中各分量的相关性消除。还反映的相关性消除。还反映了样本的了样本的w1分量比较分分量比较分散,因而对分类可能起散,因而对分类可能起较大作用。较大作用。12/20/202214中国矿业大学 计算机科学与技术学院第四章 特征的选择和提取K-L变换的一些典型应用变换的一些典型应用K-L变换的性质:它消除了各分量之间的相关性,因而用它来变换的性质:它消除了各分量
14、之间的相关性,因而用它来描述事物时,可以减少描述量的冗余性,做到用最经济有效的描述事物时,可以减少描述量的冗余性,做到用最经济有效的方法描述事物。方法描述事物。1降维与压缩降维与压缩以人脸图象这个例子看,以人脸图象这个例子看,K-L变换的降维效果是十分明显的。变换的降维效果是十分明显的。对一幅人脸图象,如果它由对一幅人脸图象,如果它由M行与行与N到象素组成,则原始的特到象素组成,则原始的特征空间维数就应为征空间维数就应为MN。而如果在而如果在K-L变换以及只用到变换以及只用到30个基,个基,那么维数就降至那么维数就降至30,由此可见降维的效果是极其明显的。另一,由此可见降维的效果是极其明显的。
15、另一方面降维与数据压缩又是紧密联系在一起的。譬如原训练样本方面降维与数据压缩又是紧密联系在一起的。譬如原训练样本集的数量为集的数量为V,而现采用而现采用30个基,每个基实质上是一幅图象,个基,每个基实质上是一幅图象,再加上每幅图象的描述参数再加上每幅图象的描述参数(式式(4.6-9)中的中的C),数据量是大大数据量是大大降低,尤其是图象数很大时,压缩量是十分明显的。降低,尤其是图象数很大时,压缩量是十分明显的。12/20/202215中国矿业大学 计算机科学与技术学院第四章 特征的选择和提取2构造参数模型构造参数模型使用使用K-L变换不仅仅起到降维与压缩数据的作用,更重要的变换不仅仅起到降维与
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 04第四章 特征的选择与提取4.6-4.8 04 第四 特征 选择 提取 4.6 4.8
限制150内