第二章-图像变换---计算机系主页.ppt
第第3章章 图像变换图像变换p傅立叶变换傅立叶变换(FFT)FFT)p离散余弦变换离散余弦变换(DCT)(DCT)pK-LK-L变换变换p小波变换小波变换问题的提出问题的提出p为达到为达到某种目的某种目的将原始图象变换映射到另一个空间上,使将原始图象变换映射到另一个空间上,使得图象的某些特征得以得图象的某些特征得以突出突出,以便于后面的,以便于后面的处理和识别处理和识别。p一般变换后的图象,大部分一般变换后的图象,大部分能量能量都分布于都分布于低频谱段低频谱段,这对,这对以后图象的以后图象的压缩、传输压缩、传输都比较有利。使得运算次数减少,都比较有利。使得运算次数减少,节省时间节省时间p傅立叶变换FFT线性系统线性系统p对于一般线性系统,往往是用时间作为参数来描述的,表示为一维(t)系统。在图像处理中是用空间作为参数来描述的,通常表示为二维(x,y)系统。输入函数f(x,y)表示原始图像,输出函数g(x,y)表示经处理后的图像,线性系统可看作是一种映射,它反映了各种线性的图像处理方法,其输入和输出的关系表示为:二维线性系统二维线性系统p叠加原理点源和狄拉克点源和狄拉克函数函数 p一幅图像可以看成由无穷多极小的象素组成,每一个象素都可以看作为一个点源,因此,一幅图像也可以看成由无穷多点源所组成 p数学上,点源可以用狄拉克函数来表示,二维函数定义为 p满足狄拉克狄拉克函数性质函数性质(1)(1)函数函数为为偶函数,即偶函数,即(2)(2)位移性位移性或用卷或用卷积积符号符号*表示表示为为(3)(3)可分性可分性(4)(4)乘乘积积性性(5)(5)筛选筛选性性当且当且仅仅当当0 0时时(6)(6)指数函数指数函数卷积p假设f(x)(x=0,1,A-1)以及g(x)(x=0,1,C-1)是两个有限离散函数,其线性卷积为 原原点点对对折折平移xp对于图像二维函数的卷积,则 相关p2个函数的相关定义为 其中其中f*(i)为为f(i)的复共轭的复共轭 一维连续傅立叶变换一维连续傅立叶变换p定义及基本概念定义及基本概念设设f(x)为为x的函数,如果的函数,如果f(x)满足下面的狄里赫莱条件:满足下面的狄里赫莱条件:(1)具有有限个间断点)具有有限个间断点(2)具有有限个极值点)具有有限个极值点(3)绝对可积)绝对可积则有下列式成立:则有下列式成立:x为时域变量,为时域变量,u为频域变量为频域变量(1)(2)如果令如果令w2u,则有则有称为傅立称为傅立叶变换对叶变换对函数函数f(x)的傅立叶变换一般是一个复量,它可以用下式的傅立叶变换一般是一个复量,它可以用下式表示:表示:指数形式:指数形式:|F(w)|称为傅立称为傅立叶谱,叶谱,(w)称称为相位谱,为相位谱,E(w)为能量谱为能量谱或功率普或功率普p实例p傅立叶变换p其相位为Af(x)x/2-/2-u(u)p傅立叶谱p周期函数的傅立叶变换f(x)x傅立叶级数傅立叶级数来表示来表示傅立叶变换傅立叶变换 冲激序列冲激序列w003w0w-3w0-w0F(u)结论p1、只要满足一定条件,连续函数就可以进行傅、只要满足一定条件,连续函数就可以进行傅立叶变换,实际上这个条件在工程应用中很容立叶变换,实际上这个条件在工程应用中很容易满足。易满足。p2、连续非周期函数的傅立叶谱是连续的非周期、连续非周期函数的傅立叶谱是连续的非周期函数,连续的周期函数的傅立叶谱是离散的非函数,连续的周期函数的傅立叶谱是离散的非周期函数。周期函数。二维连续傅立叶变换如果二维函数如果二维函数f(x,y)满足狄里赫莱条件,则将有下满足狄里赫莱条件,则将有下面的傅立叶变换对存在:面的傅立叶变换对存在:与一维傅立叶变换类似,二维傅立叶变换与一维傅立叶变换类似,二维傅立叶变换的傅立叶谱和相位谱为:的傅立叶谱和相位谱为:例:求如图所示的函数的傅立叶谱例:求如图所示的函数的傅立叶谱xyf(x,y)Af(x,y)函数函数其傅立叶变换为:其傅立叶变换为:其傅立叶谱为:其傅立叶谱为:离散傅立叶变换离散傅立叶变换p由于实际问题的时间或空间函数的区间是有限的,或者是频谱有截止频率 p离散傅立叶变换(Discrete Fourier Transform简称DFT)在数字信号处理和数字图像处理中应用十分广泛,它建立了离散时域和离散频域之间的联系 p一维离散傅立叶变换一维离散傅立叶变换非周期性的非周期性的连续信号连续信号周期性的连续周期性的连续信号信号非周期性的非周期性的离散谱离散谱取样作离散取样作离散化处理化处理周期性的连周期性的连续谱续谱离散化并延拓离散化并延拓为周期性信号为周期性信号离散的周离散的周期性谱期性谱连续的非周期连续的非周期性的波形性的波形二维离散傅立叶变换二维离散傅立叶变换p由于图像的频率是表征图像中由于图像的频率是表征图像中灰度变化剧烈程度灰度变化剧烈程度的指标,是灰度在平的指标,是灰度在平面空间上的梯度。面空间上的梯度。p如:大面积的沙漠在图像中是一片灰度变化缓慢的区域,对应的频率如:大面积的沙漠在图像中是一片灰度变化缓慢的区域,对应的频率值很低;而对于地表属性变换剧烈的边缘区域在图像中是一片灰度变值很低;而对于地表属性变换剧烈的边缘区域在图像中是一片灰度变化剧烈的区域,对应的频率值较高。化剧烈的区域,对应的频率值较高。p傅立叶变换在实际中的物理意义,设傅立叶变换在实际中的物理意义,设f是一个能量有限的模拟信号,是一个能量有限的模拟信号,则其傅立叶变换就表示则其傅立叶变换就表示f的谱。的谱。p从纯粹的数学意义上看,傅立叶变换是将一个函数转换为一系列周期从纯粹的数学意义上看,傅立叶变换是将一个函数转换为一系列周期函数来处理的。函数来处理的。p从物理效果看,傅立叶变换是将图像从空间域转换到频率域,其逆变从物理效果看,傅立叶变换是将图像从空间域转换到频率域,其逆变换是将图像从频率域转换到空间域。换是将图像从频率域转换到空间域。p换句话说,傅立叶变换的物理意义是将图像的灰度分布函数变换为图换句话说,傅立叶变换的物理意义是将图像的灰度分布函数变换为图像的频率分布函数,傅立叶逆变换是将图像的频率分布函数变换为灰像的频率分布函数,傅立叶逆变换是将图像的频率分布函数变换为灰度分布函数。度分布函数。一个一个MN大小的二维函数大小的二维函数f(x,y),其离散傅立叶变换对为,其离散傅立叶变换对为 在数字图像处理中,图像一般取样为方形矩阵,即在数字图像处理中,图像一般取样为方形矩阵,即NN,则其傅立叶变换及其逆变换为,则其傅立叶变换及其逆变换为(1)可分性)可分性从上式可以看出,一个二维傅立叶变换从上式可以看出,一个二维傅立叶变换可用二次一维傅立叶变换来实现可用二次一维傅立叶变换来实现傅立叶变换的性质傅立叶变换的性质其意义:一个二维傅立叶变换或反变换都可以分其意义:一个二维傅立叶变换或反变换都可以分解为二步进行,其中每一步都是一个一维傅立叶解为二步进行,其中每一步都是一个一维傅立叶变换或反变换变换或反变换f(x,y)(0,0)N-1N-1xyF(x,v)(0,0)N-1N-1xvF(u,v)(0,0)N-1N-1vu行变换行变换列变换列变换二维傅立叶变换分离成两个一维变换二维傅立叶变换分离成两个一维变换行变换行变换列变换列变换(2)平移性)平移性在空域中,图像原点平移到在空域中,图像原点平移到(x0,y0)时,其对应的频时,其对应的频谱谱F(u,v)要乘上一个负的指数项要乘上一个负的指数项在频域中,原点平移到在频域中,原点平移到(u0,v0)时,其对应的时,其对应的f(x,y)要乘上一个正的指数项要乘上一个正的指数项也就是说,当空域中也就是说,当空域中f(x,y)产生移动时,在频域中只发产生移动时,在频域中只发生相移,而傅立叶变换的幅值不变生相移,而傅立叶变换的幅值不变反之,当频域中反之,当频域中F(u,v)产生移动时,相应的产生移动时,相应的f(x,y)在空在空域中也只发生相移,而幅值不变域中也只发生相移,而幅值不变在数字图像处理中,我们常常将在数字图像处理中,我们常常将F(u,v)的原点移到的原点移到NN频频域方阵的中心,以使能清楚地分析傅立叶变换谱的情况,域方阵的中心,以使能清楚地分析傅立叶变换谱的情况,只需令:只需令:u0v0N/2则则即,如果将图像频谱的原点从起点即,如果将图像频谱的原点从起点(0,0)移到图像中移到图像中心点心点(N/2,N/2),只要只要f(x,y)乘上乘上(1)(xy)因子进行傅因子进行傅立叶变换即可立叶变换即可平移(3)周期性和共轭对程性)周期性和共轭对程性周期性可表示为周期性可表示为 如果如果F(u,v)是是f(x,y)的傅立叶变换,则的傅立叶变换,则F*(-u,-v)是是f(-x,-y)的傅立叶变换的共轭函数的傅立叶变换的共轭函数F(u,v)=F*(-u,-v)|F(u,v)|=|F(-u,-v)|共轭对称性可表示为共轭对称性可表示为(4)旋转不变性)旋转不变性如果引入极坐标如果引入极坐标则则f(x,y)和和F(u,v)分别变为分别变为f(r,)和和F(,)在极坐标系中,存在以下变换对在极坐标系中,存在以下变换对该式表明,如果空间域函数该式表明,如果空间域函数f(x,y)旋转旋转0角度后,相角度后,相应的傅立叶变换应的傅立叶变换F(u,v)在频域中也旋转同一在频域中也旋转同一0角,角,反之,反之,F(u,v)在频域中旋转在频域中旋转0角,其反变换角,其反变换f(x,y)在在空间域中也旋转空间域中也旋转0角角(5)分配性和比例性)分配性和比例性傅立叶变换的分配性表明,傅立叶变换和反变换傅立叶变换的分配性表明,傅立叶变换和反变换对于加法可以分配,而对乘法则不行,即对于加法可以分配,而对乘法则不行,即傅立叶变换的比例性表明,对于二个标量傅立叶变换的比例性表明,对于二个标量a和和b,有有在空间比例尺度的展宽,相应于频域中比例尺度的在空间比例尺度的展宽,相应于频域中比例尺度的压缩,其幅值也减少为原来的压缩,其幅值也减少为原来的(6)平均值性质)平均值性质定义二维离散函数的平均值为定义二维离散函数的平均值为将将u=v=0代入二维离散傅立叶公式,可得代入二维离散傅立叶公式,可得比较上面两式,可看出比较上面两式,可看出若求二维离散信号若求二维离散信号f(x,y)的平均值,只需算出相的平均值,只需算出相应的傅立叶变换应的傅立叶变换F(u,v)在原点的值在原点的值F(0,0)(7)卷积定理)卷积定理卷积定理和相关定理都是研究两个函数的傅立叶变换卷积定理和相关定理都是研究两个函数的傅立叶变换之间的关系,这构成了空间域和频域之间的基本关系之间的关系,这构成了空间域和频域之间的基本关系对于两个二维连续函数对于两个二维连续函数f(x,y)和和g(x,y)的卷积定义为的卷积定义为其二维卷积定理可由下面关系表示其二维卷积定理可由下面关系表示设设则则指出傅立叶变换一个主要好处:与其在一个域中作不指出傅立叶变换一个主要好处:与其在一个域中作不直观的,和难懂的卷积,不如在另外一个域中作乘法,直观的,和难懂的卷积,不如在另外一个域中作乘法,可以达到相同的效果可以达到相同的效果它表明两个二维连续函数在空间域中的卷积可用求其相应的它表明两个二维连续函数在空间域中的卷积可用求其相应的两个傅立叶变换乘积的逆变换而得。两个傅立叶变换乘积的逆变换而得。反之,在频域中的卷积可用空间域中乘积的傅立叶变换而得,反之,在频域中的卷积可用空间域中乘积的傅立叶变换而得,应用卷积定理明显的好处是避免了直接计算卷积的麻烦,它应用卷积定理明显的好处是避免了直接计算卷积的麻烦,它只需要先算出各自的频谱,然后相乘,再求其逆变换,即可只需要先算出各自的频谱,然后相乘,再求其逆变换,即可得到卷积。得到卷积。p离散傅立叶变换和逆变换都是周期函数,为了防止卷积后产生交叠误差,需要对离散的二维函数的定义域加以扩展。p利用一维函数来说明函数定义域的扩展,设f(x)(x=0,1.A-1)和g(x)(x=0,1,.C-1)是两个有限的离散函数,也就是说f(x)定义域为0 xA-1,g(x)的定义域为0 xC-1。则其线性卷积为 p如果利用卷积定理来计算该卷积,则相当于把如果利用卷积定理来计算该卷积,则相当于把f(x)和和g(x)分别以分别以A和和C为周期进行周期延拓,因此,将上式改写为为周期进行周期延拓,因此,将上式改写为(一个周期一个周期)p求得结果将不是需要的求得结果将不是需要的z(x),而是周期循环的,而是周期循环的 p为了避免循环卷积,可以对原被卷积函数补零。由于卷积结果的长度为N=A+C-1,因此,可以把两个被卷积的函数的长度扩展到N,并在原函数定义区间外的部分补零,即取 同样地,二维离散卷积计算时,也必须对被卷积函数同样地,二维离散卷积计算时,也必须对被卷积函数进行延拓和补零,如果被卷积函数进行延拓和补零,如果被卷积函数f(x,y)和和g(x,y)地大地大小分别为小分别为AB和和CD,则延拓后地函数为:,则延拓后地函数为:(8)相关定理)相关定理对于二维连续函数对于二维连续函数f(x,y)和和g(x,y)的相关定义为的相关定义为 相关定理可表示为相关定理可表示为p在离散情况下,与离散卷积一样,需要用增补零的方法扩充f(x,y)和g(x,y)为fe(x,y)和ge(x,y),并根据卷积定理相类似的方法来选取M和N,以避免在相关函数周期内产生交叠误差。快速傅立叶变换快速傅立叶变换(FFT)p离散傅立叶变换已成为数字信号处理的重要工具,然而,离散傅立叶变换已成为数字信号处理的重要工具,然而,它的计算量达,运算时间长它的计算量达,运算时间长,在某种程度上却限制了它的,在某种程度上却限制了它的使用范围。使用范围。p快速算法快速算法大大提高了运算速度大大提高了运算速度,在某些应用场合已,在某些应用场合已能作实能作实时处理时处理,并且应用在控制系统中,并且应用在控制系统中p快速傅立叶变换快速傅立叶变换不是一种新的变换不是一种新的变换,它是离散傅立叶变换,它是离散傅立叶变换的一种算法,它是在分析离散傅立叶变换中的的一种算法,它是在分析离散傅立叶变换中的多余运算的多余运算的基础基础上,进而消除这些重复工作的思想指导下得到的上,进而消除这些重复工作的思想指导下得到的其原理:其原理:对于一个有限长序列对于一个有限长序列f(x)(0 x N-1),它的傅它的傅立叶变换由下式表示:立叶变换由下式表示:令令傅立叶变换对可写为:傅立叶变换对可写为:(1)(2)将正变换将正变换(1)展开得到:展开得到:矩阵表示为:矩阵表示为:从上式可以看出,要得到每一个频率分量,需进行从上式可以看出,要得到每一个频率分量,需进行N次乘次乘法和法和N-1次加法运算。要完成整个变换需要次加法运算。要完成整个变换需要N2次乘法和次乘法和N(N-1)次加法运算。当序列较长时,必然要花费大量的时次加法运算。当序列较长时,必然要花费大量的时间间观察上面的系数矩阵,发现观察上面的系数矩阵,发现Wmn是以是以N为周期的,即为周期的,即当当N=8时,其周期性如图所示,由于时,其周期性如图所示,由于所以当所以当N=8时,可得:时,可得:W0W1W2W3W4W5W6W7可见,离散傅立叶变换中的乘法运算有许多重复内容。可见,离散傅立叶变换中的乘法运算有许多重复内容。1965年库利年库利-图基提出原始的图基提出原始的N点序列依次分解成一点序列依次分解成一系列短序列,然后,求出这些短序列的离散傅立叶变系列短序列,然后,求出这些短序列的离散傅立叶变换,以此来减少乘法运算,例如,设:换,以此来减少乘法运算,例如,设:由此,离散傅立叶变换可写成下面的形式:由此,离散傅立叶变换可写成下面的形式:因为:因为:所以:所以:F1(u)和和F2(u)分别是分别是f1(x)和和f2(x)的的N/2点点的傅立叶变换的傅立叶变换 由于由于F1(u)和和F2(u)均是以均是以N/2为周期,所以为周期,所以 这说明当这说明当mN/2时,上式也是成立的,因此下式成立:时,上式也是成立的,因此下式成立:由上面的分析可见,一个由上面的分析可见,一个N点的离散傅立叶变换可点的离散傅立叶变换可由两个由两个N/2点的傅立叶变换得到点的傅立叶变换得到离散傅立叶变换的计算时间主要由乘法决定,分解后所需离散傅立叶变换的计算时间主要由乘法决定,分解后所需的乘法次数大为减少。第一项为的乘法次数大为减少。第一项为(N/2)2次,第二项为次,第二项为(N/2)2N次,总共为次,总共为2(N/2)2N次运算即可完成,而原次运算即可完成,而原来需要来需要N2次运算,可见分解后的乘法计算次数减少了近一次运算,可见分解后的乘法计算次数减少了近一半。半。当当N为为2的整数幂时,则上式中的的整数幂时,则上式中的F1(u)和和F2(u)还可以再分还可以再分成两个更短的序列,因此计算时间会更短。成两个更短的序列,因此计算时间会更短。由此可见,利用由此可见,利用WNm的周期性和分解运算,从而减少乘法的周期性和分解运算,从而减少乘法运算次数是实现快速运算的关键运算次数是实现快速运算的关键实例实例离散余弦变换p离散余弦变换离散余弦变换(Discrete Cosine Transform-简称简称DCT)是傅里是傅里叶变换的一种特殊情况。在傅里叶级数展开式中,被展开的函数是实叶变换的一种特殊情况。在傅里叶级数展开式中,被展开的函数是实偶函数时,其傅里叶级数中只包含余弦项,称之为余弦变换偶函数时,其傅里叶级数中只包含余弦项,称之为余弦变换 pDCT计算复杂性适中,又具有可分离特性,还有快速算法,所以被广计算复杂性适中,又具有可分离特性,还有快速算法,所以被广泛地用在图象数据压缩编码算法中,如泛地用在图象数据压缩编码算法中,如JPEG、MPEG-1、MPEG-2及及H.261等压缩编码国际标准都采用了离散余弦变换编码算法等压缩编码国际标准都采用了离散余弦变换编码算法 p其变换核是为实数的余弦函数,因而其变换核是为实数的余弦函数,因而DCT的计算速度比的计算速度比DFT快得多快得多p对于具有一阶马尔可夫过程的随机信号,对于具有一阶马尔可夫过程的随机信号,DCT是是K-L变换的最好近似,变换的最好近似,已被广泛应用到图像压缩编码、语音信号处理等领域已被广泛应用到图像压缩编码、语音信号处理等领域p一维离散余弦变换一维离散余弦反变换p二维离散余弦变换二维离散反余弦变换如果令如果令N=4,由一维解析式定义可得如下展开式:由一维解析式定义可得如下展开式:写成矩阵形式:写成矩阵形式:F(u)=Af(x)同理,可得到反变换展开形式:同理,可得到反变换展开形式:写成矩阵形式:写成矩阵形式:f(x)=ATF(u)二维离散余弦变换为:二维离散余弦变换为:F(u,v)=Af(x,y)ATf(x,y)=ATF(u,v)AT离散余弦变换的计算离散余弦变换的计算与傅立叶变换一样,离散余弦变换可以由定义出发进与傅立叶变换一样,离散余弦变换可以由定义出发进行计算,但这样的计算量太大,在实际应用中很不方行计算,但这样的计算量太大,在实际应用中很不方便,寻找快速算法便,寻找快速算法首先,从定义出发,作如下推导首先,从定义出发,作如下推导取实部取实部的意思的意思如果把时域数据向量作系列延拓,即如果把时域数据向量作系列延拓,即则则fe(x)的离散余弦变换可写成为:的离散余弦变换可写成为:则则是是2N点的离散傅立叶变换,所以在作余弦变换时,点的离散傅立叶变换,所以在作余弦变换时,可以把序列长度延拓为可以把序列长度延拓为2N,然后作离散傅立叶变换,然后作离散傅立叶变换,产生的结果取其实部便可得到余弦变换产生的结果取其实部便可得到余弦变换同理,在反变换时,首先在变换空间,把同理,在反变换时,首先在变换空间,把F(u)作如下延拓:作如下延拓:反变换表示为:反变换表示为:可见,离散余弦反变换可以从可见,离散余弦反变换可以从的的2N点反傅立叶变换实现点反傅立叶变换实现计算余弦变换的步骤为计算余弦变换的步骤为 1、把、把f(x)延拓成延拓成,长长度度为为2N2、求、求的的2N点点FFT3、对对u各项乘上对应的因子各项乘上对应的因子 4、取、取实实部,并乘上因子部,并乘上因子 5、取、取F(u)的前的前N项项,即,即维维f(x)的余弦的余弦变换变换离散K-L变换p又称为霍特林又称为霍特林(Hotelling)变换变换p以图像的统计性质为基础的以图像的统计性质为基础的p变换核矩阵变换核矩阵由图像阵列的协方差矩阵的由图像阵列的协方差矩阵的特征值特征值和特征向量和特征向量所决定又称为特征向量变换所决定又称为特征向量变换p当变量之间存在一定的相关关系时,可以通过原始变量的线性组合,当变量之间存在一定的相关关系时,可以通过原始变量的线性组合,构成为数较少的不相关的新变量代替原始变量,而每个新变量都含有构成为数较少的不相关的新变量代替原始变量,而每个新变量都含有尽量多的原始变量的信息。这种处理问题的方法,叫做主成分分析,尽量多的原始变量的信息。这种处理问题的方法,叫做主成分分析,新变量叫做原始变量的主成分。新变量叫做原始变量的主成分。p目的是寻找任意统计分布的数据集合之主要分量的子集。相应的基向目的是寻找任意统计分布的数据集合之主要分量的子集。相应的基向量组满足正交性且由它定义的子空间最优地考虑了数据的相关性。将量组满足正交性且由它定义的子空间最优地考虑了数据的相关性。将原始数据集合变换到主分量空间使单一数据样本的互相关性原始数据集合变换到主分量空间使单一数据样本的互相关性(cross-correlation)降低到最低点。降低到最低点。p图像协方差矩阵图像协方差矩阵假设对某幅假设对某幅NN的图像的图像f(x,y),在某个传输通道上传输了在某个传输通道上传输了M次,因会受到各种因素的随机干扰,接收到是一个图像次,因会受到各种因素的随机干扰,接收到是一个图像集合集合将将M次传送的图像集合写成次传送的图像集合写成M个个N2维向量维向量X1,X2,Xi,XM,生成向量的方法可以采用行堆叠或列堆叠的方法,对第生成向量的方法可以采用行堆叠或列堆叠的方法,对第i次获得的图像次获得的图像fi(x,y),可用可用N2维向量维向量Xi表示:表示:p问题是:如何选取一个合适的正交变换A,使得变换后的图像Y=AX p1)是具有MN2个分量的向量p2)由Y经反变换而恢复的 (向量X的估值)和原始图像具有最小的均方误差,即 称称满满足足这这两个条件的正交两个条件的正交变换变换A为为K-L变换变换。如果能找到。如果能找到这样这样一个一个变变换换,那么就意味着,那么就意味着经过经过一个一个变换变换,不,不仅删仅删除了除了N2-M个分量,并且由个分量,并且由变换结变换结果果Y重新恢复的重新恢复的图图像像是有效的是有效的过滤过滤了随机干了随机干扰扰的原的原图图像的最佳逼近。像的最佳逼近。pX向量的协方差矩阵向量的协方差矩阵CX定义为定义为设设ei和和i是协方差矩阵是协方差矩阵CX对应的特征向量和特征值,对应的特征向量和特征值,将特征值按减序排列,即将特征值按减序排列,即则则K-L变换核矩阵变换核矩阵A的行用的行用CX的特征值的特征值i所对应的特征所对应的特征向量向量ei构成:构成:直接求矩阵直接求矩阵CX的特征值和特征向量很困难。这是因为的特征值和特征向量很困难。这是因为CX是是N2N2维矩阵,维矩阵,尽管图像的大小尽管图像的大小N可能不是很大的,但可能不是很大的,但N2却是很大的数据。这样求其特征却是很大的数据。这样求其特征向量和特征值速度较慢。但如果样本图象个数向量和特征值速度较慢。但如果样本图象个数M不太多,可以先计算出不太多,可以先计算出MM维方阵维方阵LATA的特征值的特征值k和特征向量和特征向量 vk左乘矩阵左乘矩阵A,则有,则有 是矩阵是矩阵CX的的 特征向量特征向量可以选择可以选择P(PM)个较大特征值对应的特征向量(主成分),构造新个较大特征值对应的特征向量(主成分),构造新的的P维主成分空间维主成分空间Q 因为因为CX是实对称矩阵,总能找到一个标准正交的特征向量集合,是实对称矩阵,总能找到一个标准正交的特征向量集合,使使A-1=AT,那么可得,那么可得K-L反变换为反变换为 K-L变换的性质和特点变换的性质和特点(1)Y的平均值向量的平均值向量my0,即为零向量即为零向量0(2)Y向量的协方差向量的协方差(3)对角性)对角性对角线上的元素是原始图像向量的协方差矩阵对角线上的元素是原始图像向量的协方差矩阵CX对应的特征值对应的特征值i,它也是它也是Y向量的方差。而非对角向量的方差。而非对角线上的元素值为线上的元素值为0,说明,说明Y向量中各元素之间相关向量中各元素之间相关性小,而性小,而CX的非对角线上元素不为的非对角线上元素不为0,说明原始,说明原始图像元素之间相关性强,这就是采用图像元素之间相关性强,这就是采用K-L变换进变换进行编码,数据压缩比大的原因行编码,数据压缩比大的原因显然显然K-L坐标系将矩阵坐标系将矩阵CX对角化了,换句话说,通过对角化了,换句话说,通过K-L变换,消除了原有向量变换,消除了原有向量X的各分量之间的相关性,从而的各分量之间的相关性,从而可能去掉那些带有较少信息的坐标轴,以达到降低特征可能去掉那些带有较少信息的坐标轴,以达到降低特征空间维数的目的。空间维数的目的。X1X2e 1e 2在原来坐标系中,要用两个分量在原来坐标系中,要用两个分量X1,X2来表示各个样本,来表示各个样本,而在而在K-L坐标系中,只要用坐标系中,只要用e1就可以,去掉就可以,去掉e2并不会带并不会带来很大的误差来很大的误差假设矩阵假设矩阵CX只有少数几个数值大的特征值,而其余的特只有少数几个数值大的特征值,而其余的特征值数值很小,征值数值很小,K-L坐标系就可以有效的进行信息压缩坐标系就可以有效的进行信息压缩pK-L变换的最大优点是去相关性好,可用于数据变换的最大优点是去相关性好,可用于数据压缩和图像旋转压缩和图像旋转p主要困难是由于协方差矩阵主要困难是由于协方差矩阵CX求特征值求特征值和特征和特征向量解方程的计算量大,同时向量解方程的计算量大,同时K-L变换是非分离变换是非分离的,二维不可分,一般情况下,的,二维不可分,一般情况下,K-L变换没有快变换没有快速算法速算法实例实例以以K-L变换进行自动的人脸识别为例说明变换进行自动的人脸识别为例说明我们把一幅数字图像看成一个矩阵或一个数组,用我们把一幅数字图像看成一个矩阵或一个数组,用B(i,j)或或bij 表示,幅表示,幅NN大小的人脸图像按列相连构成一大小的人脸图像按列相连构成一个个N2维矢量维矢量x=(b11 b21bN1 b12b22bN2 b1N b2NbNN)它可视为它可视为N2维空间中的一个点,假设维空间中的一个点,假设N=128。由于人脸由于人脸结构的相似性结构的相似性,当把很多这样的人脸图像归一化之后,当把很多这样的人脸图像归一化之后,这些图像在这一超高维空间中这些图像在这一超高维空间中不是随机或散乱分布不是随机或散乱分布的,的,而是存在而是存在某种规律某种规律,因此可以通过,因此可以通过K-L变换用一个变换用一个低维低维子空间描述人脸图像子空间描述人脸图像,同时又能保存所需要的识别信息,同时又能保存所需要的识别信息p图像的归一化图像的归一化对于一个全自动的人脸识别系统,其首要的工作是人脸对于一个全自动的人脸识别系统,其首要的工作是人脸图像的分割以及主要器官的定位图像的分割以及主要器官的定位。另外,由于。另外,由于K-L变换变换本质上依赖于本质上依赖于图像灰度在空间分布上的相关性图像灰度在空间分布上的相关性,因此还,因此还需要对人脸图像进行一系列的预处理,以达到位置校准需要对人脸图像进行一系列的预处理,以达到位置校准和灰度归一化的目的和灰度归一化的目的假设已根据分割及定位算法,得到了人脸正面图像假设已根据分割及定位算法,得到了人脸正面图像左右左右两眼中心的位置,并分别记为两眼中心的位置,并分别记为Er和和El,则可通过下述步则可通过下述步骤达到图像校准的目的骤达到图像校准的目的1、进行、进行图像旋转图像旋转,以使,以使Er和和El的的连线连线ErEl保持水平保持水平。这保证了人脸这保证了人脸方向的一致性方向的一致性,体现了人脸在图像平,体现了人脸在图像平面内的面内的旋转不变性旋转不变性2、根据图所示的比例关系,进行图、根据图所示的比例关系,进行图像裁剪。图中,像裁剪。图中,O点为点为ErEl的中点,的中点,且且d=ErEl。经过裁剪,在经过裁剪,在2d2d的图的图像内,可保证像内,可保证O点固定于点固定于(0.5d,d)处。处。这保证了人脸这保证了人脸位置的一致性位置的一致性,体现,体现了人脸在图像平面内的了人脸在图像平面内的平移不变性平移不变性3、进行图像缩小和放大变换,得到统一大小的标准图、进行图像缩小和放大变换,得到统一大小的标准图像,规定标准图像的大小为像,规定标准图像的大小为128128象素点,则缩放倍象素点,则缩放倍数为数为=2d/128。这使得这使得d=ErEl为定长为定长(64个象素点个象素点),即,即保证了人脸保证了人脸大小的一致性,体现了人脸在图像平面内的大小的一致性,体现了人脸在图像平面内的尺度不变性尺度不变性经过校准,不仅在一定程度上获得了人脸表示的几何不经过校准,不仅在一定程度上获得了人脸表示的几何不变性,而且还基本上消除了头发和背景的干扰。变性,而且还基本上消除了头发和背景的干扰。完成了旋转、平移和尺度不变性后,需要对校准的图完成了旋转、平移和尺度不变性后,需要对校准的图像做灰度拉伸,以改善图像的对比度,然后采用直方像做灰度拉伸,以改善图像的对比度,然后采用直方图修正技术使图像具有统一的均值和方差,一部分消图修正技术使图像具有统一的均值和方差,一部分消除光照强度的影响除光照强度的影响假设人脸数假设人脸数据库中,由据库中,由20人,每人人,每人10幅人脸图幅人脸图像像pK-L变换变换以归一化后的标准图像做为训练样本集,以该样以归一化后的标准图像做为训练样本集,以该样本集的总体散布矩阵为协方差矩阵,即本集的总体散布矩阵为协方差矩阵,即xi为第为第i个训练样本的图像个训练样本的图像向量,向量,为训练样本集的为训练样本集的平均图像,平均图像,M为训练样本为训练样本的总数的总数为了为了N2N2维矩阵维矩阵的特征值和正交归一的特征向量,的特征值和正交归一的特征向量,直接计算是困难的,因此引入一个定理,奇异值分解直接计算是困难的,因此引入一个定理,奇异值分解SVD设设A是一秩为是一秩为r的的nr维矩阵,则存在两个正交矩阵:维矩阵,则存在两个正交矩阵:以及对角阵以及对角阵满足满足其中其中i为矩阵为矩阵AAT和和ATA的非的非0特征值,特征值,u和和v分别为分别为AAT和和ATA对应于对应于i的特征向量,上述分解称为矩阵的特征向量,上述分解称为矩阵A地奇异值分解,地奇异值分解,为为A的奇异值的奇异值推论推论由于由于可表示为:可表示为:故,构造矩阵:故,构造矩阵:容易求其特征值容易求其特征值i及相应的正交归一特征向量及相应的正交归一特征向量vi(i=0,1,2M-1)。由推论可知,由推论可知,的正交归一化特征的正交归一化特征向量向量ui为为这就是图像的特征向量,它是通过计算较低维矩阵这就是图像的特征向量,它是通过计算较低维矩阵R的特征值与特征向量而间接求出的的特征值与特征向量而间接求出的将特征值从大到小排序:将特征值从大到小排序:0 1 r-1,其对应的其对应的特征向量为特征向量为ui。这样,每一幅人脸图像都可以投影到这样,每一幅人脸图像都可以投影到由由u0,u1,uM-1张成的子空间中。因此每一幅人脸图张成的子空间中。因此每一幅人脸图像对应于子空间中的一个点,同样,子空间中的任一像对应于子空间中的一个点,同样,子空间中的任一点也对应于一幅图像点也对应于一幅图像特征脸特征脸对于任一待识别样本对于任一待识别样本f,可通过向可通过向“特征脸特征脸”子空子空间投影求出其系数向量:间投影求出其系数向量:y=Utf其重建图像其重建图像 f=Uy考虑重建图像的信噪比考虑重建图像的信噪比 RSN=10lg(|f|2/|f-f|2)若其小于阈值,则若其小于阈值,则 可判断可判断f不是人脸图像。不是人脸图像。小波变换小波变换p广泛应用:信号处理、图像处理、模式识别、量子物理、非广泛应用:信号处理、图像处理、模式识别、量子物理、非线性科学领域线性科学领域p原则上,凡传统使用原则上,凡传统使用Fourier分析的方法,都可以用小波分分析的方法,都可以用小波分析代替析代替p与与Fourier变换、变换、Gabor变换相比,小波变换是空间(时变换相比,小波变换是空间(时间)和频率的局部变换间)和频率的局部变换p伸缩和平移等运算功能可对函数或信号进行多尺度的细化分伸缩和平移等运算功能可对函数或信号进行多尺度的细化分析,解决了析,解决了Fourier变换不能解决的许多困难,对高频采变换不能解决的许多困难,对高频采取逐渐精细的时域或空域步长,从而可以聚焦到分析对象的取逐渐精细的时域或空域步长,从而可以聚焦到分析对象的任意细节数学显微镜任意细节数学显微镜为了用傅立叶变换研究一个为了用傅立叶变换研究一个模拟信号的谱特性模拟信号的谱特性,必须获得,必须获得信号在信号在时域中的全部信息时域中的全部信息,包括将来的信息,即傅立叶变,包括将来的信息,即傅立叶变换换对时间的分辨率为对时间的分辨率为0,对频率的分辨率为无穷,对频率的分辨率为无穷。如果一。如果一个信号在某个时刻的一个个信号在某个时刻的一个小的邻域中变化小的邻域中变化了,那么整个了,那么整个频频谱就谱就受到影响。如语音信号、地震信号等,希望知道信号受到影响。如语音信号、地震信号等,希望知道信号在突变时刻的频率成分,如利用傅立叶变换,这些非平稳在突变时刻的频率成分,如利用傅立叶变换,这些非平稳的突变成分被傅立叶变换的积分作用平滑了。的突变成分被傅立叶变换的积分作用平滑了。可以看出,可以看出,在非平稳信号分析和实时信号处理的许多应用在非平稳信号分析和实时信号处理的许多应用中,只有傅立叶变换公式是不够的,傅立叶变换无法反映中,只有傅立叶变换公式是不够的,傅立叶变换无法反映信号的局部时域和频域特性,只适宜处理平稳信号信号的局部时域和频域特性,只适宜处理平稳信号正是由于傅立叶变换存在不能同时进行时间正是由于傅立叶变换存在不能同时进行时间-评论局评论局部分析的缺点,部分析的缺点,Gabor提出一种加窗傅立叶变换提出一种加窗傅立叶变换在信号的时间在信号的时间-频率分析中,频率分析中,D.Gabor注意到了傅立叶注意到了傅立叶变换的不足,在变换的不足,在1946年,论文中为提取信号傅立叶变年,论文中为提取信号傅立叶变换的局部信息,引入了一个换的局部信息,引入了一个时间局部变化时间局部变化的的“窗函数窗函数”,称为,称为Gabor变换,又称为加窗傅立叶变换变换,又称为加窗傅立叶变换但但Gabor变换的时变换的时-频窗口是频窗口是固定不变固定不变的,窗口没有自适的,窗口没有自适应性,不适于分析多尺度信号过程和突变过程,而且其应性,不适于分析多尺度信号过程和突变过程,而且其离散形式没有正交展开,难于实现高效算法,这是离散形式没有正交展开,难于实现高效算法,这是Gabor变换的主要缺点变换的主要缺点在非平稳信号的分析中,希望存在一种变换函数,它能在非平稳信号的分析中,希望存在一种变换函数,它能满足:满足:对于高频谱的信息,时间间隔要相对的小,以便对于高频谱的信息,时间间隔要相对的小,以便给出比较好的精度;而对于低频谱的信息,时间间隔要给出比较好的精度;而对于低频谱的信息,时间间隔要相对的宽,以便给出完全的信息,相对的宽,以便给出完全的信息,也就是说,要有一个也就是说,要有一个灵活可变的时间灵活可变的时间-频率窗,使在高频率窗,使在高“中心频率中心频率”时,时窗时,时窗宽度自动变窄;在低宽度自动变窄;在低“中心频率中心频率”时,时频窗宽度自动时,时频窗宽度自动变宽变宽1984由法国的从事石油勘测信号处理的地球物理学家由法国的从事石油勘测信号处理的地球物理