《基于Gabor小波的人脸特征提取算法研究与仿真论文.doc》由会员分享,可在线阅读,更多相关《基于Gabor小波的人脸特征提取算法研究与仿真论文.doc(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Southwest university of science and technology 本科毕业设计(论文)题目名称:基于Gabor小波的人脸特征提取算法研究与仿真50 / 50基于Gabor小波的人脸特征提取算法研究与仿真摘要:人脸识别技术是模式识别与人工智能的研究热点之一。在生物特征识别中,人脸识别占有极为重要的地位。它在访问控制、司法应用、电子商务和视频监控等领域都有广泛的应用。人脸特征提取是人脸识别过程的核心,特征提取的有效性直接影响到分类的速度和识别的性能。本论文的主要研究容包括以下方面:(1)基于Gabor变换的人脸特征提取算法。通过对人脸傅里叶变换和Gabor变换的实验比较
2、,证明了Gabor变换在提取人脸特征方面具有很大的优越性。接着,介绍了Gabor小波变换的快速算法。 (2)针对 Gabor小波的缺点,引进LBP算子,该算子的使用能有效的克服Gabor小波变换的缺点。另外还详细介绍了如何提取“特征脸”的原理和实现过程,对Gabor滤波器参数的选择问题也作了详细说明。(3) 针对Gabor和LBP提取的人脸特征向量维数过高问题,本文分别采用了LPP和PCA降维算法来进行降维。(4)对最后提取的人脸特征通过计算特征向量的距离来量化查询图像和图像库中每幅图像间的相似程度。该部分主要是将提取出来的人脸特征向量进行验证,并对两种不同降维方法做比较。本文最后是在orl和
3、yale两个人脸图库做仿真实验。实验表明,采用用LPP降维得到的相似度要远高于使用PCA降维结果。关键词:人脸识别;Gabor小波变换;LBP;距离测度FacialfeatureextractionalgorithmresearchandsimulationbasedonGaborwaveletsAbstract:Face Recognition Technology(FRT)is emerging as an active research area in the field of patternrecognition and artificial intelligence.As a bio
4、metric technology,FRT has numerous applications such asaccess control,law enforcement,e-commerce,video surveillance and so on. Face feature extraction is the core of recognition task,whichdirectly impact on classification velocity and face recognition ability.The main contributions of this work are
5、listed as follows:(1)Face feature extraction algorithm based on Gabor transform is introduced.Compared with Fourier transform,Gabor transform is proved to be better in face feature extraction.And then,A fast algorithm of Gabor Transform is introduced.(2) According to the disadvantages of Gabor wavel
6、et,This paper introduced LBP operator, the operator can overcome the faultsofGabor wavelet transform effectively . Also it introduced the principle and realization processhow to extract features facein detailed, and the selection of parameters of Gabor filter are detailed instructions.(3) For the pr
7、oblem to the face feature vector high dimension in Gabor and LBP extraction ,this paper used the LPP and PCA dimension reduction algorithm reduced the dimension.(4) In thefinal face feature extraction ,By calculating the distance of the feature vector to lookthe similarity betweenthe image to inquir
8、e and each image in image database. This part ismainly to verify the extracted face feature vector , and to comparetwo different dimension reduction method .Finally, This paper do the simulation experiment in the orl and yale two face database . The experimentresults show that the LPP dimension redu
9、ction method is better than PCA dimension reduction method.Key words: Face recognition; Gabor wavelet transform; LBP; Distance measure目录第1章 绪 论51.1 课题的背景和意义51.2 当前人脸识别的国外现状71.3 课题的总设计思路81.4 人脸特征提取的步骤与方法81.4.1 人脸图像的预处理91.4.2 基于Gabor小波算法进行人脸特征提取91.4.3 应用LBP算子101.4.4 采用PCA和LPP对提取的特征向量降维,以提高识别时间101.4.5
10、用距离测度法度量相似度进行结果测试101.5 本章小结10第2章 Gabor小波变换112.1引言112.2 Gabor小波变换的定义132.3 Gabor变换在人脸识别中的应用152.4 Gabor滤波器152.4.1 Gabor滤波器参数的选择192.4.2 Gabor滤波器的性质和计算方法192.4.3 Gabor变换的人脸特征提取202.5Gabor快速算法图212.5.1快速傅里叶变换(FFT)222.5.2Gabor变换的快速算法242.6本章小结25第3章 LBP算法、PCA和LPP降维算法263.1 引言263.2 LBP基本算子263.2.1 改进的LBP算子273.3 PC
11、A降维算法的实现原理283.3.1 PCA的基本概念293.3.2 PCA原理293.3.3 PCA算法303.4 LPP算子降维原理313.4.1 LPP算法降维实现原理313.5 本章小结32第四章 距离测度法度量相似度比较334.1 引言334.2 距离测量简介334.3 具体算法344.4 ORL人脸库实验分析354.4.1 算法的比较364.5 YALE人脸库实验374.6 本章小结38结 论39参考文献40致 42附录一43附录二46附录三47第1章 绪 论1.1 课题的背景和意义在现在这个信息化的时代中,身份识别技术的应用价值是非常重要的。随着网络技术的快速发展,信息安全也显示出
12、前所未有的重要性。在电子商务、金融信息、司法安全、网络传输等各个应用领域,都需要精确而唯一的身份鉴定1。然而,如今的身份识别主要依靠、工作证和密码手段来鉴定一个人的身份。这些手段具有诸多缺点:如不便携带、易丢失、易损坏最后导致不可识别;而密码手段的缺点更加凸显:不便记忆,易被破解等。近年来,由于电子商务的迅猛发展,伪造制假的手段也是越来越先进,传统的身份识别方法受到了严峻的挑战,对于科技的发展和社会的进步显得有点跟不上脚步。 生物特征识别技术(Biometrics)以其唯一性、高可靠性和稳定性成为了人们争相研究的热门技术。所谓生物特征识别2,就是根据不同人之间的身体(physical)的或者行
13、为(behavioral)的特征的独特性,来唯一地把未知身份识别出来。身体特征包括:指纹、视网膜、虹膜、人脸等;行为特征包括签名、声音、步态等。有的识别是几种特征的结合,如身份识别可以结合人脸和指纹两个特征。人脸识别是身份识别技术的一种,它在身份识别领域的发展和应用方面都有着重大意义:一是可以推进对人类视觉系统本身的认识;二是可以满足人工智能应用的需要。采用人脸识别技术,建立自动人脸识别系统,用计算机实现对人脸图像的自动识别有着广阔的应用领域和诱人的应用前景。而人脸特征提取又是人脸识别技术当中最重要的步骤,可以这么说,人脸特征提取的优劣直接影响到人脸的识别率。人脸本身的采集方式多样,既可以是静
14、态图像,也可以是动态图像。通常我们辨别一个人是通过我们的眼睛观察这个人的脸部特征,恰好人脸识别和人们通常的识别相符合,所以很容易被接受。因此,人脸识别与其相关技术的应用前景也是生物特征识别诸多技术中最被看好的。生物特征识别在国外起步早,也发展很快2 。而我国在这方面就起步稍晚,不过发展却是极为迅速。人脸识别是我们日常生活中必不可少的技能,是我们辨认一个人采用的最普遍的生物特征识别方法。人脸识别相对于其它的生物特征识别技术来说,具有以下独特优势:(1)友好、直观和方便。人脸识别由于十分符合人们的习惯,人们很容易接受和不会让人感觉有障碍;(2)对用户不会造成不必要的干扰。因为人脸识别不需要与相关设
15、备直接接触,也不需要被测试者需要特定的行为,在这一点上它是区别于其他任何生物特征技术的;(3)对拍摄设备无要求。只要能照相的设备,手机相机皆可,由于这些设备目前已普与,故为人脸识别的广泛应用提供了有力的基础和保障;1.2 当前人脸识别的国外现状 在当今这个信息化的时代,人脸识别系统在很多领域都有举足轻重的作用,尤其是用在司法机关、网络信息安全、司机驾照验证和事业单位的考勤等。 前面有说道:虽然我国这方面起步比较晚,但是在这方面发展却是非常快的。截至目前,我过在这方面也取得了一定的成就,08年的奥运会就正式启用了中国自主产权研发的人脸识别系统。另外,由中科院计算所高文教授主持的国家863项目“面
16、像检测与识别核心技术”也通过成果鉴定,并初步应用,这也就标志着我国在人脸识别这一当今热点科研领域掌握了一定的核心技术。该系统会自动在人脸上选取103个点,然后通过分析面部皮肤反射属性、三维结构等特征进行识别,在静态场景下识别准确率会达到96.5。 其实在早前,科瑞奇技术开发股份在2002年开发了一种人脸鉴别系统,对人脸图像进行处理,排除外界因素,再对图像进行特征提取和识别。这对于人脸鉴别特别有价值,因为人脸鉴别通常使用正面照,要鉴别的人脸图像是不同时期拍摄的,使用的照相机不一样。系统可以接受时间间隔较长的照片,并能达到较高的识别率,在计算机中库藏2300人的正面照片,每人一照片,使用相距1-7
17、年、差别比较大的照片去查询,首选率可以达到50%,前20输出照片中包含有与输入照片为同一人的照片的概率可达70%。 在国外,人脸识别起步就比较早了。最早的自动人脸识别研究论文是 1965年 Chan&Bledsoe 在 Panoramic Research Inc 发表的技术报告,但是由于当时的技术条件有限,所以取得的成就并不是很显著。而70年代时,美、英等发达国家就已经开始重视人脸识别的研究了,并取得了一定的成绩。 从1990年代起,由于社会的发展,加上人们对人脸图像自动识别的迫切需求,越来越多的外国科研单位开始着手研究,因此人脸模式识别方法有了较大的突破。1996年美国军方更是组织了人脸自
18、动识别系统大赛,获得冠军的是勒克菲勒大学的Face1t系统。由此可见,外国的在这方面要比中国早很多,也成熟很多。最近,美国的LAU公司研制的人脸图像自动识别系统,是按照平常人们的生活习惯(即人眼辨别人脸)的原理,基于生物测量学、人像复原技术开发的装置。用人脸1242个特征点,对人群中寻找的人进行定量定性识别,已经用在机场、火车站等公共场所和重点控制地区。另外,国外的一些高校在这方面也取得了显著的成就,主要是以麻省理工大学(Massachusetts Institute of Technology )、卡基梅隆大学(Carnegie Mellon University)和英国的雷丁大学(Univ
19、ersity of Reading)等为首。而公司(Visionics 公司Facelt人脸识别系统、Viiage的FaceFINDER身份验证系统、Lau Tech 公司Hunter系统、德国的BioID系统等)他们的工程研究工作主要放在公安、刑事方面,在考试验证系统的实现方面深入研究并不多。1.3 课题的总设计思路 本设计是基于MATLAB平台实现的人脸特征提取。系统原理框图如图1所示: 图1 系统原理框图 从系统框图我们可以知道,人脸特征提取的步骤如下:1)、从图库中读取一图像,并且对选取图像进行预处理;2)、根据需要设计Gabor滤波器参数,并对处理后的图像进行多方向和多尺度的进行滤波
20、;3)、先对得到的不同方向Gabor对得到的Gabor滤波图像分别进行LBP运算得到纹理图像特征;4)、然后分别用LPP和PCA对得到纹理图像特征向量进行降维;5)对降维得到的人脸特征向量用距离测度度量相似度进行测试。1.4 人脸特征提取的步骤与方法Chellappa给出的人脸识别定义是,给出静态或者视频图像,将其中的一个或多个人脸和存储于数据库中的人脸相比较,确定出图像或视频中各个脸的身份。一般要在输入之前对图像进行预处理,若有人脸存在,则将其从背景中分割出来。一般来说,一个完整的人脸识别系统包括。图像输入、人脸检测/定位、预处理、特征提取、分类器5部分。1.4.1 人脸图像的预处理 在现实
21、情况下,我们所提取的人脸图像可能绝大多数都不是标准格式的,不仅如此,可能还会受到各种各样的因素影响,进而导致最终的人脸识别准确率不是那么高,为了尽可能的减小甚至消除这些情况对人脸识别的影响,故而在人脸特征提取之前需要进行人脸图像的预处理。该步骤主要是对输入的人脸图像进行预处理,目的是消除其他因素的影响,改善图片质量,统一图像的灰度值与尺寸,为以后的特征提取和人脸分类识别打好基础。一般情况下人脸都处在一个复杂背景中,所以预处理的时候要先进行人脸检测,将人脸部分从复杂背景中检测提取出来,由于本文的研究容只是人脸特征提取部分,故而没有人脸图像预处理部分,而是直接采用已预处理好的ORL和YALE人脸图
22、库。1.4.2基于Gabor小波算法进行人脸特征提取 人脸特征提取就是采用某种方法来表示人脸局部特征,当然采用的方法不同,所提取的人脸信息也有所不同。 本文研究的基于Gabor小波变换的人脸特征提取的理论依据:任意可以用高斯函数调制的复正弦形式表示的信号都可以达到时域和频域联合不确定关系的下限。也就是说,可以再时域和频域获得最佳的分辨率。 Gabor滤波器对人脸图像的响应特性主要体现在边缘、亮度和位置3方面的特征。图像的局部灰度值的突变反映的是边缘特征,输入信号和滤波器信号叠加的结果就是卷积计算的输出,当输入信号的变化与滤波器信号的变化相一致时,输出较强,反之亦然。而当图像的边缘特征方向与二维
23、Gabor滤波器纹理特征方向一致的时候,二维Gabor小波变换有较强的响应,如眼睛,鼻子等部位Gabor响应输出较为强烈。通过修改Gabor函数的参数sigma,theta,可以获得不同中心频率,不同方向上的Gabor滤波器,从而提取到不同尺度和不同局部细节的纹理图像特征。最后考虑到Gabor小波变换不能旋转的缺点,故之后用LBP算法将Gabor滤波图像再分别进行特征提取,再将得到的图像分为互不重叠的区域,分别对各个区域建立LBP直方图信息,再将各个尺度下的LBP直方图特征进行组合匹配连接起来,构成人脸图像的特征向量。其实在这里对于Gabor小波变换的人脸特征提取基本上已经结束,但是考虑到这样
24、提取出来的特征向量维数会比较高,计算起来需要用到的时间会很长。所以在最后用到了PCA和LPP对提取的特征向量进行降维,以提高识别时间。1.4.3 应用LBP算子 在Gabor滤波后再分别进行LBP特征提取,是因为LBP作为一种纹理描述方法,能够有效地反映人脸图像的局部特性,也是为了更有效的解决旋转变化、光照变化和尺度变化等图像分类问题,这也是本设计的创新点。1.4.4 采用PCA和LPP对提取的特征向量降维,以提高识别时间 PCA(Principal Component Analysis,主成分分析)是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简
25、化复杂的问题。计算主成分的目的是将高维数据投影到较低维空间。 LPP(Locality Preserving Projection,局部保局投影)作为拉普拉斯特征映射的一种线性逼近可以较好的反映样本的流形结构,已经被广泛的应用到图像检索和图像修复中。局部保持投影(LPP)是比较经典的线性方法,着重关注于数据的局部关系。 1.4.5 用距离测度法度量相似度进行结果测试在完成人脸特征的提取后,本设计还没有最终完成,因为我们还需要检测我们提取的人脸特征是否准确完善。在这里我使用距离测度法来度量相似度进行结果检测。现有比较成熟的距离测度方法主要有以下几种,如Minkowsky 距离(明氏距离)、Euc
26、lidean 距离(欧氏距离)、Mahalanobis 距离(马氏距离)和Hausdorf距离等。本设计将选用欧式距离测度法来度量人脸相似度进行结果检测,原因在于欧式距离在一定程度上放大了较大元素误差在距离,应用广泛。1.5 本章小结本章主要介绍了此次课题研究的背景和意义、国外在这方面的研究现状,针对目前面对的技术难题,提出了本课题的研究容和技术思路,在概述本文主要工作的同时给出了文章的结构。第2章 Gabor小波变换2.1引言Gabor展开是一种同时用时间和频率表示一个时间函数的方法,而求解Gabor展开系数的公式被称为Gabor变换。传统的Gabor变换的缺点是窗口尺寸一经确定就无法更改,
27、因此不具有变焦特性,无法对信号进行多分辨率分析。为解决这一问题人们将Gabor理论同小波理论相结合,提出了Gabor小波。Gabor小波具有小波变换的多分辨率特性,同时具有Gabor函数本身所具有的局域性和方向性。 标准傅立叶变换是数字信号处理的有利工具,然而它只能反映信号在整个实轴的整体性质,而不能反映信号在局部时间围中的特征。对于图像,我们关心的往往是局部的特征,如图像边缘,由于标准傅立叶变换不能同时在时域和频域具有对信号的局部分析能力,Dennis Gabor于1946年在他的论文中,为了提取信号傅立叶变换的局部信息,引入了一个时间局部化“窗函数”,其中参数用于平移动窗以便覆盖整个时域。
28、实际上,Gabor使用了一个Gaussian函数作为窗函数。因为一个Gaussian函数的傅立叶变换还是一个Gaussian函数,所以傅立叶逆变换也是局部的。Gabor变换是唯一能够达到时频测不准的下界的函数,是图像表示中一种较好的模式,它的最大优点在于它能够达到交叉熵的最低边缘,能够最好地兼顾信号在时域和频域的分辨率,而且人类的视觉系统对于这种函数有非常好的匹配特性。Gabor函数的这些特性,使得它在信号处理中获得广泛的应用,特别应用于低级视觉如纹理分割、光流估计、数据压缩和边缘检测等。Gabor变换虽然在一定程度上克服了标准傅立叶变换不具有局部分析能力的缺陷,且能最好地兼顾信号在时城和频域
29、地分辨率,但它同时也存在着自身不可克服的局限,即当窗函数确定后,窗口的形状就确定了,因此Gabor变换是一种单一分辨率的分析。 目前Gabor变换和Gabor展开已被公认是信号与图像表示的最好的方法之一。Gabor变换中要解决的最基本问题是:在给定综合窗下如何求解分析窗与Gabor变换系数。Gabor变换广泛应用的困难也就是在于找不到一种简单的计算变换系数的方法,因为Gabor基本函数彼此之间互不正交。近十几年来,围绕这一问题国外相继提出了很多解决方法,最主要的有以Bastiaans、Wexler和Qian等人为代表的解析法,Daugman等人提出的神经网络方法以与Ibrahim等人提出的自适
30、应学习算法等等。但不论上述哪一种方法,均为复数形式的Gabor变换。Gabor基本函数、Gabor展开系数、双正分析窗函数求解的约束条件式与Gabor展开式都是复数形式,计算量很大。为了简化Gabor变换的计算,提出了一种实数形式的离散Gabor变换(RDGT)方法,这种方法类似于复数形式的离散Gabor变换的解析理论体系,并可采用快速的离散Hartley变换算法计算Gabor变换系数,尤其是实数形式的离散Gabor变换系数与复数形式的离散Gabor变换系数的实部和虚部有着非常简单的加减关系,因此前者的计算完全可以替代后者的计算,从而达到大大减小Gabor复变换系数计算量的目的;同样,在信号的
31、重建方面,实数形式的离散Gabor逆变换也比复数形式的离散Gabor逆变换快得多,并且在实际应用中,实值Gabor变换更方便于软件和硬件的实现。2.2 Gabor小波变换的定义 由于Fourier变换存在着不能同时进行时间和频率局部分析的缺点,1946年Gabor提出了一种加窗的Fourier变换方法,它在非平稳信号分析中起到了很好的作用。在Fourier变换中,把非平稳信号过程看作是一系列短时平稳信号的叠加,而短时性是通过时间上加窗来实现的。整个时域的覆盖是由参数的平移达到的。换句话说,该变换是用一个窗函数与信号相乘实现在附近开窗和平移,然后施以Fourier变换,这就是Gabor变换也称短
32、时Fourier变换或加窗Fourier变换。Gabor变换的定义由下式给出:对于, (2-1) 其中是积分核。该变换在点附近局部测量了频率为的正弦分量的幅度。通常选择能量集中在低频处的实偶函数;Gabor采用高斯(Gauss)函数作窗的函数,相应的Fourier变换以后仍旧是Gauss函数,从而保证窗口Fourier变换在时域和频域均有局部化功能。令窗口函数为,则有 (2-2) 式中a决定了窗口的宽度,的Fourier变换用表示,则有 (2-3) 由以上可以得到 (2-4) 显然,信号经过Gabor变换按窗口宽度分解了的频谱,提取出它的局部信息。当在整个时间轴上平移时,就给出了Fourier
33、的完整变换。相应的重构公式为: (2-5) 窗口Fourier变换是能量守恒变换,即 (2-6) 这里应注意,积分核对所有和都有一样的支撑区,但周期数随而变化。支撑区是指一个函数或信号的自变量的定义域,当在定义域取值时的值域不为零,在支撑区之外信号或过程下降为零。 为了研究窗口Fourier变换的时频局部化特性就要研究和的特性。这里是的Fourier变换。由于Fourier变换是能量守恒的,所以有Parseval定理存在。即: (2-7) 这里的和分别是和的复共轭函数,当为实数时,两种表示是相等的。如果把上述函数乘积的积分运算用积符号表示,则有 (2-8) 其中和都是在实数域的平方可积函数。由
34、此: (2-9) 当时有:其中叫做的数。这一表达式的物理意义是Fourier变换的时域和频域的一对共扼变量具有对易关系,从而使Fourier变换与加窗口的Fourier变换具有对称性。如果用角频率变量代替时间变量,用频域窗口函数代替时域窗口函数则可得到: (2-10) 这里是时域窗口函数的Fourier变换。该式的意义在于频域中的信号通过窗口函数的加窗作用获得了在频域附近的局部信息即: (2-11) 如果选用窗口函数在时域和频域均有良好的局部性质,那么可以说Fourier变换给出了信号的局部时一频分析。这样就有利于同时在频域和时域提取信号的精确信息。2.3 Gabor变换在人脸识别中的应用 C
35、ampben和Robson提出并在心理学实验中证实,人类的视觉具有多通道和多分辨率的特征,因此,近年来基于多通道、多分辨率分析的算法受到广泛重视11。在诸如信号检测、图象压缩、纹理分析、图象分割和识别等领域,Gabor小波得到了非常广泛的应用。大量基于简单细胞接受场的实验表明,图像在视觉皮层的表示存在空域和空频域分量,并且可以将一幅图像分解为局部对称和反对称的基函数表示,Gabor函数正是这种基信号的良好近似。Lee.T.S用ZD一Gabor小波来表征图像,将Daubeehies的一维框架理论拓展到二维,并证明在一定条件下,ZD一Gabor小波是紧框架,原图像能从小波系数重建,因此用小波变换的
36、系数幅值作为特征来匹配有着良好的视觉特性和生物学背景,Gabor小波的这些特性使得其对于亮度和人脸表情的变化不敏感,在人脸识别和图像处理中有着广泛的应用。Lades等首先提出用基于Gabor变换的弹性图匹配算法进行人脸识别。节点上的Gabor滤波响应作为人脸特征,通过特征匹配和节点几何位置的匹配实现人脸识别。2.4 Gabor滤波器在实验室中我们用的最多的是Gabor滤波器。根据Gabor变换的原理和实际需要,可构造不同的Gabor滤波器。Gabor滤波器在图像处理中的特征提取、纹理分析和立体视差估计等方面有许多应用。有研究表明神经细胞的感受也可以用Gabor函数来表示。Gabor滤波能够体现
37、出不同的方向性和尺度性。Gabor函数从实质上来说是一个Gauss函数窗所限制的滤波函数。通过定义不同的Gabor函数核,就可以得到一组Gabor滤波器。Gabor核函数的定义: (2-12) Gabor滤波可以定义为: (2-13)下面我们对式(2-12)中的各项参数作一个说明:是一个振荡函数,实部为余弦函数,虚部为正弦函数。是Gauss函数,这实际上是通过加窗限制了函数的围,使其在局部有效。由Gauss函数的局部性可知,这个滤波器实际上抽取x附近的特征,因此可以看作是一种Gabor小波。是直流分量,这样滤波器就可以不受直流分量大小的影响。向量描述了滤波器对不同方向和不同尺度的响应,通过选取
38、一系列的,就得到了一族Gabor滤波器,是一个常量,和一起刻画了Gauss窗的波长。这里取=/2,可以表示为:这里 (2-14)选取不同的下标可以描述不同的Gauss窗波长,从而控制采样的尺度。选取不同的下标可以描述振荡函数不同的振荡方向,从而控制采样的方向。我们这里选取=0 ,1,2这样可以在3个不同的尺度上采样。选取=0 ,.,3这样就可以在4个不同的方向上采样13。各个滤波器窗口的大小为3232,确定滤波器的所有参数(可自己决定)后,当采取上述的参数后,可得如下图2.1的12个滤波器(图片源代码详见附录一)。图2.1 Gabor 3个尺度4个方向的滤波器 另外,Gabor函数是唯一能够达
39、到空域和频域联合测不准关系下界的函数,用Gabor函数形成的二维Gabor滤波器具有在空间域和频率域同时取得最优局部化的特性,因此能够很好地描述对应于空间频率(尺度)、空间位置与方向选择性的局部结构信息,下面图2.2、2.3、2.4是Gabor滤波器的原图特性、空域特性和频域特性(源代码详见附录二): 图2.2 Gabor滤波器原图特性 图2.3 Gabor滤波器原图的空域特性 图2.3 Gabor滤波器原图的频域特性2.4.1 Gabor滤波器参数的选择由于不同,u代表了不同的采样方式,因此需要保证在不同的尺度和不同方向上的采样尽量均匀。一些研究表明0, 区间可以描述所有的方向,因此只需对区
40、间0, 进行采样。也就是说:+方向上的滤波完全可以由方向的结果确定。由于的变化是连续的,不可能取无穷多个,必须对其进行离散均匀采样。因此这里我们选取作为采样间隔,反映了空间尺度上采样。由于尺度的大小实际上决定于Gauss窗的大小,而其窗长正比于,由于是在二维上的采样,因此其面积正比于。为了反映尺度上的合理采样,实验表明每次采样的面积成倍的方式递减比较合理,是一个常量,这就要求。Gabor滤波器利用公式定义的卷积,就可以在图像每个不同的处得到个不同复值的滤波结果12。2.4.2 Gabor滤波器的性质和计算方法(1)Gabor滤波器的性质 Gabor滤波器具有生物学的意义。Gabor核函数与脊椎
41、动物大脑视觉区域皮层细胞的感受行状十分类似。 Gabor滤波器能充分描述图像的纹理信息。Gabor滤波特性说明了Gabor滤波结果是描述图像局部灰度分布的有力工具。因此,图像的纹理信息可以用Gabor滤波作为特征抽取的方法。 对二维Gabor滤波的研究表明,通过恰当选择若干个Gabor核函数可以重构出原图像。 Gabor核函数由于去掉了直流分量,对局部光照影响不敏感。这和直接将图像的灰度特征作为模板相比,优势是很明显的。 Gabor滤波结果可以描述不同方向上灰度的分布信息。 Gabor滤波结果可以描述不同尺度上灰度的分布信息。一般来说,大尺度滤波可以描述全局性较强的信息,同时可以掩盖掉图像中噪
42、声的影响,而小尺度滤波可以描述比较精细的局部结构,受噪声影响也大。 核函数有良好的频域特性。Gabor核函数在频域的形状和空域的形状完全一样。 Gabor滤波可以容忍图像有一定的平移、旋转、深度上的转动、尺度变化等情况。 (2)Gabor核函数的计算方法由于输入的图像为灰度图像,这就是直接的离散化表示。从Gabor核函数的定义公式可以看出,由于Gauss窗函数的限制,Gabor核函数只在一个局部非零,因此我们只需要对其局部进行离散抽样即可。抽样围的大小由Gauss窗的大小所确定,这里我们取作为抽样半径。2.4.3 Gabor变换的人脸特征提取 根据以上分析,我们知道Gabor变换在人脸特征提取
43、方面具有很多优点,前面定义的Gabor小波是一组带通滤波器,通过参数的选择,每一组滤波器具有各自的频率选择性和方向选择性,这样不同方向和尺度的滤波器覆盖整个频域,从而一幅人脸图像的Gabor特征表示就是该图像和一族Gabor小波卷积的结果。 假设表示一幅图像的灰度分布,则其Gabor特征表示为: (2-15) 其中,是Gabor核函数,是尺度,方向的Gabor小波卷积结果。在这里,我们选用3个尺度4个方向的Gabor小波,即0 ,.,2,0,.,3,其于参数设为以与为了包含不同的空间尺度和方向的Gabor滤波特征,一般将一幅图像的所有尺度方向Gabor滤波变换表示成一个级联的特征矢量。由于一般
44、图像的维数比较高,直接将所有尺度、方向的Gabor小波变换特征级联会导致维数大而难于处理,因此有必要对图像的各个Gabor小波表示进行下采样处理,假设下采样因子为,则一幅图像的特征矢量为: (2-16) 从特征提取的角度出发,对人脸图像的不同尺度不同方向的Gabor滤波可以认为是提取了人脸图像具有不同性质的特征,因此对于本文所采用的3尺度4方向的Gabor小波,可以认为其对人脸图像的滤波得到了12组具有不同性质的特征矢量,一般都将这12组特征矢量简单级联成一个长特征矢量,然后在对该特征矢量进行学习和识别分类,而不考虑各组特征矢量的有效性问题,即哪些尺度和方向的Gabor滤波特征更能反应人脸之间
45、互相区别的本质特征。以下是Gabor变换人脸提取特征的流程图: 图2-2 Gabor变换人脸提取特征流程图 根据以上流程图编写的程序可以得出一幅经过Gabor小波变换后的人脸特征图像,如图2-3:图2-3 ORL人脸原图和经Gabor提后的图片2.5Gabor快速算法图 前面我们通过实验分析了Gabor变换在人脸特征提取中的重要作用,在这一章中,我们就着重介绍Gabor的快速算法。由于我们所说的Gabor变换的快速算法是基于傅里叶快速算法而来的,所以我们先介绍傅里叶快速算法。离散傅里叶变换(DFT)在信号的频谱析、系统的分析、设计和实现中得到了广泛的应用,原因之一就是计算DFT有很多的快速算法,快速傅里叶变换(FFT)算法就是其中之一。在使用数字信号处理技术的各种各样的应用领域里,FFT算法都起着极为重要的作用。设为N点的有限长序列,则其正变换DFT为:(2-17) 逆变换OFT为:(2-18) 通常我们用算法所需的乘法和加法运算次数,来衡量各种算法的复杂性和效率。这里的通常都是复数,于是整个DFT运算就需要N2次复数乘法和N(N-1)次复数加法。因此,直接计算DFT,乘法和加法的次数都与N2成正比。 当N较大时,计算量太大,无法得到实际的应用。2.5.1快速傅里叶变换(FFT) 自从1965年图基(J.W.Tuky)和库利(T.W.Co
限制150内