基于PCA算法的人脸识别(共21页).docx
《基于PCA算法的人脸识别(共21页).docx》由会员分享,可在线阅读,更多相关《基于PCA算法的人脸识别(共21页).docx(21页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上中南民族大学毕业论文(设计)学院: 电子信息工程学院 专业: 电子信息工程 年级: 2012级 题目: 基于PCA算法的人脸识别 学生姓名: 学号: 指导教师姓名: 职称: 2016年5月26日专心-专注-专业中南民族大学本科毕业论文(设计)原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。本人完全意识到本声明的法律后果由本人承担。作者签名: 年 月 日 注:本页放在学位论文封面后,目录前面目 录基于PCA算法的人脸识别摘要:本文探讨了基于主成
2、分分析(PCA)的人脸识别方法。二十多年以来,PCA算法已广泛应用于人脸识别,成为最流行的人脸表示方法之一。它不仅降低了人脸图像特征的维数,缓解了维数灾难的问题,同时使得人脸表达更为紧凑。在本文的研究中,首先利用PCA对人脸降维,其次采用最邻近法对人脸图像进行分类,最后在ATT人脸数据库上对此方法进行评估。实验结果表明,该方法具有较好的识别性能。关键词:人脸识别;主成分分析法;最邻近法 Face Recognition Based on PCA MethodAbstract: In this paper, we study the principal component analysis (P
3、CA) which is one of the most popular representation methods. Not only does the PCA method reduce the dimensionality of the face image, but it avoids the problem of the Curse of Dimensionality as well, thereby getting more compact face representation. So it has been extensively employed for face reco
4、gnition in the past few decades. After performing the PCA method, the nearest neighbor rule is applied to classify the face image. Finally, the PCA algorithm is evaluated on the AT&T face database, and the experimental results show that this algorithm achieves pretty good performance.Key words: face
5、 recognition; principal component analysis; nearest neighbor rule 1 绪论1.1 人脸识别的研究意义进入21世纪以来,人们的日常生活向着自动化和科技化方向发展,信息安全也日趋重要,普通的身份识别方式(如钥匙、磁卡、密码等)已经无法保证信息的安全。生物特征识别技术因具有高效、稳定、快速等特点,而迅速成为人们关注的研究领域。它是一项用能标识个人特定身份的生理特征或者行为、神态等进行身份认证的技术。虹膜识别、步态识别和人脸识别等均属于该项技术的研究方向,这些识别方法具有高效、便捷、难以被伪造等特点,避免了传统的身份认证易丢失、遗忘和被
6、破解的弊端。人脸识别是借助计算机分析人脸图像,提取出可识别信息,进行身份认证的一种方法。与其它生物特征识别相比,人脸识别起步较晚,不过由于其个体的差异性和自身很强的稳定性,它具有友好、方便、直接等显著优势,迅速席卷业界,成为一项热门的生物特征识别技术1-3。人脸识别技术广泛应用在国家安全、保险、民政、金融等领域4。公安部门存有居民的户籍档案等,刑侦部门对犯罪人员的档案进行备份。利用现场抓拍或监控等方式可以获取可疑分子照片,再应用人脸识别技术检索犯罪嫌疑人数据库,从而快速锁定嫌疑人,提高破案效率。又如反恐工作中,人脸识别技术被用于加强银行等重要场所的监控和安检,以防恐怖袭击。人脸识别的研究还涉及
7、到计算机视觉、人工智能、人脑认识和心理学等众多领域5。计算机视觉等相关理论知识指导人脸识别技术研究的不断深入,同时人脸识别也引领这些理论知识延伸发展和开拓前进,促进新理论和新方法的产生。因此,人脸识别技术作为一项具有重要理论价值和广阔应用前景的课题,一直被业界所青睐。1.2 人脸识别国内外概况人脸识别的研究已有很长的历史,甚至可以追朔到上个世纪50年代,大致可以分为三个阶段6。第一阶段(20世纪50年代至90年代),人脸识别被当作一个一般性的模式识别问题,主流技术基于人脸的几何结构特征。这项技术并没有形成一个统一、较好的特征提取方法,尽管取得的成果也很多,但并没有得到广泛应用。第二阶段(20世
8、纪90年代),人脸识别迅速发展,出现了很多经典的方法,例如Eigen Face, Fisher Face和Elastic Graph Matching7, 8等,此时主流的技术路线为人脸表观建模。这些方法在较理想的图像采集条件、测试对象配合、中小规模正面人脸数据库上达到了非常好的性能,得到广泛应用,并沿用至今。第三阶段(20世纪90年代末至今),人脸识别的研究不断深入,研究者开始关注真实条件的人脸识别问题,主要包括以下四个方面的研究:1)提出不同的人脸空间模型,包括以LDA为代表的线性建模方法,以核方法为代表的非线性建模方法;2)深入分析影响人脸识别的因素,包括光照不变人脸识别、姿态不变人脸识
9、别和表情不变人脸识别等;3)利用新的特征表示,包括局部描述子(Gabor Face,LBP Face等)和深度学习方法;4)利用新的数据源,例如基于视频的人脸识别和基于素描、近红外图像的人脸识别。人脸识别基本架构包括四个部分:人脸检测、人脸对齐、特征提取和分类识别,如图1-1所示。图1-1人脸识别系统架构 人脸检测判断静态图像中是否包含人脸,若存在,返回人脸的大小和位置,是人脸识别中的关键步骤。人脸对齐是在人脸检测的基础上,进一步确定脸部特征点(眼睛、眉毛、鼻子、嘴巴、脸部外轮廓)的位置。特征提取可以从图像中提取特定的判别特征以区分不同人脸。特征提取是人脸识别的关键部分,它直接关系到人脸识别系
10、统的性能,一直是人脸识别研究的难点与热点。分类识别是对测试人脸和数据库人脸用有效分类器进行比较,确定测试人脸的身份。人脸识别借助计算机并使用特定算法,将测试人脸图像与数据库中的人脸比对,进行身份判定,概念上划分为身份确认和身份辨识两种9。按获取的人脸图像的维数来分,人脸识别可以分为2D人脸识别和3D人脸识别。人脸是三维结构的典型代表,所以二维的人脸会丢弃人脸面部一些特征信息,如深度信息等。所以3D人脸识别比2D人脸识别更好。这方面的经典成果有:Xiao10提出的三维形变模型、Lee11提出的三维网格模型、Ye12提出的三维多模态模型及Hallinan13提出的三维弹性图模型等。人脸识别还可分为
11、基于静态图像和基于视频图像的人脸识别。连续变化的人脸可以估计3D人脸模型,从而补偿人脸姿态变化,这是视频人脸识别的主要优点。另外,视频序列中的运动信息,也有利于提高人脸识别的识别率和鲁棒性。本文研究的人脸识别是一种基于静态图像的2D人脸识别。1.3 人脸识别的主要研究内容人脸识别(Face Recognition)的研究范围大致包括以下5个方面的内容6:人脸检测 (Face Detection)、人脸表达(Face Representation)、人脸鉴别(Face Identification)、表情/姿态分析(Expression/Gesture Analysis)、生理分类(Physic
12、al Classification)。其中人脸鉴别通常被称作是“人脸识别”,即将待识别的人脸与人脸库中的已知人脸比对,确认其身份。这个过程的主要问题是选择合适的人脸表征方式与匹配策略,本文所探讨的“人脸识别”即是指待识别的人脸与数据库中的已知人脸之间的匹配问题。虽然人类能够毫不费力地识别出人脸,但人脸图像受各种成像条件干扰,使得人脸识别技术应用到实际中存在许多挑战性问题14。光照变化、姿态(正面或侧面)、表情(笑或不笑)、遮挡(眼镜、胡须等)、年龄变化、人脸信息采集设备(精度等方面的差异)诸多因素都会给人脸识别带来很大的挑战。并且这些问题往往不是单独出现,如姿态和表情问题同时出现。这将进一步加
13、大问题处理的难度,目前的人脸识别研究一般都是针对其中一个问题,没有多方面考虑,这也是值得关注的。1.4 本文研究内容与结构安排本文主要讲述基于PCA算法的人脸识别,主要结构安排如下:第一节 是绪论,讲述了人脸识别的研究意义和国内、外概况以及人脸识别的主要研究内容。第二节 详述PCA算法原理,简要介绍了PCA的基本概念,详述了PCA的本质K-L变换原理、性质和特征值提取方法。第三节 具体阐述了主成分分析的人脸识别。本节着重讲解了特征脸空间的构建、特征提取和分类识别方法。 第四节叙述了人脸识别实验,简要介绍图像的预处理方法、AT&T人脸库,阐述了实验设计方法并记录了实验结果,最后对实验结果做了简单
14、分析。 第五节对全文进行了总结性的概述。2 PCA算法原理主成分分析(Principal Component Analysis,PCA)方法是K. Pearson提出的一种数据分析方法15,是一种掌握事物主要矛盾的,也是一种很常用的根据变量协方差对数据进行降维、压缩的方法。它的精髓在于尽量用最少数量的维度,尽可能精确地描述数据。2.1 PCA原理PCA的主要思想是将维特征映射到k维(kn)正交特征上。其中重新构造的k维特征就是主元,它的本质实际上是K-L变换。下面先介绍K-L变换及其性质。2.1.1 K-L变换原理K-L变换,即Karhunen-Loeve变换,是一种常用的特征提取方法16,在
15、消除特征间的相关性、突出差异性上有最优的效果,也是最小均方误差下的一种最优正交变换。K-L变换是由K-L展开引出的,对于D维随机变量,可以用一个完备的正交归一化向量集来展开(1)即表示成,的线性组合,其中(2)是线性组合的系数。将上式两边均左乘,得到(3)如果只用有限的d项(dD)来逼近,即(4)上面的推导中使用了是正交向量集的条件。记相关矩阵,即的二阶矩阵,则(5)要在正交归一化的向量集中最小化这一均方误差,就是求解下列优化问题(6)采用拉格朗日(Langrange)乘数法,构建无约束的目标函数(7)对各个向量分别求偏导17并令其为零,得到如下一组方程(8)即,是矩阵的特征向量,满足(9)是
16、矩阵的特征值。考虑式和,均方误差为(10)如令d=0,则上式对所有成立。把矩阵的特征值按从大到小排列,选取前d个特征值对应的特征向量,在所有用d维正交坐标系展开的特征向量中,它的截断误差是最小的,然后就可以做到用d个向量表示样本并使均方误差最小。这d个特征向量组成的正交坐标系称作所在的D维空间的d维K-L变换坐标系,在K-L坐标系上的展开系数向量称作的K-L变换,即(11)向量就是变换后的系数向量,在基于Eigen face算法的人脸识别中就是用系数向量代替原始向量进行识别的。2.1.2 K-L变换性质下面我们看看相关矩阵的形式:(12)由上式可以看出相关矩阵是一个实对称矩阵,则根据矩阵分析相
17、关知识:若矩阵是一个实对称矩阵,则必定存在正交矩阵U,使得相似于对角形矩阵,即:(13)其中是相互正交的单位向量,且是的特征向量,是的特征值,则有结论:(14) 降维后的系数向量的相关矩阵是对角矩阵,即通过K-L变换消除原有向量的各分量间的相关性,这样得到新的变量不相关,甚至相互正交,故有可能去掉那些带有较少信息的分量以达到降低特征维数的目的。2.1.3 特征值选取K-L变换使向量的数值改变,但向量的个数是没有改变,数值改变后会出现小数值,因此就可以既保留主要特性又降低向量的维数。为减少运算量,我们可以保留主要信息,去掉次要数据。下面是常用的特征值选取方法:(1)原始特征脸空间的构造,只要特征
18、值非零就保留,其对应的特征向量用来构建特征脸空间。(2)舍弃后40%的特征值,就舍掉了最少反映特征信息的40%的特征量。(3)本文的特征值选取方差贡献率来确定的,保证所含信息达到信息总量的一定比例。通常的0.90.99。公式如下:,为协方差矩阵的N个非零特征值2.2 PCA计算过程令表示一个随机特征向量,其中。(1) 计算的均值向量:(15)(2)计算协方差矩阵:(16)(3)计算协方差矩阵的特征值和对应的特征向量:(17)(4)对特征值进行降序()排列。按照既定法则先去前k个最大特征值对应的特征向量作为需要主元成分。(5)观测向量的k个主成分可以表示为:(18)其中。(6)进行K-L反变换有
19、:(19)其中。3 基于PCA算法的人脸识别我们知道输入200200大小的人脸图像,单单提取它的灰度值作为原始特征,则这个原始特征将达到40000维,这给后面分类器的处理将带来极大的难度。而经过主成分分析(PCA)得到新的变量是不相关或正交的,因而可以去掉那些带有较少信息的分量而达到降低特征维数的目的。所以PCA方法广泛应用在人脸识别中特征提取及数据降维,并且在有效识别人脸方面取得不错的成果。本章将详述PCA算法在人脸识别中的具体应用。3.1 构建特征脸空间经过基本的预处理后,加载入人脸库(本文使用的是AT&T人脸库),将库中每个对象的前五张人脸载入作为训练集,后五张载入作为测试集。若人脸库中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 PCA 算法 识别 21
限制150内