基于PCA的人脸识别研究报告.doc
《基于PCA的人脸识别研究报告.doc》由会员分享,可在线阅读,更多相关《基于PCA的人脸识别研究报告.doc(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、.项目名称:基于PCA的人脸识别算法研究19 / 22.摘 要随着人类社会的进步,以与科技水平的提高,一些传统的身份认证的方法逐渐暴露出各种问题,因此人们需要采用一种更加可靠安全的身份认证方法。毫无疑问人体的生物特征的独一无二的,特别是其不容易丢失与复制的特性很好满足了身份识别的需要。并且随着计算机科学技术和生物医学的发展使得利用生物特征识别成为了可能。因此基于指纹、人脸、视网膜等生物特征的识别方法也越来越多。由于人脸识别的操作快速简单,结果直观,准确可靠,不需要人的配合等优点已成为人们关注的焦点。主成分分析(PCA)法通过提取高维度的人脸图像的主元,使得图像在低维度空间中被处理来降低了图像处
2、理的难度。由于其有效的解决了图像空间维数过高的问题,已经成为人脸识别领域非常重要的理论。此次研究的就是基于PCA的人脸识别算法的实现。本文按照完整人脸识别流程来分析基于PCA的人脸识别算法实现的性能。首先使用常用的人脸图像的获取方法获取人脸图像。本文为了更好的分析基于PCA人脸识别系统的性能分别选用了Essex人脸数据库和ORL人脸库,并在后期采用了自建的人脸库。接下来是人脸图像预处理方法。由于采用的人脸图像质量较好,而且已经做过相应的预处理,所以本文试验中只使用灰度处理。接着使用PCA提取人脸特征,使用奇异值分解定理计算协方差矩阵的特征值和特征向量以与使用最近邻法分类器欧几里得距离来进行人脸
3、判别分类。在实验中我们发现基于PCA的人脸识别系统的识别率很高,而且具有一定鲁棒性,所以基于PCA的人脸识别算法的实现的研究还是有意义。【关键词】人脸识别PCA算法 奇异值分解定理 欧几里得距离ABSTRACTWith the development of science and technology, the progress of human society, the traditional identification is easy to lose, easy to be cracked and it has not play an identifiable role. People
4、need a more secure and reliable identification technology. Biometric is unique, easy to lose and replication characteristics of good meet the needs of the identification. With the development of computer science and technology and biomedical makes use of biometric identification has become possible.
5、 In the field of biometric identification, face recognition with the advantages of operation is fast and simple, the results are intuitive, accurate and reliable,do not need co-ordination, has become the focus of attention. The principal component analysis (PCA) to extract high dimensional face imag
6、e of the main element, making the images are processed in low-dimensional space and it reduces the difficulty of image processing. PCA solves effectively the problem of high dimension image space and it has become a very important theory in face recognition field. This paper is in this context of wr
7、iting from. In accordance with the full recognition process to analyze the performance of PCA-based face recognition algorithm. The first to use the method of access to commonly used face images for face images. In order to better analysis is based on the performance of the PCA face recognition syst
8、em selected Essex face database. Next is the face image preprocessing methods. Essex face image quality is better, and have done the appropriate pretreatment, using only gray-scale processing of this trial. Then use the PCA for face feature extraction using singular value decomposition theorem to ca
9、lculate the covariance matrix of the eigenvalues and eigenvectors, and use the Euclidean distance of the nearest neighbor classifier to the classification of human face discrimination. In the experiment, we found that a high recognition rate of the PCA-based face recognition system, but with a certa
10、in robustness, the PCA-based face recognition algorithm to achieve meaningful.【Key words】face recognition PCA algorithm SVD Euclidean distance前 言随着社会和科技的发展,社会步伐的加快,人们对高效可靠的身份识别需求日益强烈。各种技术在科研和实际中都受到了很大的重视和发展。由于生物特征在的稳定性和唯一性使其成为了作为身份识别的理想依据。人脸特征作为典型的生物特征外,还有隐蔽性好,易于被用户接受,不需要人的配合等优点。现已成为了身份识别领域研究的热点。PCA
11、算法通过降低维度,提取主元素,减少了数据冗余,解决了图像纬度太高无法处理或处理很慢的特点,同时保持了原始图像的绝大部分信息。在人脸识别领域,很多先进的识别算法都是在其基础上的改进。所以研究基于PCA的人脸识别算法实现具有重要的理论和使用价值。本文主要介绍基于PCA的人脸识别算法的实现,先介绍了PCA算法的理论基础,其次介绍了其在数字图像领域的应用,最后结合具体研究详述了研究过程。第一节 主成分分析基本理论一、什么是主成分分析?主成分分析为Principle component analysis10,11,12的中文翻译,其英文简写为PCA。它是一种非常流行和实用的数据分析技术,最重要的应用是对
12、原有数据进行简化。主成分分析可以有效的找出数据中最“主要”的元素和结构,去除噪声和冗余,将原有的复杂数据降维处理,揭示出隐藏在复杂数据背后的简单结构。它的优点是简单,而且无参数限制,可以方便的应用与各个场合。因此应用极其广泛,从神经科学到计算机图形学都有它的身影。PCA被称为应用线形代数最有价值的结果之一。二、基变换从线形代数的角度来看,PCA的目标就是使用另一组基去重新描述得到的数据空间。而新的基要能尽量揭示原有的数据间的关系。在这个例子中,沿着某x轴上的运动是最重要的。这个维度即最重要的“主元”。PCA 的目标就是找到这样的“主元”,最大程度的去除冗余和噪音的干扰。1. 标准正交基标准正交
13、基表现了数据观测的一般方式。在线形代数中,这组基表示为行列向量线形无关的单位矩阵。 (4.2)2. 基变换从更严格的数学定义上来说,PCA回答的问题是:如何寻找到另一组正交基,它们是标准正交基的线性组合,而且能够最好的表示数据集?在PCA方法中有一个很关键的假设:线性。这是一个非常好的假设,它使问题得到了很大程度的简化,具体表现为数据被限制在一个向量空间中,能被一组基表示,并且还隐含的假设了数据间的连续性关系。这样一来数据就可以被表示为各种基的线性组合。令X表示原数据集。X是一个m*n的矩阵,它的每一个列向量都表示一个时间采样点上的数据。Y表示转换以后的新的数据集表示。P是他们之间的线性转换。
14、它们间的转换关系为 (4.3)有如下定义:pi表示P的行向量。xi表示X的列向量。yi表示Y的列向量。 上式(3)在线性代数中,它有如下的含义: P是从X到Y的转换矩阵。几何上来说,P对X进行旋转和拉伸得到Y。P的行向量,(p1,p2,pm)是一组新的基,而Y是原数据X在这组新的基表示下得到的重新表示。 下面是对最后一个含义的说明: (4.4) (4.5)注意到Y的列向量: (4.6)可见yi表示的是xi与P中对应列的点积,也就是相当于是在对应向量上的投影。所以,P的行向量事实上就是一组新的基。它对原数据X进行重新表示。3. 问题在线性的假设条件下,问题转化为寻找一组变换后的基,也就是P的行向
15、量(p1,p2,pm),这些向量就是PCA中所谓的“主元”。问题转化为如下的形式:怎样才能最好的表示原数据X?P的基怎样选择才是最好的?解决问题的关键是如何体现数据的特征。那么,什么是数据的特征,如何体现呢?三、协方差衡量如何选择最优的P基需要借助协方差来进行衡量和判断: (4.9)A,B分别表示不同的观测变量所记录的一组值,在统计学中,由协方差的性质可以得到:,且当且仅当观测变量A,B相互独立。,当A=B等价的,将A,B写成行向量的形式:,协方差可以表示为 (4.10)那么,对于一组具有m个观测变量,n个采样时间点的采样数据X,将每个观测变量的值写为行向量,可以得到一个m*n的矩阵: (4.
16、11)接下来定义协方差矩阵如下: (4.12) (4.13)容易发现协方差矩阵具有如下性质:CX是一个m*m的平方对称矩阵。Cx对角线上的元素是对应的观测变量的方差。非对角线上的元素是对应的观测变量之间的协方差。协方差矩阵CX包含了所有观测变量之间的相关性度量。更重要的是,根据前两部分的说明,这些相关性度量反映了数据的噪音和冗余的程度。在对角线上的元素越大,表明信号越强,变量的重要性越高;元素越小则表明可能是存在的噪音或是次要变量。在非对角线上的元素大小则对应于相关观测变量对之间冗余程度的大小。一般情况下,初始数据的协方差矩阵总是不太好的,表现为信噪比不高且变量间相关度大。PCA的目标就是通过
17、基变换对协方差矩阵进行优化,找到相关“主元”。那么,如何进行优化?矩阵的那些性质是需要注意的呢?协防差矩阵的对角化总结上面的部分可以发现主元分析以与协方差矩阵优化的原则是:1)最小化变量冗余即对应于协方差矩阵的非对角元素要尽量小;2)最大化信号即对应于要使协方差矩阵的对角线上的元素尽可能的大。因为协方差矩阵的每一项都是正值,最小值为0,所以优化的目标矩阵CY的非对角元素应该都是0,对应于冗余最小。所以优化的目标矩阵CY应该是一个对角阵。即只有对角线上的元素可能是非零值。同时,PCA假设P所对应的一组变换基必须是标准正交的,而优化矩阵CY对角线上的元素越大,就说明信号的成分越大,换句话就是对应于
18、越重要的“主元”。对于协方差矩阵进行对角化的方法很多。根据上面的分析,最简单最直接的算法就是在多维空间进行搜索:在m维空间中进行遍历,找到一个方差最大的向量,令作p1。在与p1垂直的向量空间中进行遍历,找出次大的方差对应的向量记作p2对以上过程循环,直到找出全部m的向量。它们生成的顺序也就是“主元”的排序。这个理论上成立的算法说明了PCA的主要思想和过程。在这中间,牵涉到两个重要的特性:1)转换基是一组标准正交基。这给PCA的求解带来了很大的好处,它可以运用线性代数的相关理论进行快速有效的分解。这些方法将在后面提到。2)在PCA的过程中,可以同时得到新的基向量所对应的“主元排序”,利用这个重要
19、性排序可以方便的对数据进行简化处理或是压缩。四、PCA求解:特征根分解在线形代数中,PCA问题可以描述成以下形式:寻找一组正交基组成的矩阵P,有Y=PX,使得是对角阵。则P的行向量(也就是一 组正交基),就是数据X的主元向量。对进行推导: (4.14) (4.15)定义,则A是一个对称阵。对A进行对角化求取特征向量得: (4.16)则D是一个对角阵而E则是对称阵A的特征向量排成的矩阵。这里要提出的一点是,A是一个m*m的矩阵,而它将有p(p=m)个特征向量。其中p是矩阵A的的秩。如果p=m,则A即为退化阵。此时分解出的特征向量不能覆盖整个m空间。此时只需要在保证基的正交性的前提下,在剩余的空间
20、中任意取得m-p维正交向量填充E的空格即可。它们将不对结果造成影响。因为此时对应于这些特征向量的特征值,也就是方差值为零求出特征向量矩阵后我们取,则,由线形代数知识可知矩阵P有性质,从而进行如下计算: (4.17) (4.18)可知此时的P就是我们需要求得变换基。至此我们可以得到PCA的结果:X的主元即是的特征向量也就是矩阵P的行向量。矩阵对角线上第i个元素是数据X在方向的方差。我们可以得到PCA求解的一般步骤:采集数据形成m*n的矩阵。m为观测变量个数,n为采样点个数。在每个观测变量(矩阵行向量)上减去该观测变量的平均值得到矩阵X。对进行特征分解,求取特征向量以与所对应的特征根。五、总结:P
21、CA技术的一大好处是对数据进行降维的处理。我们可以对新求出的“主元”向量的重要性进行排序,根据需要取前面最重要的部分,将后面的维数省去,可以达到降维从而简化模型或是对数据进行压缩的效果。同时最大程度的保持了原有数据的信息。PCA方法和线形代数中的奇异值分解(SVD)方法有在的联系,一定意义上来说,PCA的解法是SVD的一种变形和弱化。对于m*n的矩阵X,通过奇异值分解可以直接得到如下形式: (4.19)其中U是一个m*m的矩阵,V是一个n*n的矩阵,而是m*m的对角阵。形式如下: (4.20)其中,是原矩阵的奇异值。由简单推导可知,如果对奇异值分解加以约束:U的向量必须正交,则矩阵U即为PCA
22、的特征值分解中的E,则说明PCA并不一定需要求取,也可以直接对原数据矩阵X进行SVD奇异值分解即可得到特征向量矩阵,也就是主元向量。六、在数字图像处理中的应用PCA方法是一个具有很高普适性的方法,被广泛应用于多个领域。这里要特别介绍的是它在数字图像处理中的应用,包括如何对图像进行处理以与在人脸识别方面的特别作用。1. 数据表示如果要将PCA方法应用于视觉领域,最基本的问题就是图像的表达。如果是一幅N*N大小的图像,它的数据将被表达为一个维的向量: (4.21)在这里图像的结构将被打乱,每一个像素点被看作是一维,最直接的方法就是将图像的像素一行行的头尾相接成一个一维向量。还必须要注意的是,每一维
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 PCA 识别 研究 报告
限制150内