基于PCA的人脸识别算法实现毕业设计论文.doc
毕业设计(论文)设计(论文)题目:基于PCA的人脸识别算法实现摘 要随着科技的发展,人类社会的进步,传统身份识别由于容易遗失,容易被破解已不能起到身份识别作用。人们需要更加安全可靠的身份识别技术。而生物特征的独一无二,不易丢失和被复制的特性很好满足了身份识别的需要。同时随着计算机科学技术和生物医学的发展使得利用生物特征识别成为了可能。在生物特征识别领域,由于人脸识别的操作快速简单,结果直观,准确可靠,不需要人的配合等优点已成为人们关注的焦点。主成分分析(PCA)通过提取高维度的人脸图像的主元,使得图像在低维度空间中被处理来降低了图像处理的难度。由于其有效的解决了图像空间维数过高的问题,已经成为人脸识别领域非常重要的理论。本文研究的就是基于PCA的人脸识别算法的实现。本文按照完整人脸识别流程来分析基于PCA的人脸识别算法实现的性能。首先使用常用的人脸图像的获取方法获取人脸图像。本文为了更好的分析基于PCA人脸识别系统的性能选用了Essex人脸数据库。接下来是人脸图像预处理方法。由于Essex人脸图像质量较好,而且已经做过相应的预处理,所以本文试验中只使用灰度处理。接着使用PCA提取人脸特征,使用奇异值分解定理计算协方差矩阵的特征值和特征向量以及使用最近邻法分类器欧几里得距离来进行人脸判别分类。在实验中我们发现基于PCA的人脸识别系统的识别率很高,而且具有一定鲁棒性,所以基于PCA的人脸识别算法的实现的研究还是有意义。【关键词】人脸识别 PCA算法 奇异值分解定理 欧几里得距离ABSTRACTWith the development of science and technology, the progress of human society, the traditional identification is easy to lose, easy to be cracked and it has not play an identifiable role. People need a more secure and reliable identification technology. Biometric is unique, easy to lose and replication characteristics of good meet the needs of the identification. With the development of computer science and technology and biomedical makes use of biometric identification has become possible. In the field of biometric identification, face recognition with the advantages of operation is fast and simple, the results are intuitive, accurate and reliable,do not need co-ordination, has become the focus of attention. The principal component analysis (PCA) to extract high dimensional face image of the main element, making the images are processed in low-dimensional space and it reduces the difficulty of image processing. PCA solves effectively the problem of high dimension image space and it has become a very important theory in face recognition field. This paper is in this context of writing from. In accordance with the full recognition process to analyze the performance of PCA-based face recognition algorithm. The first to use the method of access to commonly used face images for face images. In order to better analysis is based on the performance of the PCA face recognition system selected Essex face database. Next is the face image preprocessing methods. Essex face image quality is better, and have done the appropriate pretreatment, using only gray-scale processing of this trial. Then use the PCA for face feature extraction using singular value decomposition theorem to calculate the covariance matrix of the eigenvalues and eigenvectors, and use the Euclidean distance of the nearest neighbor classifier to the classification of human face discrimination. In the experiment, we found that a high recognition rate of the PCA-based face recognition system, but with a certain robustness, the PCA-based face recognition algorithm to achieve meaningful.【Key words】face recognition PCA algorithm SVD Euclidean distance前 言随着社会和科技的发展,社会步伐的加快,人们对高效可靠的身份识别需求日益强烈。各种技术在科研和实际中都受到了很大的重视和发展。由于生物特征内在的稳定性和唯一性使其成为了作为身份识别的理想依据。人脸特征作为典型的生物特征外,还有隐蔽性好,易于被用户接受,不需要人的配合等优点。现已成为了身份识别领域研究的热点。PCA算法通过降低维度,提取主元素,减少了数据冗余,解决了图像纬度太高无法处理或处理很慢的特点,同时保持了原始图像的绝大部分信息。在人脸识别领域,很多先进的识别算法都是在其基础上的改进。所以研究基于PCA的人脸识别算法实现具有重要的理论和使用价值。本文主要介绍基于PCA的人脸识别算法的实现,除第一章外,其余内容按照人脸识别的流程可分为人脸图像获取,人脸图像预处理,人脸特征提取和特征匹配四个部分。具体安排如下:第一章主要介绍人脸识别的研究现状,人脸识别技术的主要难点及人脸识别流程。第二章主要介绍常用的人脸图像获取方法和人脸图像数据库。第三章主要介绍常用的人脸图像预处理方法。第四章主要介绍PCA算法,SVD定理,如何通过PCA和SVD提取人脸特征及如何使用最近邻法分类器欧几里得距离来进行判别分类。第一章 人脸识别系统概述第一节 人脸识别的研究概况人脸识别的研究起源比较早,Galton 在1888年和1910年就已在Nature杂志发表两篇关于如何使用人脸进行身份识别的论文。在他的文章,他使用一组数字表示相异的人脸侧面特征,同时还对人类本身的人脸识别能进行了研究分析。自动人脸的研究历史相对比较短,到现在不过五十多年的时间。不过1990年以来,才得到了长足的进步。现在,已变成计算机视觉领域的一个焦点,很多著名的大学和IT公司都有研究组在从事这发面的研究。对于人脸识别的研究历史可分为三个阶段:第一阶段(1964-1990)这个阶段主要采取的技术是基于人脸几何结构的。研究的重点主要在剪影上。研究人员做了大量关于如何提取面部剪影曲线的结构特征的研究。这个阶段属于人脸识别的初级阶段,突出的研究成果不多,也没有获得的实际应用。第二阶段(1991-1997)这个阶段虽然时间相对较短,但是硕果累累,出现了若干具有代表性的算法和几个商业化的人脸识别系统,如Identix(原为Visionics)公司的FaceIt系统。这个时期最具盛名的人脸识别方法是MIT媒体实验室的Turk和Pentland提出的的“特征脸”方法。后来很多人脸识别技术都与特征脸有关,现在特征脸已与归一化的协相关量方法一起成为了人脸识别性能测试的基准算法。这个时期的主要成果有:1992年左右,Brunelli和Poggio做了一个基于结构特征的方法和基于模板匹配的方法性能对比的实验,并得出了模块匹配的方法优于基于特征的方法的结论。这个结论和特征脸的共同作用,基本上停止了纯粹基于结构特征人脸识别的研究,并且很大的促进了基于表观的线性子空间建模和基于统计模式识别技术的发展,使其逐渐成为主流技术。Belhumeur等人的Fisherface方法也是此阶段一个重要的成果。该方法目前依然是主流人脸识别方法中的一种,产生了很多变种,比如子空间判别模型等。其先使用PCA即特征脸对人脸图像表现特征进行降维,并使用线性判别分析方法对降维后的主成分进行变换以获得“尽量大的类间散度和尽量小的类内散度”。弹性匹配技术1为另一个重要方法。它用一个属性图来描述人脸:属性的顶点代表面部关键特征点,它的属性为相应特征点处的多分辨率,多方向局部特征Gabor变换2,称为Jet;边的属性为不同特征点间的几何关系。对于输入的图像,其通过一种优化搜索策略来定位预先定位的若干面部关键特征点,同时提取它们的Jet特征,得到输入人脸图像的属性图。最后通过计算其与已知人脸属性图的相似度来完成识别过程。弹性匹配方法的优点是既保留了面部的全局结构特征,也对人脸关键局部特征进行了建模。局部特征分析由Atick等提出。其在本质上是基于统计的低维对象描述方法,与PCA相比,局部特征分析在全局主成分分析的基础上提取的是局部特征。它既保留了全局拓扑信息,有提取了局部特征,使其具有了更好的描述和识别能力。局部特征分析技术已商业化为著名FaceIt系统。柔性模型,包括主动形状模型和主动外观模型。它是人脸建模方面的一个新的进步。其主要将人脸描述为2D形状和纹理两个分离的部分,分别用PCA建模,然后再通过PCA3,4,5将两者合成来对人脸建模。柔性模型具有良好的人脸合成能力,可以使用基于合成的图像分析技术对人脸图像进行特征提取和建模。这个阶段所提出的算法在理想图像采集条件,人员配合,中小规模正面人脸数据库上达到了非常好的性能。,也诞生几个著名的人脸识别系统。第三阶段(1998年现在)这个时期关于人脸识别的研究非常热门。有大量的研究人员从事这方面的研究。主要针对的是主流的人脸识别技术在采集条件不理想和用户不配合下鲁棒性差的问题。光照和姿态问题成为了研究焦点。这个时期主要成果有:Georghiades等人基于光照锤模型的多姿态,多光照条件人脸识别方法。Blanz和Vetter等人基于3D变形模型的多姿态,多光照的人脸识别方法。Shashua等人基于上图像的人脸图像识别与绘制技术6,7。总体而言,目前非理想成像条件下(尤其是光照和姿态),对象不配合,大规模人脸数据库上的人脸识别已逐渐成为研究的重点。而非线性建模方法,统计学习理论,基于Boosting的学习技术,基于3D模型的人脸建模与识别方法等逐渐成为备受重视的技术发展趋势。从整个人脸识别的研究历史来看,基于PCA的特征脸8,9识别方法占据了非常重要的地位,也对后来的人脸识别技术产生甚远的影响。在后来很多的人脸识别技术,我们或多或少都会发现它的影子。人脸图像维数都很高,PCA方法不但很好表征人脸而且通过去除相关性,减少冗余,解决了在人脸识别过程中图像为数过高的问题。并且随着现代社会的发展,快速人脸识别的需求越来越大。所以研究基于PCA的人脸识别算法的实现还是有实际意义,本文也就在这样的背景下写作而成。第二节 人脸识别的发展趋势人脸识别至今虽然取得了丰硕的研究成果,但是还有很多问题需要解决。人脸识别的难度在于:人脸是非刚性物体,并且会随着年龄的增长而改变,特征难以完全描述;人脸常常有许多遮挡物,如:眼镜,帽子等;环境的光照和人脸的姿态等。人脸识别的未来主要的发展趋势如下:一、多数据融合与方法综合人脸识别技术经过这几十年的发展,已取得非常不错的成果。但是各种技术和方法都有自己不同的适应环境和各自的特点。如何使用数据融合理论,将不同的方法综合起来,相互补充,来取得较好的人脸识别效果,便成为人们的研究热点之一。二、动态跟踪人脸识别系统目前的静态人脸识别技术只能满足一般身份识别场合如门禁系统,考勤系统等,无法进行人脸的动态跟踪与识别。随着现在社会的发展,目前对动态人脸的跟踪与识别的需求越来越大,尤其是在一些安全领域。三、基于小波神经网络的人脸识别小波自提出以来,其理论和应用得到了长足的发展。它被认为是傅里叶分析的突破性的发展。随着神经网络的理论研究的深入,与小波,混沌,模糊集等非线性理论相结合已成为一个非常重要的发展方向。小波变换具有时频特性和变焦特性,神经网络具有自学习,自适应,鲁棒性,容错性和推广能力。如果能结合两者的优势,将会取得人脸识别不错的效果。四、三维人脸识别 目前许多人脸识别成果是建立在二维人脸基础上的,而实际的人脸是三维的。三维人脸相比较于二维图像提供了更加完整的人脸信息。随着现在三维人脸采集技术的逐步发展,如何利用三维人脸进行人脸识别已成为一个新的研究热点。五、适应各种复杂背景的人脸分割技术现在在复杂背景下的人脸分割已经取得了一定的成果,如弹性匹配,但检测速度和效果还无法令人满意。在复杂背景下快速有效检测和分割人脸技术还需进一步的研究。六、全自动人脸识别技术全自动人脸识别技术目前还处于初级研究阶段,识别效果和速度离实际的要求还相差甚远。具体原因是人脸是非刚体,无法得到准确完整的描述人脸特征。如何有效的表达人脸特征将是其研究的重点。第三节 人脸识别技术的主要难点目前的人脸识别技术在人员配合,较理想采集条件下可以取得比较满意的结果。但在人员不配合,采集条件不理想下,系统的性能陡然下降。目前的主要的难点为:一、复杂条件下人脸的检测和关键点定位人脸检测和关键点定位为实际人脸识别系统的前端处理模块,此模块直接影响着人脸识别系统的性能。目前大多数特征定位算法的精度都会随着光照,姿态等变化而快速下降。复杂条件下的人脸检测与关键点定位是目前人脸识别急需解决的问题之一。二、光照问题关照问题是计算机视觉存在已久的问题,尤其在人脸识别中表现得更加明显。但目前为止光照处理技术远未达到实用的程度,还需要深入的研究。三、资态问题对于姿态的研究相对不多,现在人脸识别算法主要以正面或准正面姿态。当人脸姿态俯仰或左右比较大时,人脸识别的识别率骤降。如何提高人脸识别系统对姿态的鲁棒性是人脸识别中一个具有挑战性的任务。四、表情问题表情识别是生物特征识别的中的一种,是人机交互不可或缺的部分。表情是复杂的面部肌肉运动,每个表情都是几十块面部肌肉共同运动的结果,很难用精确的数学模型来表示这些肌肉的运动。面部表情的变化为面部特征点的运动。由于目前的计算机技术的限制,计算机还不能准确的定位这些面部特征点,也无法辨别面部肌肉的运动。而且,同一种表情在不同的人上也会有不同的表现形式。并且同一个人的不同表情之间也没有明确的界限。以上这些决定计算机很难用统一的标准来识别人的面部表情。五、遮挡问题对于非配合情况下,采集到的人脸图像一般都不是完整的,这会影响人脸特征提取与识别,可能还会导致人脸检测算法的失效。如何有效地排除遮挡物的影响有着非常重要的意义,如在监控环境下。以上列举了部分主要的技术难点,其他难点由于本文的讨论不会涉及,所以不会再一一列举。本文的实验是在人脸图像正面姿态,光照正常,表情正常,部分面部图像有小范围遮挡的情况下进行的。这样做的目的只是让我们的工作重心集中在分析PCA 人脸识别算法性能上。第四节 人脸识别流程图1.1 人脸识别系统处理流程一、人脸图像采集采集人脸图像是通过传感器采集人脸图像,并将其转换为计算机可以处理的数字信号。这是人脸识别的第一步。在采集人脸图像时,要注意用户人脸姿态,脸部有无遮挡,周围光照是否满足要求及设备采集图像的质量是否能满足要求。二、预处理预处理是为了除去噪声和对测量仪器或其他因素对人脸图像造成退化现象进行复原。从传感器采集到图像除了包含人脸特征信息,还包含背景信息,所以必须从原始人脸图像分割出我们要处理的部分。如何分割就需要定位和分割算法。他们一般以人脸图像在图像结构和人脸信号分布的先验知识为依据。常用的人脸预处理有人脸图像灰度化,人脸图像二值化,人脸图像归一化,直方图修正,图像滤波和图像锐化。三、特征提取特征提取就是计算机通过提取人脸图像中能够凸显个性化差异的的本质特征,进而来实现身份识别。本文讲解如何使用PCA算法提取人脸特征,进而实现人脸识别。特征主要包括三种类型:物理特征,结构特征和数学特征。由于物理特征和结构特征容易被察觉,触觉以及其他感觉器官所感知,所以人类常常是利用这些特征来对对象进行识别。对于计算机而言,模拟人类的感觉器官是很难实现的,但计算机在处理数学特征的能力上要比人类强得多,因此我们通过诸如协方差矩阵,统计平均值和相关系数等数学特征来构建人脸识别系统。特征提取和选择的根本任务就是从许多特征中找出那些最有效的特征。在样本数不是很多的情况下,可以利用这些特征进行分类器的设计,但是在大多数情况下,由于测量空间的维数很高,不能直接进行分类器的设计。因此,如何把高维测量空间压缩到低维特征空间,以便有效的设计分类器,便成为了一个值得思考的问题。为了获得有效的特征,一般需要经过特征形成,特征提取和特征选择等步骤。1. 特征形成特征形成是根据被识别对象产生出一组基本特征的过程,当被识别的对象是波形或数字图像时,这些特征可以通过计算得来;当被识别对象是实物或某种过程时,这些特征可以用仪表或传感器测量来得到。通过上面方法获得特征被称为原始特征。2. 特征提取原始数据组成的空间被称为测量空间。由于测量空间的维数一般都很高,不易设计分类器,所以在分类器设计之前,需要从测量空间变换到维数很少的特征空间,由特征向量表示。通过映射或变换方法用低纬空间来表示样本的过程被称为特征提取。映射后的特征称为二次特征,它们是原始特征的某种组合,通常是线性组合。3. 特征选择从一组特征中挑出一些最有效的特征从而达到降低特征空间维数目的的过程称为特征选择。由于在许多实际问题中常常不容易找到那些最重要的特征,或者由于条件限制而不能对这些重要特征进行测量。从而使得特征选择和特征提取的任务复杂化。特征提取和特征选择在有些情况下并不是截然分开的,因为从一定意义上来讲,二者都是要达到对数据进行降维的目的,只是实现的途径不同。特征提取是通过某种变换的方法组合原有的高维特征,从而得到一组低维的特征。而特征选择是根据专家的检验知识或评价准则来挑选对分类最有影响的特征。比如可以先将原始特征空间映射到维数较低的空间,在这个空间中在进一步选择特征来进一步降低维度;也可以先去除那些明显不含有分类信息的特征,而后再进行映射以降低维度。四、特征匹配特征匹配是计算两个人脸图像特征样本的特征模块间的相似度即将采集到的人脸图像的特征模版与系统中已存储的特征模版进行比对,并输出最佳匹配对象。在本文主要讲解使用最近邻法分类器欧几里得距离来判别人脸图像,在实际广泛使用的还有基于SVM即支持向量机,基于神经网络和图匹配的方法。第五节 本章小结本章由人脸识别的研究背景,人脸识别技术的主要难点,人脸识别的发展趋势和人脸识别流程四个小节构成。在人脸识别的研究概况小节主要讲解人脸识别的研究概况及基于PCA人脸识别算法实现的研究意义。在人脸识别的发展趋势小节主要讲解人脸识别技术未来的走向。在人脸识别技术的主要难点小节主要讲解人脸识别的主要技术难点及本文是在什么样的条件进行试验的。人脸识别小节讲解本文人脸识别的流程。第二章 人脸图像的获取第一节 人脸图像获取随着计算机科技和微电子的发展,现在人脸图像采集设备也越来越多。常用的采集设备有数码相机,数码摄影机等。但是采集设备成像原理各异,有些设备对某类人脸图像的采集效果比较好,进而人脸识别率高,对不同类的人脸图像采集效果差,进而人脸识别率低。不过随着现在科技的发展,这个问题已基本上被解决。另外,人脸图像采集的形式不同也会影响识别率。人脸图像的采集形式主要有两种:一为静态人脸图像,二位动态人脸图像。静态人脸图像的采集相对比较简单,用数码相机即可获取。动态人脸图像相比静态人脸图像获取难度较大,但其更加贴近实际需求,应用场合更加广阔。动态人脸图像相比于静态人脸图提供了更加客观的信息量。但同时也带了问题,动态人脸图像序列里的某一幅图像可能会产生瞬间模糊,这将会影响其识别率。上述问题是由人脸的多变性产生的。对于动态人脸图像要考虑如何在序列中提取清晰的图像又不丢失局部信息。同时建立人脸图像间的相关性是有必要的,可以有效的提高识别率。在实际中,要采用何种人脸采集形式要取决于应用的需求和场合。一般而言,动态人脸图像采集应用于特殊场合,如犯罪识别过程,而静态人脸图像采集应用于普通的安全场合。对于静态人脸图像采集要注意要确保人脸表情正常,姿态无倾斜,光线尽量均匀,并且要对周围的光源做必要的处理,避免受到周围强光和不均匀异色光的干扰。采集完成后要对每个对象的图像做必要的审核,剔除掉不符合要求的人脸图像。第二节 人脸分割人脸识别是通过对人脸进行精确定位,并从图像中提取人脸区域。人脸分割属于图像分割,是人脸识别系统中不可缺少的一环。要对人脸进行识别一般需要将人脸区域从采集到的图像中分离出来。人脸分割比较经典的方法有数据驱动和模型驱动。数据驱动方法直接对图像进行处理,不依赖于先验知识。其包含有基于边缘检测的方法,基于阀值的方法和基于区域增长的方法。基于模型的方法需要先验知识。其包含有活动轮廓模型等。采集到图像中人脸区域颜色和纹理变化较大,因此如果要实现精确分割,只利用图像的数据信息是不够的,所以实际中基于模型的方法使用的比较多。基于边缘的分割方法需要两个步骤,分别为边缘检测和边缘连接。该方法先提取边缘后再进行边界连接,得到分割轮廓。但是这个方法也存在问题,实际中由于噪声的图像的影响,常常会检测到假的边缘,从而导致错误的分割。基于阀值的方法是使用采集到图像的灰度直方图计算出分割阀值,又可以分为全局阀值方法和局部阀值方法。全局阀值方法是使用整个图像的灰度信息,来得到用于分割的阀值。局部阀值方法是图像不同区域得到对应不同区域的阀值即一个阀值对应图像的一个子区域。在实际中,由于噪声等因素的影响,直方图经常不能有明显的峰值出现,这是选择阀值并不合理,它是由阀值分割的特点决定的。此方法只考虑了图像的灰度信息,抛弃了图像的其他信息。对于灰度差不明显的图像,得不到令人满意的结果。基于区域增长的方法是将含有相似性质的像素集合起来形成一个新的区域。首先把图像分割成较小的区域,有可能非常小,甚至可能是一个像素。在每个子区域中,对经过适当定义能反映一个物体内成员隶属度的性质进行计算,每个子区域会用一组参数来表示该区域。然后对相邻区域所有边界进行分析,若便捷信息强,则边界不变,若边界信息弱,则消除个边界并合并相应的邻域。它是一个迭代过程,每一步重新计算边界信息,若没有区域合并,迭代完成,图像分割完成。该方法开销较大,但可以使用图像的相关性质进行边界定位。该方法当前研究的区别在于区域性质差异上。基于模型的方法,都是通过引入统计信息来得到高鲁棒性。其中活动轮廓模型是使用在图像上的一条动态曲线,在内力曲线本身新的表现和外力图像信息的表现共同作用下趋于对象的轮廓。模型方法具有丰富的先验知识,在实际中具有很好的适应性和鲁棒性。目标分割与识别通过将目标集合和统计信息表示为模型,是其成为目标的搜索匹配或监督分类。第三节 人脸数据库人脸数据库是人脸识别研究,开发和评测不可缺少的。每个人脸识别系统都需要一个人脸数据库。人脸图像数据库的设计对人脸识别系统的识别率有着非常大影响。设计一个在所有变化情况下都能正确识别的系统是非常困难的,而且也没有必要。所有人脸识别系统都是在一定的约束条件进行的。所以有必要建立满足不同需要的人脸数据库。常用人脸数据库如下:国外人脸数据库的有FERET人脸数据库, MIT人脸数据库,YALE人脸数据库,PIE人脸数据库,ORL人脸数据库,AR人脸数据库和Essex人脸数据库。FERET人脸数据库是人脸识别中最常用的数据库,包含多姿态和多光照的人脸灰度图像,但其多为西方人脸图像,每个人的人脸图像变化较少。MIT人脸数据库有麻省理工大学媒体实验室建立,由16位志愿者的2592副多姿态,多光照和不同大小的图像组成。PIE人脸数据库有卡内基梅隆大学建立,由68位志愿者的41368副不同姿态,多光照和不同表情的图像组成。ORL人脸数据库由剑桥大学AT&T实验室建立由40位志愿者的400幅图像组成,其中部分志愿者的图像还有姿态,表情和光照的变化。由于其人脸变化模式较少,现已很少使用。AR人脸数据库为西班牙巴塞罗那计算机视觉中心建立,由116人的3228幅图像构成。采集是在严格控制摄像机参数,光照变化,摄像机距离等条件下进行的。Essex人脸数据库是英国埃塞克斯大学的人脸数据库。任何人都可以下载它的人脸数据库,但是你不能发布,打印,销售或发行这些图像。这个人脸数据库由Libor Speacek博士主持的计算机视觉研究项目在维护。这个数据库由faces94,faces95,faces96,grimace四个库组成。这样做的目的是为了增加难度。Faces96和grimace是这个数据库最难识别的。它们的背景和比例是变化的,人脸表情是极度变化的。英国埃塞克斯大学计算机视觉研究项目鼓励研究者公布使用这个数据库取得人脸识别结果。我们在本文采用的是它的face94数据库。faces94数据库中人脸图像是在受试者坐在距离相机固定位置,并要求讲话的情况下采集而成。讲话的目的是为了采集面部表情的变化。每个图像的大小为180*200,图像的背景是蓝色的。有轻微的姿态变换,无光照变换。国内人脸数据库有中科院计算技术研究所银晨科技面向识别联合实验室建立的CASPEAL人脸数据库。该数据库是基于目前的人脸数据库大多都较小或图像变化因素单一,人脸图像的多为西方人,其面部特征与东方人存在一定的差别,需要建立一个大规模,多因素的东方人脸数据库的需求建立的,共采集了1040位志愿者(595名男性,445名女性)的99450幅图像。该数据库根据不同的变化因素又分为7种模式子库。这7种变化因素为姿态,表情,饰物,光照,背景,距离和时间跨度,其中以姿态,表情,饰物和光照为主,故称为PEAL(pose,expression,accessory和lighting的简写)。CASEPEALR1为CASEPEAL的共享版,可以提供给研究人员用以研究使用。其中研究人员指的是研究生导师或其他固定职位的研究员,不包括学生。第四节 本章小结本章主要介绍人脸图像获取,人脸分割和人脸数据库。在人脸图像获取和人脸分割两个小节中主要介绍常用的人脸获取方法及获取人脸原始图像后如何分割出我们需要部分的方法,也为后面人脸图像数据库打下了基础。在人脸数据库一节中,主要介绍了常用的人脸数据库及本文的实验是在Essex人脸数据库中我们选择出来的子库中进行的。这样做的目的是我们的工作中心集中在核心人脸识别算法的性能研究上。第三章 人脸图像的预处理第一节 人脸图像格式在计算机中任何信息都是以文件的形式存储,图像信息也不例外,它经过采样,量化和编码后以图像文件进行存储,所以在人脸识别之前有必要介绍图像文件格式。图像的文件格式很多,本节只介绍本文常用的几种图像格式。一、JPEG格式JPEG文件格式是常用的图像文件格式。它是由联合照片专家组(Joint Photographic Experts Group)开发的,并且命名为“ISO10918-1”,JPEG仅仅是一种俗称而已。JPEG文件以.jpg或.jpeg为扩展名,其压缩技术非常先进。JPEG使用有损压缩方法去除冗余图像和彩色数据,获得了较高的压缩率,同时还可以给人丰富生动的视觉感受,即可以使用最小的磁盘存储较好的图像质量。它是一种灵活的格式,可以调节图像质量,允许使用不同压缩比例压缩文件。由于JPEG优异的品质和杰出的表现,它的应用也非常广泛,特别是在网络和光盘读物上,肯定都能找到它的影子。目前各类浏览器均支持JPEG这种图像格式,因为JPEG格式的文件尺寸较小,下载速度快,使得Web页有可能以较短的下载时间提供大量美观的图像,JPEG同时也就顺理成章地成为网络上最受欢迎的图像格式。二、JPEG2000格式JPEG2000是基于小波变换的图像压缩标准,同样由联合照片专家组(Joint Photographic Experts Group)开发和维护。JPEG2000通常被认为是未来取代JPEG(基于离散余弦变换)的下一代图像压缩标准。JPEG2000文件的扩展名为jp2。JPEG2000压缩率比JPEG高约30%左右,同时支持有损和无损压缩,而且不会产生原先的基于离散余弦变换的JPEG标准的块状模糊瑕疵。JPEG2000格式有一个极其重要的特征在于它能实现渐进传输,即先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,让图像由朦胧到清晰显示。此外,JPEG2000还支持所谓的"感兴趣区域" 特性,可以任意指定影像上感兴趣区域的压缩质量,还可以选择指定的部分先解压缩。在有些情况下,图像中只有一小块区域对用户是有用的,对这些区域,采用低压缩比,而感兴趣区域之外采用高压缩比,在保证不丢失重要信息的同时,又能有效地压缩数据量,这就是基于感兴趣区域的编码方案所采取的压缩策略。其优点在于它结合了接收方对压缩的主观需求,实现了交互式压缩。而接收方随着观察,常常会有新的要求,可能对新的区域感兴趣,也可能希望某一区域更清晰些。三、BMP格式BMP(Bitmap-File)图形文件是Windows采用的图形文件格式,在Windows环境下运行的所有图象处理软件都支持BMP图象文件格式。Windows系统内部各图像绘制操作都是以BMP为基础的。Windows 3.0以前的BMP图文件格式与显示设备有关,因此把这种BMP图象文件格式称为设备相关位图DDB(device-dependent bitmap)文件格式。Windows 3.0以后的BMP图象文件与显示设备无关,因此把这种BMP图象文件格式称为设备无关位图DIB(device-independent bitmap)格式。Windows 3.0以后,在系统中仍然存在DDB位图,只不过如果你想将图像以BMP格式保存到磁盘文件中时,微软极力推荐你以DIB格式保存。目的是为了让Windows能够在任何类型的显示设备上显示所存储的图象。BMP位图文件默认的文件扩展名是BMP或者bmp,有时它也会以.DIB或.RLE作扩展名。BMP格式的特点是包含的图像信息较丰富,几乎不进行压缩,由此导致了它的缺点占用磁盘空间过大。四、GIF格式GIF图像互换格式(Graphics Interchange Format)是CompuServe公司在 1987年开发的图像文件格式。GIF文件的数据,是一种基于LZW算法的连续色调的无损压缩格式。其压缩率一般在50%左右,它不属于任何应用程序。目前几乎所有相关软件都支持它,公共领域有大量的软件在使用GIF图像文件。GIF图像文件的数据是经过压缩的,而且是采用了可变长度等压缩算法。GIF格式的另一个特点是其在一个GIF文件中可以存多幅彩色图像,如果把存于一个文件中的多幅图像数据逐幅读出并显示到屏幕上,就可构成一种最简单的动画。在早期,GIF所用的LZW压缩算法是Compuserv所开发的一种免费算法。然而令很多软件开发商感到意外的是,GIF文件所采用的压缩算法忽然成了Unisys公司的专利。据Unisys公司称,他们已注册了LZW算法中的W部分。如果要开发生成(或显示)GIF文件的程序,则需向该公司支付版税。由此,人们开始寻求一种新技术,以减少开发成本。PNG(Portable Network Graphics,便携网络图形)标准就在这个背景下应运而生了。它一方面满足了市场对更少的法规限制的需要,另一方面也带来了更少的技术上的限制,如颜色的数量等。在2003年6月20日,LZW算法在美国的专利权已到期而失效。在欧洲、日本及加拿大的专利权亦已分别在2004年的6月18日、6月20日和7月7日到期失效。尽管如此,PNG文件格式凭着其技术上的优势,已然跻身于网络上第三广泛应用格式。与GIF相关的专利于2006年8月11日过期。GIF格式的特点是压缩比高,磁盘空间占用少。目前互联网上大量彩色动画多为这种格式。五、PNG格式PNG,图像文件存储格式,其目的是替代GIF和TIFF文件格式,同时增加一些GIF文件格式所不具备的特性。流式网络图形格式(Portable Network Graphic Format,PNG)名称来源于非官方的“PNG's Not GIF”,是一种位图文件(bitmap file)存储格式,读成“ping”。PNG用来存储灰度图像时,灰度图像的深度可多到16位,存储彩色图像时,彩色图像的深度可多到48位,。PNG使用从LZ77派生的无损数据压缩算法。 PNG是目前保证最不失真的格式,它综合GIF和JPG两者的优点,存储形式丰富,兼有GIF和JPG的色彩模式。它能将图像文件压缩到极限以利于网络传输,又能保留所有与图像品质相关的信息。它的显示速度快,只需下载1/64的图像信息就可以显示出低分辨率的预览图像。PNG同样支持透明图像的制作。PNG的缺点是不支持动画应用效果。第二节 人脸图像常用预处理方法一般,系统采集到的原始图像都会受到各种各样的噪声的影响而失真。并且由于各种条件的限制,采集到的原始图像不能直接进行使用,必须做预处理,即消除噪声,校正失真,将图像变化为标准形式。