欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > DOC文档下载  

    毕业设计(论文)人脸识别方法的比较研究.doc

    • 资源ID:4266084       资源大小:1.58MB        全文页数:70页
    • 资源格式: DOC        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    毕业设计(论文)人脸识别方法的比较研究.doc

    摘 要我们常说的生物特征识别技术,其实就是将计算技术应用到其中,然后将生物体的某些具体的行为特性以及一些固有的生理特性,与之前建立的数据库之间的数据进行对比、参照,进而识别某人或者某生物体身份的技术。近年来,有两大热门研究方向,也就是:人眼定位和人脸识别。本篇论文的主要内容是:在人脸识别的基础上,对眼部进行识别标注。首先,对用FLDA(Fliser线性判别分析法),2DPCA(二维主成分分析法),以及PCA(主成分分析法)做成的三种人脸识别方法进行一个简单的说明和比较。然后,综合讨论和分析在PTL(人眼定位算法)中所涉及到的噪声敏感度和人眼定位所需要耗费的时间。具体点说,就是先对样本的人脸图片进行Cabor小波变换,以找到其中的眉眼所在区域。随之,将直接获得低型地形特点的技术应用于眉眼区域,然后我们找到大概的人眼所在区域,利用相似性和对称性找到具体的人眼所在区。最终,要对这个样本人脸图片进行加噪,然后重复上述操作,最后通过观察有无噪声的人眼定位效果,以得出此方法的有效性。次之,介绍本论文的最核心部分:由粗到精的人眼定位法,其主要采用了方差滤波和地形特征点检验两种技术。第一,利用地形特征点检验技术和Cabor小波变换技术,直接获得人眼大致所在区域,也就是所谓的粗定位。第二,确定人脸所在区域,然后再这个区域上利用差分滤波器进一步确定人眼所在位置,也就是所谓的精定位。Bvertex关键字:生物特征;人眼识别;Cabor小波变换;人脸识别;由粗到精的人眼定位ABSTRACT In fact, we often say biometric technology that the computing technology was used into it, and the data between specific behavioral characteristics of organisms as well as some of the inherent physical characteristics, and prior to the establishment of a database comparison and reference, and to identify the person or a biometric identity technology. In recent years, there are two popular research directions, that are: eye location and face recognition. The main contents of this paper are: on the basis of face recognition, identification mark on the eye. First, The FLDA (Fliser linear discriminant analysis), The 2DPCA (dimensional principal component analysis), and The PCA (Principal Component Analysis) conducted three face recognition method that made a simple description and comparison. Then, a comprehensive discussion and analysis, inThe PTL (eye location algorithm) ,is involved in the noise sensitivity of the human eye positioning time-consuming need. Specifically, it is the first face of the sample image to Cabor transform, to find the location where the facial features. Following this, the type of terrain features direct access to low technologies in facial area, and then we find an approximate location of the human eye, the use of similarity and symmetry of the district to find a specific person eye. Ultimately, we want to face this sample image to add noise, and then repeat the operation, and finally we kown whether the noise effect eye location by observing, in order to obtain the effectiveness of this method. Last, the most central part of this paper: The method to find eyes location from coarse, the main use of the variance filtering and terrain feature point test two technologies. First, the use of terrain features point inspection techniques and Cabor wavelet transform, direct access to the human eye generally Area, which is the so-called coarse positioning. Second, we need to determine the location of face, then this area is determined using differential filter further eye location, also known as fine positioning.Keywords: Biometrics;Recognition of the human eye;Cabor wavelet transform;face recognition;from coarse to fine eye location目 录第1章 引言5556889第2章 若干人脸识别方法的比较研究10102.1.1主成分分析(PCA)算法102.1.2奇异值分解(SVD)技术11二维主成分分析法(2DPCA)技术13Fliser线性判别分析法(FLDA)的人脸识别方法16192022第3章 基于地形特征和Cabor小波变换的人眼定位算法2324Cabor小波变换24 形态学算子之“膨胀”25 灰度积分投影26 地形特征2627 以Cabor小波变换为基础的人脸眉眼区域表示27 以直接提取地形特征为基础的的人眼候选点检测28 人眼定位之对称相似度分析法3031 在没有噪声的情况下的仿真实验31 在有噪声的情况下的仿真实验3233第4章 一种由粗到精的人眼定位算法3434 人眼方差滤波器343538394.3.1在没有噪声的情况下,PTL和GPL的仿真效果对比实验394.3.2在有噪声的情况下,PTL和GPL的仿真效果对比实验404145结论47致谢49参考文献50附录A 英文原文文献54附录B 中文翻译62第1章 引言我们常说的生物特征识别技术,其实就是将计算机技术应用其中,用检测到的生物行为特性以及生理特性与已经建立起来的生物数据库中的数据进行对比、分析,然后对生物体的种类以及身份进行识别的技术。所谓的生物特征,具有固定性和特有性等特点,其主要包括肤色,声音,指纹,虹膜,面部等等。正是因为这些生物特性的独特性,所以生物特征识别技术在身份识别,金融安全以及警方侦缉等方面取得了广泛的应用。在这些生物特征中最为推崇的则是面部识别和眼部识别,因为其具有其他身份识别方式所不具有的方便,友好,直接等特点。而在面部识别之中,眼部识别有着比嘴巴和鼻子更为可靠的独特性,其独特性几乎不会受到面部表情和光照的变化而变化,所以具有极高的身份识别价值。正是由于眼部识别具有上述如此众多的优势,所以当下眼部识别技术也自然而然的成为了当下研究者们的宠儿,热门中的热门。本文的主要内容大致如下:首先对不同种类的人脸识别方法进行一个简单的比较,然后再介绍一下由粗到精的人眼识别方法的实现过程。人脸识别技术,作为一种基于生物特征的重要的身份识别技术,其早在20世纪60年代末期便得以兴起。在21世纪之后,由于计算机技术,模式识别技术,数字图像技术,人工智能等相关科学领域的飞速发展,人脸识别技术也在发生着根本性的变化。人脸识别技术就是用计算机作为辅助,在视频、动静态图片中认出人脸。一般可以把情况描述成:在指定的一个视频、动静态图片中,通过已存的人脸库确定图片中的某个人或者某些人。一般,由于分类方法和提取特征的方法的不同,我们可以将其分为两大类:一个是统计方法;另一个是几何特征方法。早在上个世纪20年代末期时,人脸识别技术主要采用的是模板匹配方法,在获得一张样本图片的基础上,对其进行技术处理,获得其中所包含的某些特定的几何特性,然后与已存的样本库中的样本数据进行对比,参照,最终给出身份信息。但是这种技术也是有其优缺点的,优点:其在进行人脸识别过程中所需要耗费的时间短,占用存储小,并且在样本图片分辨率不是很高的情况下,依然能够取得很好的识别效果;缺点:由于几何特性的特征提取受到光照,角度,姿态,表情等众多因素的影响,所以几何特性的变化比较大,而且不是十分稳定,因此最终导致的是使用模板匹配导致人脸识别的识别率,以及识别的准确率都处于一个相对比较低的水平。在进入21世纪后的今天,人脸识别技术得到了长足的发展,研究它的优秀算法也是层出不穷,这其中较为典型的有如下几种:(1) 基于主成分分析(PCA)的特征脸法。其是一种十分简单,计算迅速,并且行之有效的面部识别算法,但是其没有考虑到不同类别的可分性是其最为欠缺的地方,并且其适应能力也是十分差的,比如在亮度,姿态以及拍摄角度发生变化时,其识别效果都会大打折扣;(2) 基于Fisher线性判别分析(FLDA)的Fisher脸部识别方法。其是借鉴了特这脸法中的相关方法,并且吸收了其中的可取之处,在此基础上得以形成和发展的,它的理论基础是Fisher准则的线性判别分析,它的目的是要以生成的子空间最佳可分,所以我们可以认为相比PCA法而言,特征脸法还是比较适用于脸部识别技术的脸部分析问题;(3) 神经网络方法。其通过自身的学习,学到了很多人脸的特征以及潜在的规律,所以说其具有隐性,适应性强等优点。而不足之处就是,要求作为训练的样本其数量必须是有相当的规模才可以,不然识别的效果并不是很理想。(4) 支持向量机(SVM)法。其是近些年才刚刚兴起的,是以统计学为基础的,新的分类方法。其原理大致如下:运用核函数这一工具,将待检测和分类的样本变换到设定的特征空间内,再对样本进行分类和处理。这样就使其不但可以具有很好的非线性能力,也可以避免出现类似神经网络那样过学习或者学习不足的情况。但是由于其自身是二类的分类方法,所以在进行多类分类时,必须得多一个将多类分为两大类的步骤,然后才能进行下一步的处理。关于上述四种算法,哪一种的实际效果比较好呢?那么在接下来的论文部分,将会逐一对比。人眼的定位方法以及检测部分,在过去的若干年了,得到了长足的发展。比如,红外照明的检测方法,在驾驶员疲劳监测系统之中得到了极大的应用。红外照明的检测方法就是使用了不同波段的红外线在人的视网膜上反射的位置不同这一基本的生理特点,然后实现定位的。其以鲁棒性,准确性好而著称,但是其缺点也是十分明显的,它要求摄像机必须带有红外摄像功能,而且对拍摄的角度,背景,光照的要求也是十分严格的,若是在外界复杂环境之下,其识别效果会比较差。目前,研究者们主要关注的方向是识别在常规光照或者是正常光照环境下的灰度图像和彩色图像的识别效果。经过研究者们长期不懈的努力,其中主要成就有如下几种算法:模板匹配法,灰度投影法,区域分割法,Hough变换法。值得注意的是,由粗到细的定位方法,常常是应用于彩色图像中的人眼定位。也就是说第一步是根据我们已知的皮肤颜色信息,然后将人脸从复杂的背景之中找出来,再将人脸部分的图像转换成灰度图像,加以使用模板匹配,几何特征,边缘检测,积分投影等技术,使进行眼睛定位的结果更加的精确,可靠。此种方法对图片中很多细节都具有良好的适应性,这些细节主要都包括尺度变化,人脸角度,背景等等,所以其在多人人眼检测和定位方面会有较大的优势。有些文献上的精确定位人眼则是通过采用Hough变换的方式,第一步先用以积分投影的方式,能够找到眼睛所在的大致位置;第二步用Sober算子的方法,将图像的边缘信息检测出来,然后再加以使用Hough变换方法,找到两只眼睛所在的准确位置。但是我们需要注意到这种方法的实时性和鲁棒性都比较差,而且要求我们必须检测是人脸的正面图像。当然,还有一些研究者们采用一些别的行之有效的方法,主要包括:(1) 基于灰度积分投影和最大类间的方差阈值分割技术;(2) 基于主成分分析(PCA)的对称轴检测技术;(3) 模糊分类的模板匹配技术;(4) 小波变换技术(5) 基于自评估规则,小波变换和对称变换的技术;(6) 通过多种信息在灰度图像上检测眼睛的技术;(7) 统计学习眼睛模式的判别特征技术;(8) 基于地形特征匹配技术;正是因为科学工作者们,长期不懈的努力才使得如今的人眼识别技术,其实现方法如此的丰富和高效。还有就是,眼部识别技术以及其中相关的抗噪性和实时性,也是本论文研究的一个重要内容。人脸上最为稳定和显著的特征就是人眼,其在识别人脸表情,注视信息,以及定位人脸方面发挥着很大的作用。不如说,我们常见的高速交通事故中,其中有半数以上是因为所看目标单一,导致注意力不集中或者疲劳。但是我们可以根据眼部识别技术,识别人眼的睁开程度,然后判定驾驶员是否疲劳,若是疲劳则会及时提醒以避免交通事故的发生,这也就是我们常说的疲劳监测系统。但是这其中的关键所在就是,如何能够实时的定位可能处于不同姿势和状态下驾驶员的眼睛所在位置,只要这样,通过眼睛开闭程度判定驾驶员是否疲劳,才能成为可能。当然,人脸识别也是人眼定位的重要应用之一。但是人脸识别是一个及其复杂的领域,其不但与人工智能,计算机视觉,模式识别,图像处理等多个研究领域有关,而且与心理学,认知学,神经学等等学科也是有着极其紧密的联系,在人机交互,视频会议,档案管理,智能卡,安全监控,司法验证等众多方面有着广泛应用。这篇论文主要由两个部分构成:(1) 用不同的方法实现人脸识别,其中主要包括:FLDA(Fliser线性判别分析法),2DPCA(二维主成分分析法),以及PCA(主成分分析法),并且对这些不同的实现方法进行一个简单的比较研究。(2) 对静态图像中的人眼进行研究,并且以现行的人眼识别技术为基础,得到的人眼定位算法在抗噪方面,实时性准确性以及与PTL相比改进明显的算法。从理论上来说:本次研究提取图像特征过程中用到不同方向,不同尺度的Cabor滤波器,进而经由选择人眼方向一致的Cabor滤波器参数以及自主选择人脸眉眼所在区域的频率,从而是的显示出的图像中感兴趣的眉眼部分得到突出;要研究怎样将地形特征点从得到的灰度图像之中提取出来,进而将这种技术引入到搜素人脸区域上眉眼所在区域;在样本的人眼范围内,保证准确率和实时性的前提下,人眼的精确定位我们用到了人眼方差滤波器和对称相似度分析;采用JAFFE库和AT&T库,随机取得样本图片,使用matlab软件进行实现,然后在试验的基础上对其进行改善。这篇的论文大体结构如下:第2章 ,比较研究几种比较常见的人脸识别方法;第3章 ,以地形特征检测和Cabor小波为基础的人眼定位方法,来解决人眼定位过程中存在的抗噪性和实时性方面的问题。第4章 ,详细介绍构建人眼方差滤波器的方法,并且探讨一下由粗到细的人眼定位方法;第5章 ,在总结本论文的过程和结论的基础上,提出对未来眼部识别方向的展望;本章的内容主要可以分为两个方面:(1)在给出人脸识别的基础上,简单介绍了一下人脸识别的难点和现状;(2)简单的介绍了一下眼部识别的历史,现状,以及未来的发展情况,并且概述了比较典型的眼部识别的算法。进而,自己人脸识别和眼部识别的研究背景和意义;最后,综述了一下本论文中眼部识别和脸部识别的主要研究内容,并且对本论文做了简单的结构安排。第2章 若干人脸识别方法的比较研究 在人脸识别方法中最为常见的主要有:FLDA(Fliser线性判别分析法),2DPCA(二维主成分分析法),以及PCA(主成分分析法)。虽然这些主要的经典方法,在某些具体的实用中都能取得不错的实际效果,但是往往它们也是有着各自的局限性和不足。我在这个章节的主要目的就是通过不同方法的分析对比,通过具体研究,判定它们各自工作的最佳环境与场所。最后,我在通过做一些仿真实验,来判定这几种人脸识别方法中的优劣,进而得以验证之前所对比,总结的方法有效可信。 2.1.1主成分分析(PCA)算法K_L变换这是一种十分经典的数据表示和特征提取技术,并且在计算机视觉和模式识别等相关领域得到广泛的应用,而这正是我们今天主角主成分分析(PCA)的起源。需要注意的是,在人脸识别系统之中,主成分分析(PCA)技术常常被用于样本图片的特征降维和特征提取工作。在此之前,我需要简单介绍一下K_L展开式,而它是以最小均方误差原则为基础的。现在假令在M个样本之中,用n个单位正交向量系(j=1,2,.,n)将第i个n维样本向量(i=1,.,M)进行打开,则可以得到: i=1,2,.M (2.1)可以将其转换成举行形式: (2.2)主成分分析技术(PCA)以找到一组最佳的单位正交矩阵为目的,也就是我们常说的主元,进而使得在表示元向量是其不但使用到了这些主元,而且误差最小。其主要的实现过程如下所示:用一张Wxh的图片样本图片,将它进行展开,然后获得一个Wxh的向量组(i=1,.,M),人脸样本的数量用M加以表示。同时,我们还将所以人脸样本的整体平均数用 加以表示,那么这个人脸样本的协方差矩阵就是: (2.3)首先求出了的特征值,然后将其排列为.自大到小排列,而(j=1,2,.,n)则是与其对应的特征分量,那么主元也就是前m(m<n)个最大特征值对应的特征向量(j=1,2,.,n)。那么我们就用这m个向量形成一个子空间,然后在这个子空间之中得到人脸样本图像的投影,则可以得到m个投影分量。那么此时的特征向量就是指由这m个投影分量所构成的m维向量,那么我们可以这样认为,如若人脸识别以此为依据的话,那么样本人脸图像的维数将会从之前的n维降维m维。如果人脸识别技术采用主成分分析(PCA)的方法的话,那么二维的样本人脸图像转换成人脸的话其维数将会是十分高的,同时维数比较高的还会有协方差,正是由于维数比价高,导致计算量相当巨大,所以在实际操作中会显得十分困难,并且实时性也会很差。从另一个角度来看,样本协方差有时也会出现不满之的情况。但是那些非零特征向量和特征值才是我们主要关心的,所以通常再次基础上还用用SVD(奇异值分解)的方法进一步求得特征向量和特征值。但是人脸样本的数量决定着SVD得到的协方差矩阵的维数,所以说在样本较少的情况下很难以取得比较有效的特征。但是由于维数比较高,如果样本比较多的话,所要花费的时间也是相当巨大的。因此,现在的瓶颈问题是:奇异值分解技术中样本的个数和不确定能满足实时性的需求。2.1.2奇异值分解(SVD)技术作为线代中的一个比较经典的问题,奇异值分解(SVD)技术在众多领域获得广泛应用,比如说:现代数值分析,系统识别,图像与信号处理,控制理论等。假设A用mxn的矩阵表示之,它的秩为r,那么会存在这样的两个矩阵:mxm的正交矩阵U以及nxn的正交矩阵V,并且有着这样的关系和(其中I表示单位矩阵),则会用: (2.4)其中表示非负对角阵: ,S=diag(,.,) (2.5) 用A的左右奇异向量用U,V的列向量和加以表示。同时,我们可以观察到(4)式中的A的变换使用两个正交矩阵完成的,对角阵是变换的结果。那个这个式子还可以写成这样: (2.6)这上面所以的分解过程我们称之为矩阵A的SVD(奇异值分解)。同时,我们经由上述导出SVD(奇异值分解)的过程中,我们可以进一步得出如下重要结论:(1) 可证明之:的特征向量是,的特征向量是,特征值,.,的平方即是奇异值,.,。同时,我们明显可以发现,.,的数字符号都是正的。(2) 如果假设 ,S=diag(,.,) (2.7) 而又上述的结论(1),我们可以得到: (2.8) (3)在等式两边同时又乘 ,则可以得到: (2.9) (4)现在考虑A的r个非零奇异值,则在不失去一般性的情况下,我们可以按如下的顺序对其进行排列之:那么,这个奇异值的排列顺序在U,V的列向量之中依然适用,进而我们就会有这样的结论: A的列向量所构成的空间正交基是有U的前r个列向量构成的; A的行向量所构成的空间正交基是由V的前r个行向量构成的。那么由上面的(3)和(1)的结论,我们可以知道,如果的特征向量是(i=1,2,.,r),并且其特征值为(i=1,2,.,r),那么方阵的特征向量为: ,i=1,2,.,r (2.10)其中图像的特征向量用(i=1,2,.,r)表示之。那么可以用这组特征向量的线性组合可以表示任何一幅图像,K_L变换则就是其加权系数,我们也可以称之为本图像的代数特征。一般来说,在奇异值分解(SVD)技术之中,总会存在那么一些小到几乎可以被忽略的奇异值,但是对整个实验或者系统的研究结果不会产生丝毫的影响,因此在图像压缩技术中也通常用到奇异分解(SVD)技术。在图像的压缩过程中,对于被压缩的每个图像对象而言,其被压缩的对角元素中的V和U总是唯一的,所以对于构建图像而可行性还是十分之高的。二维主成分分析法(2DPCA)技术我们假设存在这样一个X向量,其列向量是n维的,图像A也可以用mxn的随机矩阵加以表示,那么我们可以得到这样一个线性变换: (2.11)那么我们可以获得这样一个投影向量,其是m维的,其常常被称为图像A投影特征向量在投影方向X上的投影。由此可以判定,现在的主要问题是如何得到一个效果较好的投影方向X。目前,为了度量投影方向X对样本人脸的判别能力,我们通常采用引入投影样本的总散度的方式。同时,也可以用投影特征向量的协方差矩阵的迹来对投影样本的总散度进行描述。所以,我们需要采用这样的一个判断准则:(2.12)注意,所选的训练人脸样本的投影特征向量的协方差矩阵使用来加以表示的,的迹则是用加以表示的。找到一个投影方向X就是上式判定准则的最大物理意义,进而使得所以投影到X上的图像投影的总散度最大。并且协方差矩阵还可以用如下方式加以表示: (2.13) 那么就会有:(2.14)那么,我们可以用它对这样的矩阵进行定义:(2.15)图像的散度阵用矩阵加以表示,那么我们可以很轻易的得出这样一个结论,即是一个nxn的非负定矩阵。总结我们在上面所叙说的所以方法,我们得知协方差矩阵可以由二维主成分分析法(2DPCA)通过二维图像数据矩阵直接获得。那么,我们只需要计算出这个协方差矩阵的特征向量和特征值,然后建立投影坐标,并且将其中几个最大的特征向量投影到上面去,然后将所有的训练样本人脸图像投影到选定的坐标上面,那么就可以得到这些图像的特征矩阵。具体的操作流程如下所示:现在设定用于训练的人脸样本依然是Wxh的大小,并且个数为M个,并且设其协方差矩阵为:(2.16)其中,第j个训练样本的人脸用加以表示,所有训练样本人脸的均值用加以表示。而由上面我们得到的计算公式,则可以用J(x)表示描述样本总散度的评判函数:(2.17)在上述的计算公式之中,维归一化向量用X表示之,并且在上述的计算式中我还采用了通用总散度准则这个评判函数标准,还有就是我们也选定了最优投影标轴,其主要就是满足最大化总散度准则的向量X,也就是说这个向量X在选出的最有投影坐标上透出的总散度最大。那么,这个可以说明:使得向X轴上投影的训练人脸样本的图像具有最大的可分性的X,其一定是可以使得J(X)取得最大值的。最大化J(X)的归一化向量就是最优投影坐标轴,它也与最大特征值的特征向量相对应着。但是,在一般情况下,只具有一个最佳投影坐标轴是远远不够的,我们需要的是一组相互正交,并且能够取得,.,,使得J(X)能够取得最大值。同时的前d最大特征向量所对应的特征向量在归一化之后与d向量相对应,也即是:(2.18)那么,我们现在构成一个正交投影坐标系 ,而这个正交投影向量则完全是由上面所叙述的d个向量构建的,现将给定的样本图片投影到我们上面所描述的坐标系上,其具体操作方法如下式所示:(2.19)则就是我们投影后所得到的一组特征向量,其中训练人脸样本图片A的主元用加以表示。那么现在我们构建一个矩阵,将作为人脸识别系统的特征矩阵,即矩阵B=,其大小是wxd,并且完全由这些主元构建而成。二维主成分分析(2DPCA)方法其是一种直接的投影技术,其与传统的主成分分析(PCA)有着显著的不同之处,即是说训练人脸样本的矩阵的协方差矩阵不需要转换为二维,并且这些训练人脸样本的矩阵也不需要再事先转换为一维矩阵,进而导致的结果是,其维数要远远小于主成分分析(PCA)的维数,而且其在计算协方差的特征向量和特征值时极其的准确,直接,方便和快捷。二维主成分分析(2DPCA)的准则同样是追求训练人脸样本的最优化,它采用的方式是自动舍弃那些携带有用信息比较少的部分,别切自动保存那些对图像重构最具有意义和价值的部分,使得我们在图像重构时其效果最佳,误差最小,进而实现了这样个目的:即对目标图像进行特征提取和特称降维处理。现在我们再从其计算方法的角度进行对照分析,我们发现二维主成分分析(2DPCA)的方法其实降维速度最快,效果最好,耗时最少的方法,这样可以大大的节省了我们用于训练人脸样本的时间。但是二维主成分分析方法(2DPCA)也有其不足之处,比如说,其在进行降维处理时所占用的计算机内部存储比较大,这在一定程度上也制约了其发展。Fliser线性判别分析法(FLDA)的人脸识别方法由于线性判别分析的目标是使样本的可分性取得最好,所以线性判别分析的方法更加的适合模式识别类的问题,而主成分分析的最优准则则是比较不适用的。这个研究也被称之为Flisher线性判别分析,作为经典的线性判别分析方法之一,其在很早之前就得以研究,并且发展壮大。现在我们定义为类内离散度矩阵以及为类间离散度矩阵,这样我们便可以进一步的定义训练人脸样本的可分性:(2.20)(2.21)在上述的式子中总的类数用C加以表示,第i类的样本数则用加以表示,第i类的第j个样本则用加以表示,第i类样本的均值则用 加以表示。寻找一个类内离散度尽可能小而类间离散度尽可能大子空间,就是线性判别分析的目的所在。FLDA的训练人脸样本的可分性的度量标准是由Flisher准则函数所确定的:(2.22)如果非奇异的话,的特征向量就是使得取得最大值的最优线性变换,因此可以得到这样的特征子空间的基向量,其是由Flisher线性判别分析法(FLDA)所提取出来的。但是,往往呢,在具体的额实际应用的时候,人脸识别系统中想要保证类间离散度为满秩却是很难的,所以说,我们根本就没法得到所要的特征向量,通过的却是直接求解其逆矩阵的方法,而是要换行其他一些行之有效的途径和策略。在实际操作中我们往往会采用FLDA和2DPCA两种方法相结合的人脸识别方法,此法实施起来的实际效果比较好,故采用之。其实际的操作方法是这样的:首先获得训练人脸样本的最优表示特征矩阵,此特征矩阵可通过二维主成分分析(2DPCA)法获得,然后再获取最优判别特征,此特称可经由Flisher线性判别分析法(FLDA)获得之,最后利用同时对角化方法求解出的特征向量和特征值,同时由于离散度矩阵具有对称性,所以我们可以借用此性质获得一个特殊的特征系统,而其具有良好的稳定性,进而我们可以轻松获得基于训练人脸样本的最优判别特征矩阵。其中的具体实现步骤如下所示:第一步我们要做关于的特征分解:(2.23)上之前的假令我们可知,则我们得到的这是一个实对称矩阵,那么在我们堆积进行特征向量单位化之后,得到了一组标准正交集,然后我们用这些正交基组成了特征向量矩阵U,其中U表示正交矩阵,那么则会有;是一个对角矩阵,其也是的特征值矩阵,那么我们则会有以下关系:(2.24)以及另外一个关系式:(2.25)又由之前的假令我们知道是个非奇异量,那么则会有以下的关系式:(2.26)那么现在用特征值分解的方法来分解:(2.27)由于 ,根据上述的描述可以判定其也是一个非奇异的实对称矩阵,那么我们可以得到一个符合关系的特征向量矩阵V; 的特征值矩阵则可以用 加以表示。那么会有如下的关系式:(2.28)以及另外一个关系式:(2.29)综合前面的式子,我们可以进一步得到:(2.30) 那么将(28)和(30)的式子结合起来我们可以发现, 和 把和分别进行对角化之后得到I和 ,我们通常把这个也称之为同时对角化。那么,再根据(27)和(28)两个式子,则有这样一种关系:(2.31) 那么我们可以很轻易的发现的特征向量矩阵就是 ,同时的特征是矩阵就是 。 用这种方法,我们则可以在避免直接求逆运算的情况下,求得一个的稳定特征向量和特征值。模式识别中的非参数法中的一个及其重要的部分就是最近邻法,在论文的本章节之中我们就要用最近邻法作为人脸识别系统构成中的一个重要分类器。最近邻法的原理大体是这样的:其通过判断未知训练人脸样本与参考样本之间的欧氏距离,然后对其进行分类。具体的我们可以用如下的数学语言对其进行描述:如果有这样的模式识别问题,总共c类的话,其中每个类别之中的样本数是(i=1,2,.C)个,那么我们可以设定类的判别函数为: K=1,2,., (2.32)注意,类用的角标i表示之,类个样本中第k个用k加以表示,第类中第k个样本与需要识别的样本x之间的欧氏距离用加以表示。根据上式,则我们可以把决策的规则写成这样: i=1,2,.,c (2.33)那么决策的结果是:(2.34) 众所周知,二维主成分分析法(2DPCA)的主元是以一个向量作为其主元的,那么由这些主元构成的所以训练人脸样本都不是向量而是矩阵。所以,本论文已知样本和未知样本的矩阵距离定义,放在所以内容的最前言的部分。 现假设给定和这两个特征向量,那么两者之间的距离就是:(2.35)注意,特征矩阵的第k个主元用加以表示,和这两个主元向量用加以表示其间的欧氏距离。现在假设训练人脸样本有M个,并且类包含着其中的每一个样本,并且用B表示测试的人脸样本,在,以及的情况下,。本论文在这里进行仿真实验的主要目的是验证本文所总结的FLDA(Fliser线性判别分析法),2DPCA(二维主成分分析法),以及PCA(主成分分析法),这三种算法在人脸识别系统中的各自特点以及优缺点。本次仿真实验所使用的是AT&T人脸库;所用的仿真环境则是联想Z500,主频2.6G Hz,内存为4GB的个人电脑,MATLAB R2008b进行编程,测试。这里我们需要注意一点,所有特征值之和与特征向量所对应的特征值之和作为子空间基,然后两者比值的倒数,应该大于等于0.9,也就是: ,s=m or d (2.36)通过这个公式我们可以得到d和m的数值。我们先将AT&T人脸库中的人脸样本的前5张图片放在一个文件夹内,使之组成一个训练样本集,然后将剩下的所有人脸图像放在另外一个文件夹里,使之组成一个测试样本集。然后用上述的的不同种人脸识别算法对其进行测试,仿真,然后统计识别结果进行比较。其中四中算法的实验结果和准确率比较都记录在表2-1和表2-2之中:表2-1 识别准确率统计人脸库2DPCA&F

    注意事项

    本文(毕业设计(论文)人脸识别方法的比较研究.doc)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开