欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > DOC文档下载  

    人脸识别方法实现研究毕业设计论文.doc

    • 资源ID:3934450       资源大小:943.50KB        全文页数:31页
    • 资源格式: DOC        下载积分:8金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要8金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    人脸识别方法实现研究毕业设计论文.doc

    人脸识别方法实现研究姓名: 学号: 指导教师: 毕业设计(论文)任务书 题目 人脸识别方法实现研究 主要内容、基本要求、主要参考资料等:主要内容:1、了解人脸识别领域,掌握人脸识别的过程;2、熟悉ORL人脸库中的样本图像,对其进行特征提取;3、训练人脸分类器,能够完成对测试样本的识别。基本要求:1、熟悉人脸识别,掌握人脸识别的一般方法;2、掌握对ORL人脸库样本进行特征提取的方法;3、掌握分类器的用法,完成人脸识别的全过程,通过matlab的编程方法实现。时间安排:1、2010年12月-2011年1月熟悉C语言或matlab的编程的相关知识,掌握人脸识别的全过程2、2011年2月编写程序实现ORL人脸数据库中人脸特征的提取,能够将提取的特征保存成相应的数据文件;3、2011年3月熟悉分类器的基本算法,能够编写或调试相应的程序,使得程序能够正确运行;4、2011年4月基于最近邻或者其他分类器,能够将训练结果保存为数据文件;5、2011年5月将以上各个部分组合成一个软件,实现人脸识别的全过程,在此基础上撰写论文初稿;6、2011年6月修改论文,准备答辩。参考文献:1、边肇祺,张学工,模式识别(第二版),清华大学出版社,20072、张宏林, 精通Visual C+数字图像模式识别技术及工程实践(第2版),人民邮电出版社, 2008完成期限:指导教师签章: 专业负责人签章:年 月 日摘要人脸识别方法是根据人脸图像确定人的身份的一种方法,在身份认证领域具有广泛的应用。人脸作为生物特征具有不易伪造、不会遗失、相对稳定等优点,与指纹、视网膜等其他人体特征识别系统相比,人脸识别系统更加直接、友好,是未来身份识别认证的主要发展方向,也是目前模式识别领域的一个研究热点。本课题要求完成一个基于特征脸(PCA)的人脸识别方法的人脸识别系统,即能够对ORL人脸库中的样本图像进行特征提取,在此基础上训练人脸分类器,能够完成对测试样本的识别。特征脸方法是基于K-L变换的人脸识别方法,K-L变换是图像压缩的一种最优正交变换。高维的图像空间经过K-L变换后得到一组新的正交基,保留其中重要的正交基,由这些基可以张成低维线性空间。如果假设人脸在这些低维线性空间的投影具有可分性,就可以将这些投影用作识别的特征矢量,这就是特征脸方法的基本思想。 关键词:人脸识别系统 PCA K-L变换 分类器Abstract Face recognition method is used to confirm a person's identity according to face images, and it widely used in the identity authentication fields. As face is considered as Biological character, it has the advantage of not easy to be forged or lost, and it is relatively stable. To compare with other human characteristics identification system such as fingerprints or the retina, Face recognition system is more directly and friendly. Face recognition system is the main development direction in the future Identification authentication, and it is also the hotspot in the mode identification field at present.This topic is required to perform a face recognition system which is based on the method of features face(PCA).and the face recognition system could finish the feature extraction. Then, on the basis of this, practice the face classifier that is based on the artificial neural network to finish the recognition of the test sample.The face recognition method of features face is based on K-L transform, and the K-L transform is a kind of optimal orthogonal method of image compression. High dimensional images afford a new group of orthogonal basis by means of K-L transform, then, reserve the important of the orthogonal basis, and we would get a low dimensional linear space through taking advantage of these orthogonal basis. Supposing that the face projections have divisibility in the low dimensional linear space, the projections would be used for characteristic vectors which are need for recognition. Above all, that is the thought of features face.Keywords: Face recognition system PCA K-L transforms Classifier目录摘要 IAbstract II1 绪论 11.1人脸识别的目的和意义11.2人脸识别的研究内容21.3人脸识别技术概述21.4常用的人脸库及其特点31.5人脸识别系统评价标准51.6论文组织安排52 人脸识别相关技术综述62.1人脸识别方法62.2人脸特征提取技术介绍92.2.1基于奇异值分解(SVD)的人脸特征提取92.2.2基于积分投影的人脸图像特征点的提取102.2.3基于KDDCT特征提取113 主成份分析143.1主成份分析简介143.2主成分的正交旋转143.2.1主成份的定义及导出153.2.2主成份的几何意义163.2.3主成份的性质164 基于PCA的人脸识别184.1人脸识别具体步骤184.2主成份在人脸识别中的应用184.2.1特征脸空间的形成184.2.2利用特征脸空间来识别人脸204.3特征向量的选择214.4三阶近邻分类器224.4.1其他几种分类器简介234.5实验过程及结果24结论25致谢26参考文献271 绪论1.1人脸识别的目的和意义随着现代社会的发展与科学的进步,它对快速的有效的辨别身份的需求越来越迫切。传统的身份识别一般是通过人身的标志物和人身标志知识来检验的。人身标志物例如钥匙,证件等物品,人身标志知识例如用户名,密码等核对知识。但是这些东西往往容易丢失和遗忘,甚至被他人得到后去假冒身份,从而盗取钱财等等。而生物识别技术为身份识别则提供了重要的保障,它包括面部特征,手形,指纹,虹膜等等。其中人脸识别技术最具有吸引力,因为它最直观,最自然,不容易被遗忘,而且符合人的认知规律。人脸识别技术从90年代后期时,被商业化地逐渐进入了市场。近些年来人脸识别技术作为计算机安全技术,在全球的范围内迅速发展起来。通过计算机进行人脸识别操作,就是通过提取人脸图像特征,从而进行识别身份的一门技术。它在国家安全、公共安全以及军事安全领域,包括智能门禁、视频监控、公安布控、海关身份验证、各类证件验证等方面是典型的应。曾经公安部门获得案犯人的照片后,需要在存储罪犯照片的数据库中人工找出与照片最相象的人为嫌疑犯。或者根据目击证人的描述,先画出嫌疑人面部草图,然后用这张草图到库里去找嫌疑犯。罪犯数据库往往由几千幅图像组成,如果搜索工作由人工完成,不仅效率低,而且容易出错,通常人们在看了上百幅人脸图像后,记忆力往往会急剧下降。如今由计算机来完成识别工作则不会出现此问题。在民事和经济领域中,例如在各类银行卡、信用卡、储蓄卡等的持卡人的身份验证以及社会保险人的身份验证上等具有重要的应用价值。在身份证上,驾驶证上以及其他许多证件上都有用户的照片,现在这些证件多是由人工验证的,如果应用人脸识别技术,这项工作就可以交给机器完成,从而实现自动化智能管理,提高准确性和效率问题。当前普通使用的另一类的证件是用符号或条形码标记的,比如信用卡等。这类卡的安全系数比较低,不仅卡可能丢失,其中密码也可能被遗忘或被他人窃取。如果在这类卡上加上用户的人脸特征信息,则可以大大提高其安全性能,保障用户权益。在家庭娱乐等领域中,人脸识别技术也具有一些很有趣的应用,例如能够识别主人身份的智能玩具、家政机器人、具有真实面像的虚拟游戏玩家等,这些给人们的生活增加了不少的乐趣。如今,人脸检测的应用背景已经远远超出了人脸识别系统的范畴,它在基于内容的检索,数字视频处理和视觉监测等方面有着重要的应用价值。入口控制的范围很广,它可以是设在大楼、企业或私人住宅的入口处进行安全检查,也可以是设在计算机系统或情报系统等的入口控制。在一些保密性要求严格的部门,除了用证件,也要加上生物识别手段,如指纹识别、手掌识别、视网膜识别和语音识别等。人脸识别与之相比,具有直接、方便的特点。当前计算机系统的安全管理也是非常重要的,普遍使用的由字符和数字组成的密码可能会被遗忘或破解,但是把人脸当作口令则既方便又安全。在视频监视上,有许多银行、企业、公共场所等都设有24小时的视频监视。公安人员在破案时有时也要用摄像机对人进行跟踪。在对图像进行分析时,就要用到人脸的检测、跟踪和识别技术完成。另外,人脸识别技术还涉及到例如图像处理,模式识别,计算机视觉以及神经网络等学科,它和人脑的认识程度紧密相关。所以人脸识别技术的研究,不仅推动了图像处理,模式识别的理论应用发展,满足了身份辨别等要求,而且由于它的特殊性,在对于认知科学,生理学,心理学上也起到了积极的推动作用。1.2人脸识别的研究内容人脸识别过程首先是对于输入的图像或视频流进行判断,搜索其中是否存在人脸,如果有人脸的存在,则进一步给出每个人脸的位置、大小以及其主要面部器官的位置信息,然后依据这些器官信息或者人脸图像的整体信息,从而进一步提取每个人脸中所包含的面部特征,并将这些特征与已知人脸库中的人脸模板特征进行对比,从而识别出每个人脸的身份,达到了身份识别的目的。从广义上讲,人脸识别的研究内容主要包括以下的五个方面:人脸检测:从各种不同的场景中检测出人脸的存在,确定出人脸的具体信息和主要面部特征的信息,这一步骤通常受光照、噪声、头部倾斜度或各种遮挡的影响;特征提取:表示检测出的人脸和人脸数据库中己知的人脸模板通过面部特征的描述方式。通常使用的方法有几何特征法(如欧氏距离、曲率、角度等)、代数特征法(如矩阵特征矢量等)、固定特征模板法、特征脸法、云纹图等;人脸鉴别:即通常所说的人脸识别,它是将待识别的人脸图像与人脸库中的己知人脸图像进行比较,得出相关结论。这一过程的核心是选择合适的人脸表示方式和它们适当的匹配闽值;表情分析:对待识别人脸的表情进行分析,从而对其加以分类;物理分类:对待识别人脸的物理特征进行分类,从而得出其年龄、性别、种族等相关物理信息。1.3人脸识别技术概述人脸识别技术不仅可以推进对人类视觉系统本身的认识,还可以满足人工智能应用的需要。采用人脸识别技术去建立自动人脸识别系统,通过计算机实现对人脸图像的自动识别在我们的生活中有着广阔的应用领域和很好的应用前景。同时人脸识别作为一种生物征识别技术与其它较成熟的识别方法(如指纹、虹膜、DAN检测等)相比有以下几个优:无侵犯性人脸图像的获取过程不需要与被检测人发生身体等接触,可以在不惊扰被检测人的情况下进行,使得用户接受程度高。同时人脸识别技术使用摄像头作为识别信息的获取装置,自动完成识别过程;直观性突出人脸识别技术采用的依据是人的面部特征图像,人脸无疑是人眼能够判别的最直观的信息源,符合大部分人的认知规律。同时也方便后期的人工确认、再利用等明显优势;识别速度快,不易被察觉与其它的生物识别技术相比,人脸识别是一种自动识别技术,它一秒钟时间内可以识别很多次。不易被察觉的特点对于识别方法也很重要,它使该识别方法不令人产生反感,并且由于不容易引起人的注意从而不容易被欺骗;不易仿冒。人脸识别技术要求识别者必须亲临识别现场,他人无法仿冒。它独具的活性判别能力,保证了他人无法以非活性的照片、蜡像或者人头来欺骗识别系统,提高了安全性;应用领域广除了目前指纹识别的应用领域以外,人脸识别技术还可以应用到各类人脸视频监控报警系统检测、数码相机的人脸检测,以及未来的机器人应用,具有广阔的市场应用前景;低成本,易安装人脸识别系统只需要使用普通的摄像头、数码摄像机装置或手机上的嵌入式摄像头等被广泛使用的摄像设备,不需要高成本的投入,对识别用户来说也没有特别的安装要求。人脸识别的基本步骤如下:首先进行用户注册,用摄像头拍摄或从照片采集处得到用户的人脸图像,然后生成人脸图像的特征数据,建立其图像档案,作为模板库进行存放;当进行用户识别时,用摄像头获取用户的人脸图像,然后进行特征提取。最后将待确定的用户的特征数据与档案中的所有注册过用户的特征数据进行比对。同时人脸检测研究具有重要的学术价值。人脸是具有相当复杂的细节变化的自然结构,此类结构的检测问题的挑战性在于:人脸由于面部特征、表情、肤色等不同,具有模式的可变性;可能存在眼镜、胡须或饰物等附属物; 作为三维物体的人脸的影像不可避免地受到由光照产生的阴影的影响;因此,如果能够解决这些问题,成功地构造出人脸检测与跟踪系统,也将为解决其它类似的复杂模式检测问题提供出重要的启示。同时,这也是人脸识别技术面临的困难与挑战。人脸的特征不稳定,人们可以通过脸部的变化产生很多不同表情,而且在不同的观察角度,人脸的视觉图像也相差很大,同时还受着年龄变化等多方面因素的影响。这些都是我们需要完善技术的重要点。1.4常用的人脸库及其特点目前人脸识别领域常用的人脸数据库主要有: ORL人脸数据库由剑桥大学AT&T实验室创建,包含40人共400张面部图像,图像分辨率为92*112像素大小,为灰度图像,人脸的面部表情和细节均有很大的变化,例如笑与不笑,戴眼镜或者不戴眼镜等。人脸的姿态也有很大的变化,其深度旋转和平面旋转可达20度,人脸的尺寸也有最多10%的变化。ORL人脸库是此次设计中采用的人脸数据库。如图1.5.1所示图1.5.1 Yale人脸数据库由耶鲁大学计算视觉与控制中心创建,包含一共15位志愿者的165张图片,包含光照(正面光照,左面光照,右面光照),表情(高兴,悲伤眨眼等)和姿态的变化,人脸的姿态视角不变,全部是正面人脸图像。光照变化是Yale人脸数据库的主要特点。如图1.5.2所示图1.5.2 AR人脸数据库AR人脸数据库是普渡大学机器人视觉研究中心建立的,包括126人(70男性,56女性)的4000多幅图像.图像为24位彩色图,分辨率为768*576像素大小,格式为RAW格式。其中人脸图像是正面人脸,包含表情,光照和遮挡等变化。表情变化和遮挡是这个数据库的主要特点之一,该数据库不仅可以用来人脸识别,还可以用于表情识别,其中采集环境中的摄像机参数,光照环境和摄像机距离等都是严格控制的。 FERET人脸数据库为了促进人脸识别算法的研究和实用化,美国国防部的Counterdrug Technology Program(CTTP)发起了一个人脸识别技术(Face Recognition Technology简称FERET)工程。它包括一个通用的人脸数据库和一整套的测试标准。库中的人脸图像具有不同姿态视角,表情和光照等变化,而且它还包括时间间隔变化,最长的时间间隔达三年之久。FERET人脸数据库包括千人的几万幅人脸图像,而且还在不断扩增,是人脸识别领域应用最广泛的人脸数据库之一。 CMU PIE人脸数据库由美国卡耐基梅隆大学创建,所谓的PIE就是姿态(POSE),光照(ILLUMINATION)和表情(EXPRESSION)的缩写。CMU PIE人脸库创建于2000年11月,包括68位志愿者的41,368张多姿态,光照和表情的面部图像.其中的姿态和光照变化图像也是在严格控制的条件下采集的,目前已经逐渐成为人脸识别领域的一个重要的测试集合。如图1.5.3所示图1.5.31.5人脸识别系统评价标准系统识别率即要求系统的识别率高,一般主要用错误接受率和错误拒绝率这两个性能指标进行评价,识别率与它们之间的关系为:识别率=100%-错误接受率-错误拒绝率;对样本的约束在不影响识别性能的前提下,要求训练样本数量尽可能少,测试样本应该比实际应用更为复杂,同时还要考虑系统的鲁棒广义化问题;速度和硬件要求要求系统训练速度和识别速度尽可能快,识别系统对硬件设备要求不是很高;人机界面希望系统的人机界面友好结合,并且不影响系统在实际中的应用。一般他评价标准还有:系统识别人数、系统的学习能力以及处理噪声的能力等。1.6论文组织安排本文组织结构如下:第二章介绍人脸识别的相关技术包括人脸识别的几种方法和人脸特征提取技术的介绍;第三章主要讲解主成份分析原理,包括主成份的定义,导出,几何意义和性质等,为人脸识别理论打下基础;第四章讲述具体基于PCA的人脸识别过程,包括特征空间的形成,特征向量的选取和利用三阶近邻分类器的识别过程,最后在结尾增加了本次实验的结果,数据及分析。2 人脸识别相关技术综述2.1人脸识别方法特征脸方法基于K-L变换(PCA)的人脸识别方法又叫特征脸方法或者本征脸方法,她最早是由Turk和Pentland提出。也是此次设计所选用的方法。特征脸方法是从主成份分析 (Principal Component Analysis,PCA)中导出的一种关于人脸识别和描述技术,实质上是通过K-L(Karhumen-Loeve)变换来实现的,K-L变换是图像压缩技术中的一种最优正交变换方法。其生成矩阵一般为训练样本的总体散步矩阵。特征脸方法是将包含人脸的图像区域看作为一种随机向量分布区域,因此采用K-L变换获得其正交基底。对应其中较大的特征值的基底与人脸有相似的形状,故将其称为特征脸。而后利用这些基底的线性组合便可以描述,表达和逼近人脸图像。通过这样便可以进行人脸的识别与合成。识别过程就是将人脸图像映射到由特征脸张成的子空间上,比较它与已知人脸在特征空间中的位置。具体地说,就是将一个高维的向量,通过一个特殊的特征矩阵,投影到一个低维的向量空间中,表征为一个低维向量,并保留住其主要信息。即通过低维向量和特征向量矩阵就可以完构出所对应的高维向量。这种表达相对于图像为是一种高度压缩的方式。特征脸方法把人脸图像作为一个整体来编码,而不关心眼、嘴、鼻等单个特征,从而大大降低了识别的复杂度。此方法的主要缺点为目前还没有一个高效的求解特征值和特征向量的算法,所以每当一张新脸入库,都需要重新计算特征值和特征向量,耗费时间较多。优点是:图像的原始灰度数据可以直接用来学习和识别,不需任何初级或中级处理;不需人脸的几何和反射知识;而且通过低维子空间表示进行有效压缩;使与其他匹配方法相比,识别简单有效。基于几何特征的人脸识别方    基于几何特征的人脸识别方法方法是早期的识别方法之一。通常采用的几何特征为人脸的五官,例如眼睛、鼻子、嘴巴等的局部形状特征,包括眉毛的厚度以及眉毛与眼睛中心的垂直距离;鼻子的宽度和垂直位置,嘴巴的宽度和垂直位置,以及它和上下唇的高度等。所以提取特征时需要用到人脸结构的一些先验知识。识别时采用的几何特征是以人脸的器官的形状和几何关系为基础的特征矢量,其本质上是特征矢量之间的匹配,通常用的方法是基于欧式距离的判决。最早的人脸识别方法叫做侧影识别,它从人脸侧面轮廓线上提取特征点入手,将其侧影简化为轮廓曲线,然后从中抽取若干个基准点,用这些点之间的几何特征来进行识别。由于证件照目前多为正面照,所以这种方法已很少见。正面识别的重点是合适的归一化,使之不依赖于图像中人脸位置的尺度变化和旋转变化。识别采用的人脸特征是以人脸面部器官的几何形状和几何关系为基础的特征矢量,其分量通常包括人脸指定两点间的欧式距离、曲率、角度等。基于几何特征的识别方法有以下优点:符合人脸识别的机理,识别方法比较简单、容易理解,而且每幅图只需要存储一个特征矢量,它对光照变化也不敏感。该方法的缺点是:对图像的要求很高,从图像中抽取稳定的特征较困难,特别是当特征受到遮挡等干预时。而且没有形成统一的特征提取标准,它对较大的表情变化或姿态变化的鲁棒性较差,所以可以说基于几何特征的方法识别只适合于粗类识别,精确度较低。基于模板匹配的人脸识别方法模板匹配法是一种经典的模式识别方法,该方法充分利用了人脸的灰度和纹理的特征。其识别方法就是将待识别的人脸图像和数据库中所有的模版图像一一进行比较,然后找出与其最相近的脸。由于模板匹配方法要求两幅图像上的目标具有相同的大小、取向和光照条件,所以需在进行图像预处理时做尺度的归一化工作和灰度的归一化工作。其中最简单的人脸模板,是将人脸看作一个椭圆,检测人脸时也就是检测图像中的椭圆。还有一种方法是将人脸用一组独立的小模板表示,如眼睛、鼻子、嘴巴、下巴及眉毛等模板。这些模板的获取必须要利用各个器官特征的轮廓,但是传统的基于边缘提取的方法很难获得较高的连续边缘。即使获取了可靠度高的边缘,也很困难从中自动提取所需要的特征量。由于这些原因于是改用弹性模板方法提取特征。弹性模板是由一组依据特征形状的先验知识来设计的可调参数来定义的。参数由能量函数决定,首先需要利用图像的边缘、峰值、谷值及强度等信息以及特征形状的先验知识,来设定能量函数,然后将参数向能量函数减小的方向做调整,当能量函数减到最小时,这组参数所对应的模板形状是最符合特征形状的。 在识别率上,基于弹性模板的方法比基于几何特征的识别方法好很多,尽管后者的识别方法识别的速度快,要求的内存也小。有些人专门对基于几何特征的识别方法和基于弹性模板的识别方法进行了比较,得出的结论是:模板匹配法优于几何特征法。隐马尔可夫模的人脸识别方法隐马尔科夫模型 (Hidden Markov Model,HMM)是用于描述信号统计特性的一组统计模型。HMM使用马尔科夫链模拟信号统计特性的变化,然而这种变化是间接地通过观察序列来描述完成的,因此说隐马尔科夫过程是一个双重的随机过程。 在HMM中,用节点来表示状态,有向边来表示状态之间的转移,一个状态可以具有特征空间中的任意特征。对于同一特征,不同状态表现出来的这一特征的概率不同。HMM有三个主要问题:评估、估计及解码。评估用于解决识别问题,通常采取比较有效的“向前-向后”法,用来产生用于识别的各个单元的HMM,采取 Baum Welch方法。Samaria是最早提出人脸的HMM模型,他将人脸的五个显著的特征区域:头发、额头、眼睛、鼻子和嘴巴,看作5个不同的状态,它们的秩序依次是从上到下保持不变。这五个状态是抽象的,不具有具体的意义,只得通过观察序列对它进行估计。基于HMM的人脸识别方法具有以下优点:第一,能够允许人脸有表情变化,较大的头部转动;第二,其扩容性好.即增加新样本不需要对所有的样本进行训练。缺点是实现的复杂程度较高。基于神经网络的方法由于人工神经网络(Art1ficial Neural Network,ANN)对复杂模式具有良好的分类能力,使得这种方法在人脸识别中得到了广泛的应用。如今,在人工神经网络的实际应用中,大部分的神经网络模型均采用BP网络及其变化形式,因为它是人工神经网络最精华的部分。BP网络主要用于函数逼近、模式识别、数据压缩等领域。当人们在进行模式采集时,总尽可能的采集测量数据的多个特征值,但是这样最终导致样本维数很大,处理上非常麻烦,处理的时间的消耗也会很大,甚至形成所谓“维数灾难”。其次,在过多的数据中,有的数据对刻画事物的本质贡献非常微小。这就需要有一个样本空间到特征空间的转化,通常在满足识别度要求的前提下,尽量减少处理数据的冗余度,做到处理数据的各个特征之间互不相关。此时,输出层的节点数就是要分成的类别数,即模式空间的维数。因而人们常会把主成成份方法和神经网络方法一起结合使用。首先用主成成份分析方法对图像进行特征提取,然后利用这些特征向量和相应的信号训练BP网。首先利用三层的BP网络来进行人脸的特征提取。BP网的输入神经元和输出神经元相同,隐含层的输出作为特征。然后对网络进行训练,使得其输出逼近输入。最后提取的特征再通过一个神经网络进行分类。最简单的神经网络实现方法是将不同表情或姿态的人脸图像作为输入样本,然后用标准的正面人脸图像作为输出。Lin和Kung提出了一种基于概率决策的神经网络来用于人脸识别。这种神经网络在决策神经网络的基础上加入了概率的变化,采用虚拟样本进行强化和反强化学习,最终得到了较为理想的概率估计结果,同时采用模块化的网络结构加快了网络的学习。这种方法在人脸检测、人脸定位和人脸识别的各个步骤上都得到了较好的应。弹性图匹配方法   基于动态链接结构(Dynamic Link Architecture ,DLA)的方法识别人脸。它将人脸用格状的稀疏图,如图2.1所示。图2.1 人脸识别的弹性匹配方法将人脸特征上的一些点作为基准点,构成弹性图。采用每个基准点存储一串具有代表性的特征矢量,从而减少了系统的存储量。在进行匹配时,首先寻找与输入图像最相似的模型图,然后再对图中的每个细节位置进行最佳匹配,这样产生一个变形图,其节点逼近模型图的对应点的位置。图2.1中的节点用图像位置的Gabor小波分解得到的特征向量标记,图的边用连接节点的距离向量标。小波特征分析是一种时频分析,若空间一点周围区域的不同频率响应构成该点的特征串,那么它的高频部分是对应了小范围内的细节,低频部分则对应了该点周围较大范围的概貌。所以采用小波变化特征的弹性图匹配方法,是既考虑人脸细节特征,又保留了人脸的空间分布的整体信息,而且它的可变形匹配方式在一定程度上能够承受人脸从三维到二维投影引起的变形。此外,Gabor小波与人眼视网膜对图像的响应具有相似的形状,同时对图像亮度具有鲁棒性,通过对jet的归一化处理,也能消除图像对比度的影响。这种方法主要的缺点是对每个存储的人脸都需要计算其模型图,而计算量和存储量都很大。Wiskott在原有方法的基础上提出了聚束图匹配法,从而克服了部分的计算量大和存储量大的缺点。Nastar提出了基于特征的弹性图匹配人脸识别算法,包括两个步骤:首先利用Gabor进行人脸特征的检测从而提取出一组Gabor小波系数矢量,然后在代价函数的约束下,对每个特征都进行弹性图的匹配,并使总体代价函数尽可能的小,最后得到联合识别结果。基于三维模型的方法这类方法通常先在图像上检测出与通用模型顶点对应的特征点,然后根据特征点调节通用模型,最后通过纹理映射从而得到特定的人脸3D模型。基于结构光源和立体视觉理论,通过摄像机获取立体图像,根据图像特征点之间匹配构造人脸的三维表面,如图2.2所示。利用SSFS (Symmetric Shape- from-Shading)理论来处理像人脸这类对称对象的识别问题。基于SSFS理论和一个一般的三维人脸模型来解决光照变化问题,通过基于SFS的视图合成技术解决人脸姿态问题,针对不同姿态和光照条件合成的三维人脸模型如图2.3所示。三维识别系统与已有的各种人脸识别系统的最大区别在于,数据库中记录的是三维人脸模型,它是利用物体几何拓扑的不变性原理,从而排除了大部分人脸识别干扰的影响,而且由于采用的方法与照片的明暗程度无关,所以可以解决人脸识别过程中受拍摄环境光线强度的影响,从而可以达到较理想的识别效果,因此也逐渐成为人们研究的重点。 图2.2 三维人脸表面模型      图2.3 合成的不同姿态和光照条件下三维人脸表面模型2.2人脸特征提取技术介绍2.2.1基于奇异值分解(SVD)的人脸特征提取在人脸识别问题中,对识别影响较大的是光照的不均匀性以及人脸表情的变化。对于同一个人采集的两幅不同光照或表情的图像,其识别结果存在较大的差异,这就要求我们在进行特征提取时要尽量减弱或消除光照及表情的影响。目前采用的特征提取方法如标准的PCA方法,由于不能很好地克服光照和表情的影响,使识别效果并不十分理想。因为人脸图像是一个高维向量,所以直接用其进行计算是十分困难的,为此对它进行降维过程中需要保留其主要的特征,也就是说希望用少量的图像特征来近似表示整个图像,以达到降维并且保留图像主要特征的效果,奇异值分解(SVD)方法就是一种实现这种效果的良好手段。奇异值分解定理设A为m*n阶复矩阵,则存在m阶矩阵U和n阶矩阵V,使得: A = U*S*V 其中S=diag(i,2,r),i>0 (i=1,r),r=rank(A)。 推论:设A为m*n阶实矩阵,则存在m阶正交阵U和n阶正交阵V,使得 A = U*S*V 其中S=diag(i,2,r),i>0 (i=1,r),r=rank(A)。说明: 奇异值分解非常有用,对于矩阵A(m*n),存在U(m*m),V(n*n),S(m*n),满足A = U*S*V。U和V中分别是A的奇异向量,而S是A的奇异值。AA'的正交单位特征向量组成U,特征值组成S'S,A'A的正交单位特征向量组成V,特征值(与AA'相同)组成SS'。因此,奇异值分解和特征值问题紧密联系。 奇异值分解提供了一些关于A的信息,例如非零奇异值的数目(S的阶数)和A的秩相同,一旦秩r确定,那么U的前r列构成了A的列向量空间的正交基。2.2.2 基于积分投影的人脸图像特征点的提取 图像积分投影方法积分投影法是根据图像在某些方向上的投影分布 特征来进行检测的,这种方法在本质上是一种统计方法,主要有水平投影和垂直投影:H(y)= (2.1)V(x) = (2.2)在式(2.1)中,(x,y)表示像素所处的位置,I(x,y)表示该像素灰度值,n表示一行所有的像素点数,可见水平投影就是将一行所有的像素点的灰度值进行累加后再显示。在式(2.2)中,(x,y)表示像素所处的位置,I(x,y) 表示该像素灰度值,m表示一行所有的像素点数,可见垂直投影就是将一列所有的像素点的灰度值进行累加后再显示。人脸轮廓的确定人脸的轮廓的确定是为了排除其它边缘线和噪声的干扰,从而便精确地提取人脸的特征点。假设图像的宽度和长度分别为xImage,yImage;人脸左、右侧的横坐标分别为xLeft,xRight;头顶点的纵坐标为yHead;人脸轮廓的确定可分为两步骤进行:第一步:根据水平投影确定头顶点的位置。第二步:再采用垂直投影确定人脸的左、右侧。 图像人脸特征点的提取 确定了人脸轮廓后,可以开始进行人脸特征点的提取。人脸特征点的选择不仅仅需要反映人脸识别中最重要的特征而且要容易提取。特征的个数要包含足够的信息量以更好的表达人脸,但数目又不能太多,以免增加运算量和运算时间。此方法选取人脸识别的7个特征点分别为4个脸角点、鼻尖和2个嘴角点。这些特征点的分布具有角度不变性的特点,同时,与其它采用测量特征点的系统相比,这7个特征点比较容易从图像中提取出来并加以测量。尽管人脸形状各有差异,但都符合“三停五眼”的规则。人脸轮廓确定后,也就可以大致确定出人脸各特征点的位置关系,既可由上到下区分出脸、鼻、嘴等特征的区域。在这些局部区域内再运用积分投影法,就可以精确计算出出眼、鼻、嘴的具体位置。其过程如下:计算水平投影,取其最大值,确定眼部的横坐标值 ;眼部以下,选定两个最大的水平投影值,分别为鼻部和嘴部;计算垂直投影,在上一步检测出的眼部附近的最大值为眼部的z位置;双眼之间的投影最大值为鼻(嘴)位置。经过以上步骤处理可以精确定位人脸的主要特征点。2.2.3 基于KDDCT特征提取 DCT是一种常用的图像数据压缩方法,它具有很好的能量集中特性,变换后的图像能量主要集中在变换 系数的低频分量上,这些低频分量幅值较大,可以用来重建图像。当用DCT系数重建图像时,需要保留少数离散余弦变换的低频分量,而舍去大部分高频分量,利用逆变换仍可获得与原始图像相近的重建图像,新图像与原图像存在一定误差,但重要信息被保存下来。图2.4为人脸图像的DCT以及利用DCT系数重建原始图像的示意图,其中图1a和图1b是ORL人脸库中同一人的不同表情的两张脸像,像素均大小为92×l12,图1c是对子图进行二维DCT,然后对DCT系数取对数后的输出图像,从图中可以看出该图像左上角像素值较大,图像信号的能量主要集中在该区域,根据DCT的这一特点,可以采用如图1d所示的Zig-Zag扫描方式,将DCT系数由二维矩阵变成一维DCT系数矢量z,然后将z中各个分量所包含的能量由大到小的顺序排列。因此,可以选出用矢量z中能量较大的低频分量来重建原始图像。图1e、图1f是用45个DCT 系数分别对子图1a和图1b进行逆变换重建脸像,图1g、图1h是用120个DCT系数分别对图1a和图1b进行逆 变换重建脸像。图2.4从图2.4中可以看出:(1)重建的人脸图像保留了大部分的面部特征(包括眼、耳、鼻、嘴等),与全部10304 个灰度值相比,只需要几十个或几百个DCT系数就可以很好的表征原始图像,这使得数据量庞大的人脸图像可用它的部分离散余弦变换分量来表示,从而实现了对高维信息的降维;(2)DCT低频分量重建图像对人脸表情变化不敏感(几乎看不出子图1e和图1f以及图1g和图1h之间的表情差别

    注意事项

    本文(人脸识别方法实现研究毕业设计论文.doc)为本站会员(文库蛋蛋多)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开