人眼定位的算法数字图像毕业论文.doc
《人眼定位的算法数字图像毕业论文.doc》由会员分享,可在线阅读,更多相关《人眼定位的算法数字图像毕业论文.doc(39页珍藏版)》请在三一办公上搜索。
1、摘 要人脸识别因为在驾驶员疲劳驾驶、视频会议、医学、档案管理、系统公安(罪犯识别等)等方面的巨大应用前景越来越成为模式识别和人工智能领域的一个研究热点,其中,由于眼睛与人脸部的其他部位相比,其灰度变化特征十分明显,因此,人眼定位研究算法对于人脸识别系统有着非常重要的意义和影响。在常规的光线下,人眼区域在人脸区域中有两个显著地特征,一个是较周围的区域暗,另一个是灰度差值较大,因此,本文使用了一种通过灰度积分和微分投影的眼睛定位方法,其前提是在人脸区域中进行人眼定位,可用于疲劳驾驶检测中的人眼快速定位。在从人脸区域中去除容易被分隔出的,又影响人眼定位的干扰信息的基础上,利用水平和垂直灰度微积分投影
2、的方法并结合人脸的结构特征得到眼睛的位置坐标。该算法利用Visual C+编写程序,运算时间较短,结合简单有效的灰度投影分析,大大提高了定位的速度,并且定位较准确。关键词:水平和垂直灰度微积分投影;灰度投影; 人眼定位AbstractFace recognition for the pilot fatigue driving,video conference, medicine, human-computer interaction, file management, public security system (criminal identification and application
3、 prospect of the huge more and more become pattern recognition and the field of artificial intelligence of a research focus, among them, because the eye to the other parts of the face compared with the gray features very obvious, therefore, eye location algorithm research for face recognition system
4、 has a very important significance and influence. In conventional light, the human eye area in the face region are two significantly feature, a is the area surrounding the dark, the other is a gray level difference is bigger, therefore, this paper uses a through the gray integral and differential pr
5、ojection eyes positioning method, the premise is the face region in the eye location, can be used for the detection of the human eye fatigue driving fast positioning. From the face region in the removal of the easy to space goes out, and influence the interference of eye location information, and on
6、 the basis of using the horizontal and vertical gray calculus projection method and combining with the features of the structure of face the position of the eyes get coordinates. The algorithm using Visual C+ program, operation time is short, the combined with simple and effective gray-level project
7、ion analysis, greatly improving the positioning of the speed, and locating the more accurate.Key word:shorizontal and vertical gray calculus projection; eye location; gray integral and differential projection目 录绪 论10.1 课题背景及意义10.2 国内外研究现状及发展20.2.1 国外研究现状20.2.2 国内研究现状20.3 开发平台简介30.3.1 Microsoft Visua
8、l C+开发平台30.3.2 Windows 操作系统40.4 性能要求5第一章 数字图像基础61.1图像处理常用方法61.2 数字图像处理及其特点61.3数字图像处理的目的和主要内容71.3.1 数字图像处理的目的71.3.2 数字图像处理的主要内容71.4数字图像处理的应用工具81.5 数字图像处理的应用领域91.6 数字图像文件的基本类型101.7图像文件的一般结构111.8常用的空间模型121.9 数字图像处理常用方法131.9.1 空域处理法131.9.2频域处理法14第二章 人眼定位的常用算法研究152.1 人眼定位的常用算法研究152.2 基于红眼效应的算法152.3 区域分割法
9、152.4 Hough变换法152.5 基于知识的人眼定位法162.6灰度投影法162.7模版匹配法172.8边缘特征分析法17第三章 基于灰度投影的人眼定位算法183.1 基于灰度投影的人眼定位算法183.2 读取BMP图像文件183.3 RGB图像灰度化193.4 灰度图像的投影2134.1 灰度积分投影2134.2 灰度微分投影23第四章 功能分析及实现264.1 功能简介264.2功能介绍及分析264.2.1 人眼区域范围定位264.2.2 人眼水平位置定位274.2.3 人眼水平区域定位294.2.4 人眼垂直位置定位294.3结果展示304.4 存在的缺陷及结果分析30总结与展望3
10、2致 谢33参考文献34绪 论0.1 课题背景及意义计算机自动人脸识别技术的研究开始于20世纪60年代,它作为一种重要的基于生物特征识别的身份识别技术,在图像与视频检索,安全监控,计算机视觉,智能人机接口,安全系统的身份认证等领域中应用越来越广泛,近年来越来越引起图像处理,模式识别等领域方的研究学者的广泛关注。 人眼作为人脸最显著地特征,比口,鼻更能提供可靠,重要的信息,因此,人眼的识别是计算机中人脸识别和智能监控中不可缺少的重要部分。在过去的几十年中,对人眼检测和定位方法的研究取得了很大进展。其中,使用红外光照明的主动监测方法在驾驶员疲劳监测系统中得到了广泛应用。该方法充分利用人眼的基本生理
11、特点,即视网膜对不同波长的红外光能够反射量的不同时所得的图像中突出显示瞳孔的位置,用于定位跟晴。该方法的优点在于它的准确性和鲁棒性较好,但是它需要特殊的带有红外光源摄像机的硬件支持,对头部的深度旋转、人脸与摄像头的距离和外部光照相当敏感,在户外环境下误检率会增加。对于在可见光和正常照明条件下得到的彩色图像和灰度图像中人眼的检测和定位技术的研究也吸引了大量研究者的注意。眼睛作为人面部上最显著、最稳定的特征, 可以被用于帮助定位人脸, 提供人的注视信息, 识别人脸动作(如表情变化)等疲劳驾驶是造成交通事故的主要原因之一。由于超长时间驾驶、夜间驾驶,或缺少睡眠等原因,驾驶员在驾驶时会出现疲劳或困倦状
12、态。对驾驶员疲劳程度检测的研究,属于智能交通领域,是智能辅助驾驶的一项关键技术。驾驶员在车辆行驶过程中是否疲劳驾驶可以从眼睛的状态反映出来, 利用驾驶员眼睛的状态信息来判断其疲劳状况是一种可行的方法。在车辆上安装驾驶员疲劳监测系统, 利用摄像头对驾驶员的驾驶行为进行监控, 获取驾驶员脸部的一段连续图像, 对每幅图像中的眼睛状态进行分析, 综合每幅图像的数据来获得一个眨眼周期。由于正常的眨眼频率与疲劳状态的眨眼频率有着明显的区别, 从而可以判断出该图像序列获取时驾驶员的精神状态, 在判断驾驶员疲劳时由系统适时地给出警告信号以避免事故发生。因此, 准确、快速获得每幅图像中眼睛的精确位置, 是实现驾
13、驶员疲劳状态监控的关键。作为眼睛定位的另外一个重要应用是人脸识别和身份认证, 人脸识别在司法验证、安全监控、智能卡、档案管理、视频会议、人机交互等方面有着广泛的应用,而身份认证是根据个人独有的生理特征和行为特征进行验证。因为有些特征(如DNA、虹膜)具有高度准确的优点,是不可能被伪造的。0.2 国内外研究现状及发展0.2.1 国外研究现状人眼定位作为驾驶员疲劳监测技术的重要组成,受到国外众多研究学者的高度重视,提出来一系列算法并开发出一系列产品。1.Bala等人提出了一种基于遗传算法和决策树的眼睛定位方法,该方法用一种混合遗传结构使基本视觉规则不断进化,最终得到可用于眼睛定位的决策树形式的视觉
14、规则。2.Wu和Zhou提出了一种基于灰度对比的眼睛定位方法,该方法利用眼睛区域的灰度较大这一特点找出眼睛的位置。3.由Seeing Machines公司(澳大利亚国立大学与沃尔沃公司)研发的faceLAB通过监测驾驶员眼睛的眨动频率、凝视方向等特征参量,进行多特征信息融合,实现对驾驶员精神状态的实时监测。系统采用了与PERCLOS不同的眼睛睁闭和注视方向检测方法,解决了暗光照、头部运动和驾驶员佩戴眼镜时的视线方法跟踪问题。4.Reinders等人提出了一种基于神经网络的眼睛定位方法,该方法将搜索窗口的像素作为神经网络的输入,如果该窗口包含眼睛图像,则神经网络的输出较大。但是,上述方法只能给出
15、人眼的大致位置,并不能获得精确定位眼睛的中心。为了获得效果更佳的人脸标准化图像,有必要研究瞳孔精确定位的方法。5.文献中的ASV2系统监测驾驶员疲劳状态的摄像机安装在方向盘前方,通过红外照明的摄像机监视眼睛的状态,在驾驶员出现疲劳状态时,通过声音和文字显示等方法提示驾驶员。6.文献中Paul Smith将监测驾驶员疲劳状态与检测其注意力是否集中结合。用单个摄像机在白天光照条件下检测驾驶员眨眼、头部运动状态、眼睛凝视方向等,作为检测驾驶员疲劳状态或注意力不集中的线索。0.2.2 国内研究现状国内展开工作相较于国外对此领域的研究起步比较晚,目前还很缺乏深入系统的研究成果,但某些单因素特征方面的研究
16、进步较快,目前取得了一些阶段性的研究成果。1. Head Position Sensor 即一种头戴式摄像机,能够实时跟踪头部是我位置,同时利用各个时间段头部位置各器官的变化特征,包括眼睛的开合,表现出司机处于清醒还是瞌睡状态,该方法使眼睛区域容易从图像中分割出来,但由于接触式,侵入式的缺点而使其应用受到限制。2.文献研究的单目视觉疲劳自动检测系统检测人脸,然后对头部进行跟踪,在可靠人脸的基础上,定位并且跟踪眼睛,提取眼角与眼睑特征,具有确定的可靠性与准确性,但系统对光照的适应能力较差。3.有一种基于灰度积分投影的人眼快速定位方法,首先利用图像的垂直灰度投影曲线确定人脸左右边界,然后利用水平灰
17、度投影曲线确定人眼位置,最后利用阈值分割及边缘检测进行人眼开闭情况检测,但对头部倾斜度打,测光过强,头部在图像中所占区域小的情况,定位错误率较高。4. 文献中将Kalman滤波和MeanShift算法结合用于眼睛的跟踪,研究了基于肤色模型和级联增强分类器法以及基于几何特征和级联增强分类器法的两种人眼检测方法,然后使用模版匹配判断人眼的闭合状态。但由于考虑的因素过多,势必处理速度就会相应地降低,同时各种因素之间互相干扰,影响定位的准确度本文使用的的是一种基于灰度投影的人眼快速定位方法,该方法在人脸粗定位的基础上进行,灰度投影法是对人脸图像水平和垂直方向的投影,根据波峰波谷的分布信息来定位眼睛。0
18、.3 开发平台简介0.3.1 Microsoft Visual C+开发平台Microsoft Visual C+,(简称Visual C+、MSVC、VC+或VC)微软公司的C+开发工具,具有集成开发环境,可提供编辑C语言,C+以及C+/CLI等编程语言。VC+整合了便利的除错工具,特别是整合了微软视窗程式设计(Windows API)、三维动画DirectX API,Microsoft .NET框架。目前最新的版本是Microsoft Visual C+ 2010。Microsoft Visual C+是Microsoft公司推出的开发Win32环境程序,面向对象的可视化集成编程系统。它不
19、但具有程序框架自动生成、灵活方便的类管理、代码编写和界面设计集成交互操作、可开发多种程序等优点,而且通过简单的设置就可使其生成的程序框架支持数据库接口、OLE2、WinSock网络、3D控制界面。它以拥有“语法高亮”,IntelliSense(自动编译功能)以及高级除错功能而著称。比如,它允许用户进行远程调试,单步执行等。还有允许用户在调试期间重新编译被修改的代码,而不必重新启动正在调试的程序。其编译及建置系统以预编译头文件、最小重建功能及累加连结著称。这些特征明显缩短程式编辑、编译及连结的时间花费,在大型软件计划上尤其显著。Visual C+最初叫做Microsoft C/C+。Visual
20、 C+ 被整合在 Visual Studio 之中,但仍可单独安装使用。目前有四种最新版本:Visual Studio 2010 Professional 是供开发人员执行基本开发任务的重要工具。可简化在各种平台(包括 SharePoint 和云)上创建、调试和开发应用程序的过程。Visual Studio 2010 Professional 自带对测试驱动开发的集成支持以及调试工具,以帮助确保提供高质量的解决方案。 Visual Studio 2010 Premium 是一个功能全面的工具集,可为个人或团队简化应用程序开发过程,支持交付可扩展的高质量应用程序。无论是编写代码、构建数据库、测试
21、还是调试,您都可以使用能够按照你的方式工作的强大工具来提高工作效率。Visual Studio 2010 Ultimate 是一个综合性的应用程序生命周期管理工具套件,可供团队用于确保从设计到部署的整个过程都能取得较高质量的结果。无论是创建新的解决方案,还是改进现有的应用程序,Visual Studio 2010 Ultimate 都能让您针对不断增加的平台和技术(包括云和并行计算)将梦想变成现实。Visual Studio Test Professional 2010是质量保障团队的专用工具集,可简化测试规划和手动测试执行过程。Test Professional 与开发人员的 Visual
22、Studio 软件配合运行,可在整个应用程序开发生命周期内实现开发人员和测试人员之间的高效协作。以前的版本有Visual C+ 2008 Express、Visual C+ 2008 Standard 标准版、Visual C+ 2008 Professional 专业版、Visual C+ 2008 Team System 团队系统版,其中 Microsoft Visual C+ 2008 Express 可从微软网站免费下载使用,并且不限制商业使用。Visual Studio 是微软公司推出的开发环境,Visual Studio 可以用来创建 Windows 平台下的 Windows 应用
23、程序和网络应用程序,也可以用来创建网络服务、智能设备应用程序和 Office 插件。Visual Studio 是目前最流行的 Windows 平台应用程序开发环境。目前已经开发到 11 beta 版本,也就是 Visual Studio 2011 beta,但是最新的稳定版本依然是Visual Studio 2010。Visual Studio 2008 包括各种增强功能,例如可视化设计器(使用 .NET Framework 3.5 加速开发)、对 Web 开发工具的大量改进,以及能够加速开发和处理所有类型数据的语言增强功能。Visual Studio 2008 为开发人员提供了所有相关的工
24、具和框架支持,帮助创建引人注目的、令人印象深刻并支持 AJAX 的 Web 应用程序。开发人员能够利用这些丰富的客户端和服务器端框架轻松构建以客户为中心的 Web 应用程序,这些应用程序可以集成任何后端数据提供程序、在任何当前浏览器内运行并完全访问 ASP NET 应用程序服务和 Microsoft 平台。0.3.2 Windows 操作系统Microsoft开发的Windows是目前世界上用户最多、且兼容性最强的操作系统。其实已在1985年就推出了Windows操作系统。改进了微软以往的命令、代码系统Microsoft Dos。Microsoft Windows是彩色界面的操作系统。支持键鼠
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人眼定位的算法 数字图像毕业论文 定位 算法 数字图像 毕业论文
链接地址:https://www.31ppt.com/p-3934592.html