电子信息工程毕业论文基于复杂光照变化无关特征的稠密立体匹配技术研究.doc
《电子信息工程毕业论文基于复杂光照变化无关特征的稠密立体匹配技术研究.doc》由会员分享,可在线阅读,更多相关《电子信息工程毕业论文基于复杂光照变化无关特征的稠密立体匹配技术研究.doc(35页珍藏版)》请在三一办公上搜索。
1、南京邮电大学毕 业 设 计(论 文)题 目:基于复杂光照变化无关特征的 稠密立体匹配技术研究 专 业: 电子信息工程 学生姓名: 班级学号: B07020822 指导教师: 指导单位: 通信与信息工程学院 日期: 2011年 3 月5 日 至 2011年 6月8日摘 要立体匹配一直是计算机视觉研究领域中的热点和难点,是双目立体视觉中的关键技术之一。为了快速实现双目立体匹配同时减少光照变化对图像的影响,实现了一种基于OSID描述子的快速稠密立体匹配算法。首先,基于图像特征快速构造每一像素点为中心的区域的特征OSID描述子,并测度水平极线上OSID的不相似性得到初始匹配成本;其次,依次在水平、垂直
2、双方向上采用测地线的自适应成本聚合策略,消除匹配特征的相似歧义,计算鲁棒匹配代价;最后,采用优胜者全选方法逐像素选取视差范围内的最优视差值。实验结果表明,该算法结构简单,计算快速高效,能够有效的提高匹配精度,得到分段光滑、精度高的稠密视差图。关键词:双目立体匹配;OSID描述子;测地线距离;不相似测度;视差值ABSTACTStereo matching is a long active topic and difficult problem in computer vision, and is a crucial technique in binocular stereo vision. An
3、 algorithm based on OSID descriptor is implemented in a fast and local perspective to resolve stereo matching and reduce the influence of the image because of the change of light. Firstly, we construct region feature OSID descriptor based on local image feature, and compute initial matching cost by
4、measuring the dissimilarity of OSID in the horizontal scaneline. Secondly, geodesic support weights are adopted in the horizontal and vertical directions which eliminate ambiguity in feature matching. Lastly, the given disparity values are optimized by the strategy of Winner Takes All optimization w
5、ithin the range of disparity. The experimental results indicate that this algorithm is concise, fast and efficient. This technique can improve the matching accuracy and obtain piecewise smooth, accurate and dense disparity map effectively. Key words: Binocular stereo matching; OSID descriptor; geode
6、sic distance; dissimilarity measure ; disparity value目录第一章 绪论11.1 立体视觉系统11.2 立体视觉研究历史和研究现状21.2.1 摄像机建模31.2.2 特征提取41.2.3 图像匹配41.3 双目立体匹配与三维重建51.4光照条件对图像的影响51.5本文主要研究内容与组织结构6第二章 稠密立体匹配的基本理论72.1 视差场与深度图72.2 稠密匹配的基本假设82.3 稠密立体匹配方法8第三章 基于序空间强度分布的特征描述构造103.1 序空间强度分布概述103.2 OSID局部特征描述符12第四章 基于区域特征的稠密快速立体匹配
7、144.1基于OSID描述子的初始匹配代价144.2 基于测地线距离的改进型自适应权重化的成本聚合144.2.1匹配窗的选取144.2.2并行双通式成本聚合154.3基于WTA的局部视差优化16第五章 实验结果与讨论175.1 实验流程图175.2 实验数据集175.3 不同聚合窗口大小下的匹配性能185.4 不同相似性测度下的匹配性能205.5光照线性变化下的图像匹配225.6 OSID描述符参数选择23第六章 总结与展望256.1算法总结256.2发展趋势25结束语27致 谢28参考文献29第一章 绪论视觉是人类观察世界、认知世界的重要手段,人类从外界获得的信息约有75%来自视觉系统。一般
8、认为,人类的视觉过程是一个从感觉到知觉的复杂过程。视觉的最终目的从狭义的观点来说是要对场景作出对观察者有意义的解释和描述,而从广义的观点来看则是在上述解释和描述的基础上依据观察者的意愿进一步做出相应的行为规划或决策。随着视觉神经生理学,视觉心理学,特别是计算机技术、数字图像处理、计算机图形学、人工智能等学科的发展,使利用计算机模拟人类视觉成为可能。视觉的研究源远流长,而从工程的角度研究视觉问题则起始于上世纪60年代。在当时的人工智能学科带头专家的眼里,使计算机具有视觉功能是一件很容易的事;其中的一些科学家甚至宣称,到上世纪八十年代即可实现接近于人类水平的视觉系统。然而,事与愿违时至今日这项任务
9、仍然没有很好的被解决并且似乎还很艰难。但可喜的是,被称为计算机视觉的研究领域在此期间获得了长足的发展。目前,它已成为一门与数学和计算机科学都有很强联系的学科。计算机视觉是指用计算机实现人的视觉功能对客观世界的三维场景的感知、识别和理解,由于客观世界在空间上是三维的,所以计算机视觉的研究和应用从根本上来说也应该是三维的。由于这个原因,立体视觉成了计算机视觉领域的一个研究重点和热点。计算机立体视觉研究的对象是利用二维投影图像恢复三维景物,使用的理论方法主要是基于几何、概率、运动学计算与三维重构的计算机视觉理论,它的基础包括射影几何学、刚体运动力学、概率论与随机过程、图像处理、人工智能等理论。从影像
10、中提取场景的二维结构是计算机视觉几十年来一直在研究的问题,这方面的研究成果使计算机视觉的应用领域不断拓展。同时,应用需求对计算机三维视觉提出了进一步要求,这种相互推动作用使得计算机三维视觉研究不断取得进步。本章首先简要介绍立体视觉的研究背景、研究现状,然后介绍本文主要研究内容和论文组织结构。1.1 立体视觉系统一般情况下,人在观察现实世界中某一物体的时候,每只眼睛的视网膜上会各自形成同一个物体的不完全相同的影像。左眼看到物体的左边会多一些,右眼看到物体的右边会多一些。进一步说,物体上的同一个点落在左右两眼视网膜上的位置一般也是不同的,这种位置差称为双眼视差。人之所以有深度感知的能力,就是因为可
11、以感知这种差别。因此,如何获取所观测场景的的视差信息构成了双目立体视视觉研究的主要内容。20世纪80年代初,Bornard等归纳和剖析已有立体视觉方法,认为立体视觉方法通常执行图像获取(image acquisition)、摄像机建模(camera modeling),特征提取(feature acquisition)、图像匹配(image matching)、深度确定(depth-determination)和内插(interpolation)等六个步骤,这一思想对后续研究产生很大影响。 图1.1 双目立体视觉示意图如图1.1所示,左右摄像机获取场景的图像,摄像机建模步骤即建立摄像机几何模型
12、,通常就是确定摄像机的内外部参数,因此又称摄像机标定,摄像机模型实际上确定由视点A发射到像素A的射线的空间方位。特征提取则从图像中检测出显著特征,如nl和nr,显著特征包含丰富的纹理信息,为特征点的可靠匹配奠定基础。图像匹配步骤建立左图像中特征点和右图像中特征点之间的对应关系,如场景点A在左右图像中投影点nl和nr的对应关系。深度确定步骤根据建立起来的对应特征点nl和nr以及摄像机模型重建场景模型。内插步骤则根据重建的稀疏场景点内插生成更加稠密或精确的场景点。1.2 立体视觉研究历史和研究现状立体视觉的开创性工作是从60年代中期开始的。美国MIT的Roberts完成的三维景物分析作,把二维图像
13、分析推广到三维,这标志着立体视觉技术的诞生,并在随后的20多年中迅速发展成为一门新兴学科。特别是Marr创立的视觉计算理论对立体视觉的发展产生了巨大的影响,现已形成从图像获取到最终的景物可视表面重建的完整体系。经过20多年的研究,立体视觉在机器人、航空测绘、军事应用、医学诊断及工业检测中的应用越来越广泛,研究方法从早期的以经典的基于相关窗的局部匹配算法,发展到利用图割(Graph-cut)、置信传播(Belief-propagation)等全局优化算法的全局匹配算法1,从串行计算到并行计算,从直接依赖于输入信号的底层处理到依赖特征、结构、关系和知识的高层次处理,性能不断提高,其理沦也正处在不断
14、发展与完善之中。 在立体视觉的六大步骤中,摄像机建模和深度确定属于多视图几何关系问题,目前已经有比较完善的理论解决,特征提取一定程度上服务于图像匹配,而内插是对重建结果的进一步完善,所以在这些步骤中图像匹配是关键步骤,其结果的好坏直接决定立体视觉系统的重建质量。由于本论文的着眼点在于匹配算法研究,所以在此围绕立体匹配回顾一些主流的匹配算法。1.2.1 摄像机建模传统立体视觉研究者认为只有在摄像机预先标定的基础上才能进行匹配计算和三维重建,因此对每个摄像机都需要先用己知几何的物体的图像进行标定。在上世纪80-90年代,研究者从射影几何和射影测量学出发,以向量代数等数学工具为手段,对投影、重建以及
15、多视图之间的几何关系问题进行了研究,提出了三维重建的层次方法,将重建分成射影重建、仿射重建和度量重建三个层次。分层重建的方法采用适宜的几何表达使计算的每一阶段所需要的参数更加明晰,从而避免了计算那些对最终结果没有影响的参数,并得到更简单的算法。分层重建首先用未标定的摄像机拍摄图像对,根据图像间的匹配计算能够表征摄像机之间几何关系的特征矩阵,再利用这些特征矩阵恢复射影重建,借助场景的先验几何信息实现仿射重建直至度量重建,这是三维重建的非标定法。因为两视几何是N视图几何的特例和基础,所以人们深入研究了两视几何关系。图1.2 对极几何示意图如图1.2所示,给定左右两个视点O和O的视图及左视图中的一个
16、像点P由左视点和像点P确定的空间直线在右视图中的投影直线l称为P的极线,则P在右视图中的对应点P必位于极线l上。任意视图中任意像点在另一个视图中都有一条极线与之对应,这种关系称为极线几何,是两个视图之间的重要几何关系。与之相对应的特征矩阵被称为基本矩阵,通常用符号F来表示。极线几何对立体匹配有着重要影响,它将匹配对应点的位置限定在一维极线上,是很强的几何约束。一方面,在特征匹配中,人们可以利用极线约束剔除匹配过程中的错误对应点,结合鲁棒估计方法提高对错误对应点的抵抗能力。另一方面,在稠密匹配中,人们也可以利用极线几何约束首先校正立体图像,使得图像间匹配点保持在同一扫描行上,从而使对应点的搜索从
17、二维空间降为一维空间,大大简化对应点搜索,并且提高匹配可靠性。本文算法正是基于极线几何约束校正的立体图像。未标定情况下的三维重建方法在不需要高精度重建的情况下特别有用,比如虚拟现实、视频会议等,在这些场合主要考虑的是视觉效果。而传统的摄像机标定过程繁琐,并且参数不容易保持固定。但未标定方法的结果可能由于场景结构等问题造成结果不够鲁棒,并且在一般情况下重建的精度不高,使得传统的摄像机标定方法目前仍然是高精度二维重建中非常有效的手段。1.2.2 特征提取特征提取一直以来是计算机视觉领域的特别活跃的研究课题,快速鲁棒的特征提取方法是很多计算机视觉应用场合的需求。在立体匹配中,常用的特征包括顶点、直线
18、、边界、区域等等,研究者也依据这些特征提出了大量方法。最近几年,基于局部不变量(Local Invariant)构造方法检测和描述图像特征越来越引起研究者的兴趣,使得这一特征提取方法逐渐成为基于特征匹配技术中的主流。一般来说,基于局部不变量的特征提取分成特征检测和特征描述两部分。首先提取图像中的“感兴趣点(Interest points)”,确定特征点的支持区域,并计算图像特征点的局部不变描述向量,通过比较特征描述向量进行匹配。这种方法具有良好的区分性,能在一定很大程度上抵抗诸如遮挡、亮度、尺度等因素影响,不随图像变换而变化,具有缩放不变、仿射不变或者亮度不变等性质,典型算法包括SIFT、SU
19、RF等算法。Mikolajczyk和Schmid对这类方法作了比较全面的比较和评估。1.2.3 图像匹配匹配问题是立体视觉中最为重要的问题,可以说正确的匹配是获得场景正确深度信息和分割理解的基础所在。传统上根据匹配对象的差异可以将立体匹配方法分为特征匹配和稠密匹配两类。特征匹配旨在建立稀疏图像特征之间的对应关系。一方面,稀疏特征的不规则分布给特征之间相互关系的描述带来困难,不利于匹配过程中充分利用此类信息。另一方面,稀疏特征的不规则分布给三维场景的描述带来困难,往往需要进行后处理以确切描述三维场景。后处理通常取稀疏特征为数据点,采用内插方法建立稠密对应场,或者采用拟合方法确定一些先验几何模型的
20、自由参数,实现几何模型的重建。内插和拟合方法以稀疏特征为数据,结果直接依赖于稀疏特征对应,不可靠的特征对应往往会产生不理想的结果。1.3 双目立体匹配与三维重建双目立体匹配一直是三维场景结构信息获取的研究热点之一,其基本原理是从两个视点观察同一景物以获取立体像对,匹配出相应像点,从而计算出视差并获得三维信息。特别是20世纪80年代,美国麻省理工学院的M arr提出了一种视觉计算理论并应用在双目匹配上,使两张有视差的平面图产生具有深度的立体图形,从而奠定了双目立体视觉发展的理论基础。三维重建,即从二维图像恢复三维物体可见表面的几何结构的过程,一直是计算机视觉的重要研究内容。近年来,随着三维重建在
21、数字地球、数字考古、数字娱乐等领域应用的不断发展,物体表面结构的视觉效果己成为三维重建越来越关注的一个问题。然而,图像对应点的自动匹配这一问题并没有得到很好的解决,严重制约着三维重建技术的有效利用。目前比较流行的匹配算法主要是基于特征点2,如基于Harris角点,SIFT (Scale-invariant feature transform),MSER (Maximally stable extreme regions),Hessian-Affine等的匹配方法,这些方法一般只能得到比较稀疏的匹配,通过它们只能恢复出三维空间中的稀疏点云,不能有效表达三维物体的空间形状,视觉效果差。因此,欲重建
22、出较精确的三维结构,需要得到稠密的匹配点。最典型的稠密匹配是标准的稠密立体匹配。1.4光照条件对图像的影响众所周知,光的存在是目标成像的必备条件,现有的以光学为基础的成像设备,成像的质量无不受到光照条件的影响。光源的方向,阴暗程度,色彩强度,以及亮度都会对图像产生影响。因此,在图像内容的分析为基础诸多研究和应用中,例如目标跟踪、人脸识别、图像检索等,外部光照往往会改变图像中各个目标的真实信息,给目标获取带来很大困难,光照条件的改变直接影响到同一物体的表面光线反射情况,对同一场景同时成像的多个相机间也存在感光性能差异,导致成像结果存在亮度变化,从而给图像匹配带来困难。所以尽量克服光照对图像带来的
23、影响一直是以图像为研究对象的众多科研和应用工作中不可缺少的部分。在现实世界的应用或方案中,复杂的亮度变化是常见的。同样的物理点可能有不同的像素点,由于光源的属性和位置的变化(相对于物体),以及光源的几何形状和观看视角的变化。当一个物体移进或移出一个阴暗处时帧之间的亮度可能会突然改变。此外,捕获的参数的变化,如增益和曝光时间,处理成像的像素管线的强度的非线性过程中可能会导致亮度要经过复杂的非线性变化。例如,在一个简单的场景,相机在自动曝光是可能会突然降低曝光时间,沿运动轨迹的像素的强度,在校正之后运动轨迹会处于非线性和空间变化的模式。(即Iout = k Iin0.45 Iin,Iout 校正之
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 电子信息工程 毕业论文 基于 复杂 光照 变化 无关 特征 稠密 立体 匹配 技术研究
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-3988903.html