本科毕业论文图像识别系统的设计.doc
摘 要随着计算机软硬件技术的高速发展,计算机数字图像处理技术在各个领域得到了广泛的应用,如计算机图像识别、图像检索、图像工业化应用等。尤其是计算机识别技术,通过数字图像处理中的模式识别技术,可以将人眼无法识别的图像进行分类处理,可以快速准确的检索、匹配和识别出各种东西。虽然某些处理也可以用光学方法或模拟技术实现,但它们远不及数字图像处理那样灵活和方便,因而数字图像处理成为图像处理的主要方面。图形辨别是图像识别技术的一个重要分支,图形辨别指通过对图形的图像采用特定算法,从而辨别该图形,例如,辨别三角形、矩形、圆形、六边形等。本系统使用摄像头对图像进行采集图像,摄像头距采集图像在0.20.3m范围内为最佳,对采集图像进行图像分割,得到二值化图像,然后通过轮廓跟踪获得图形轮廓信息,最后使用基于轮廓跟踪的图像辨别算法在空域上辨别三角形、矩形、圆形,并在特定的区域上显示相应信息。关键词: 图形辨别 角度判别 轮廓跟踪ABSTRACT With the rapid development of computer hardware and software technology, computer digital image processing technology have been widely applied in many fields,Such as image recognition,image retrieval,and image industrial applications.Especially computers recognition technology, by the pattern of recognition techniques,it can recognize the image classification what human eye can not recognize, it can be fast and accurate search, match and identify all sorts of things.Although some treatment methods can also use optical or analog technology, but they are nowhere near as flexible digital image processing and convenience, digital image processing, and thus digital image processing become the main aspects of image processing. Graphic distinguish is an important branch of image recognition,graphic distinguish means graphic images by using a specific algorithm,to identify the graphics,for example, identify the triangle, rectangle, round, hexagon and so on. The system uses the image capture camera images from the cameras capture images, and the camerra to the in the image in range of the 0.2 0.3m is best.Then Process the collected image, get the binary image, and then contour tracking access to graphics, the outlines of the final image-based contour tracking algorithm to identify the airspace on the identification triangle, rectangle, circle, and in particular to display the corresponding region information.Key words: graphic distinguish angle judgement contour tracking 第一章 绪论 1.1 研究内容图形辨别是图像识别技术中一个重要分支,图形辨别指通过对图形的图像采用特定算法,从而辨别该图形,例如,辨别三角形、矩形、圆形、六边形等。通过对采集到的图形图像进行图像预处理和图像分割,并采用轮廓跟踪法获取图形轮廓信息,最后通过角度判别实现空域图形辨别。 图像采集,采用连接摄像设备,采集图形图像;图像预处理,采用图像平滑去除或减小图像中的噪声;图像分割,将图形部分从图像中分割出来;本选题研究的空域图形辨别算法包括模板匹配法和轮廓跟踪法,模板匹配,即通过将模板和图形匹配,根据匹配结果进行图形辨别;轮廓跟踪,即根据轮廓跟踪算法获取图形轮廓信息,通过对轮廓信息进行角度辨别实现图形辨别。其中重点研究轮廓跟踪法,主要针对三角形、矩形、圆形进行。 由于该选题的基本要求是利用C语言在MFC模块中编写相应程序,最终生成一个可执行文件,根据摄像头采取不同图像,如:三角形、矩形、圆形,然后将不同的图形在PC机上进行辨别,实现图形的分辨,最后将生成图形保存。 1.2 研究目的 数字图像处理在各个领域都有着非常重要的应用,随着数字时代的到来,视频领域的数字化也必将到来,视频图像的处理技术也将会发生日新月异的变化。 在多媒体技术的各个领域中,视频处理技术占有非常重要的地位,被广泛的应用于智能交通、汽车电子、网络多媒体通信、实时监视系统、高清晰度数字电视等诸多方面。因此,现今对该技术领域的应用研究已日趋活跃和繁荣。而这其中的图像辨别更是有着重要的应用。研究此课题,不仅可以明白VC+在图像处理中的应用,而且还可以明确图像辨别的重要应用意义。1.3 实现方案模式识别是现今使用非常广泛的图像辨别方法,基于模式识别的相关算法也很多,而且每种算法都有各自特点,要根据不同的实际图形的特点选择恰当的算法。本设计所采用的是基于图形边缘特征的角度判别得算法,此种算法是通过对图形轮廓进行跟踪、提取边缘的特征,判断图形角度的大小,来分辨不同图像。在系统实现过程中,研究的核心是图形辨别算法的实现,即寻找并实现一种满足系统要求的,可以分辨出三角形、矩形、圆形的图形辨别算法。实现步骤如下:(1)MFC中的操作界面和基本功能。包括:对话框程序界面,图像打开与保存,窗口控件等。 (2)VC+图像处理程序设计方面的一些算法实例。利用VC语言进行编程实现,进行视频图像的采集,图像的预处理,图像分割,轮廓跟踪,计算轮廓夹角等内容。 (3)最终生成一个可执行文件,根据摄像头采取不同图像,如:三角形、矩形、圆形,然后将不同的图形在PC机上进行辨别,实现图形的分辨,最后将生成图形保存。第二章 数字图像处理知识及系统要求2.1数字图像处理2.1.1数字图像处理介绍数字图像处理就是利用计算机对图像信息进行加工,以满足人的视觉心理或者应用需求的行为。实质上它是一段能够被计算机还原显示和输出为一幅图像的数字码。当今是一个充满信息的时代,图像作为人类感知世界的视觉基础,是人类获取信息、表达信息和传递信息的重要手段。图像处理技术的主要内容包括图像压缩,增强和复原,匹配、描述和识别3个部分。常见的处理有图像数字化、图像编码、图像增强、图像复原、图像分割和图像分析等。图像处理一般指数字图像处理,虽然某些处理也可以用光学方法或模拟技术实现,但它们远不及数字图像处理那样灵活和方便,因而数字图像处理成为图像处理的主要方面。以图片分析和理解为目的的分割、描述和识别将用于各种自动化的系统,如字符和图形识别、用机器人进行产品的装配和检验、自动军事目标识别和跟踪、指纹识别、X光照片和血样的自动处理等。在这类应用中,往往需综合应用模式识别和计算机视觉等技术,图像处理更多的是作为前置处理而出现的。随着计算机的高速发展,处理器的处理速度的提高和存储器存储容量的增大,图像处理系统的发展十分迅速,图像处理技术也得到了空前的发展和应用。目前,图像处理技术已经广泛应用于工业、农业、医学、交通、军事等各个领域。因此,可以说图像处理技术正逐渐成为其他科学技术领域中不可缺少的一项重要工具,它已经成为了信息技术相关领域的核心。 图像处理在各个方面都有着很重要的应用,而图像识别技术在基于图像处理的基础上可以应用于农业上,如用计算机视觉的方法进行果形识别;基于数学形态学和神经网络的方法对番茄病害果进行识别;采用机器视觉的方法辨别黄花梨果形识别;当然还可以加 以改进应用于视频监控的物体辨别等等。2.1.2 图像格式介绍数字化图像数据有两种存储方式:位图存储(Bitmap)和矢量存储(Vector)。我们平常是以图像分辨率(即象素点)和颜色数来描述数字图象的。1位图方式位图方式是将图像的每一个象素点转换为一个数据,比如:8个象素点的数据就占据一个字节(一个字节就是8 个二进制数,1个二进制数存放象素点)。位图方式能够制作出色彩和色调变化丰富的图像,可以逼真地表现自然界的景象,同时也可以很容易地在不同软件之间交换文件,这就是位图图像的优点;而其缺点则是它无法制作真正的3D图像,并且图像缩放和旋转时会产生失真的现象,同时文件较大,对内存和硬盘空间容量的需求也较高。2矢量图像矢量图像存储的是图像信息的轮廓部分,而不是图像的每一个象素点。该存储方式的缺点是经常耗费大量的时间做一些复杂的分析演算工作,图像的显示速度较慢;但图像缩放不会失真;图像的存储空间也要小得多。所以,矢量图比较适合存储各种图表和工程设计图。2.1.3 数字图像处理中的基本图像类型在计算机中,按照颜色和灰度的多少可以将图像分为:二值图像、灰度图像、索引图像和真彩色RGB图像四种基本类型。目前,大多数图像处理软件都支持这四种类型的图像。1二值图像一幅二值图像的二维矩阵仅由0、1两个值构成,“0”代表黑色,“1”代白色。由于每一像素(矩阵中每一元素)取值仅有0、1两种可能,所以计算机中二值图像的数据类型通常为1个二进制位。二值图像通常用于文字、线条图的扫描识别(OCR)和掩膜图像的存储。2灰度图像灰度图像矩阵元素的取值范围通常为0,255。因此其数据类型一般为8位无符号整数的,这就是人们经常提到的256灰度图像。“0”表示纯黑色,“255”表示纯白色,中间的数字从小到大表示由黑到白的过渡色。二值图像可以看成是灰度图像的一个特例。3索引图像索引图像的文件结构比较复杂,除了存放图像的二维矩阵外,还包括一个称之为颜色索引矩阵MAP的二维数组。MAP的大小由存放图像的矩阵元素值域决定, 它的每一行的三个元素分别指定该行对应颜色的红、绿、蓝单色值。索引图像一般用于存放色彩要求比较简单的图像。 4真彩色RGB图像RGB图像分别用红(R)、绿(G)、蓝(B)三原色的组合来表示每个像素的颜色。RGB图像每一个像素的颜色值(由RGB三原色表示)直接存放在图像矩阵中。RGB图像的数据类型一般为8位无符号整形,通常用于表示和存放真彩色图像,当然也可以存放灰度图像。2.1.4数字图像处理手段1图像增强图像增强的主要目的有两个:一是改善图像的视觉效果,提高图像成分的清晰度;二是使图像变得更利于计算机的处理,如锐化处理可突出图像边缘轮廓线, 编程控制计算机进行跟踪,便可作特征分析。2图像分割图像分割就是将图像分成若干有意义的区域(部分)的处理技术。在实际图像中往往存在一些具有某种均匀一致性的区域, 如灰度、纹理等分布的均匀一致性。这种一致性构成的特征向量可用于区分图像的各个区域。图像分割就是利用这些特征向量来检测区域的一致性, 从而达到将图像分割成不同区域的目的。3图像编码与压缩图像编码与压缩从本质上讲就是对要处理的图像源数据按一定的规则进行变换和组合, 从而达到以尽可能少的代码(符号)来表示尽可能多的数据信息。压缩通过编码来实现。4图像恢复和图像重建图像恢复试图利用退化现象的某种先验知识,建立退化现象的数学模型,再根据模型进行反向的演算运算,恢复原来的景物图像。与图像恢复紧密相关的是图像重建,通过一组与图像有关的物理数据建立图像的过程便是图像重建。其中图像三维重建指利用系列平面图像信息构建这些图像所代表的三维物体。5图像辨别为使人们的视觉系统认识的图像让计算机系统也能识别,必须寻找算法分析图像的特征,然后将其特征用数学的办法表示出来并教会计算机也能懂得这些特征,这样,计算机也就有了认识即识别图像的本领。则便是机器学习,或叫模式识别。图像分析工作的结果给出了某一具体的图像与其它图像相区别的特征。2.2图形识别介绍随着计算机及通信技术的发展,图像识别在科学计算可视化、自动化、生物医学、军事侦察制导、景物理解与机器人视觉、宇宙探测遥感、虚拟实现的应用越来越来广泛。如模式识别,已经在天气预报、卫星航空图片解释、工业产品检测、字符识别、语音识别、指纹识别、医学图像分析等许多方面得到了成功的应用。由于我们的大脑是通过图形本身特征信息,如:空间信息、时间信息等,它们之间的差异来辨别图形的。这种辨别能力是依靠大脑抽象能力来实现的。所以要使得图形识别符合我们大脑的认知相符合,造成图形识别的难度高,技术复杂,准确率较低,故应用的广泛性不高。这也使得此方面的研究创新机会大得多,所以近年来出现很多图形辨别算法。但是不论算法怎样改变,其本身处理的图像信息是很大的,而计算机在数据的处理能力上的优势是很明显的。所以出现许多基于计算机的图像辨别系统。如汽车牌照辨别系统、指纹辨识系统等。 图像的识别过程实际上可以看作是一个标记过程,即利用识别算法来辨别景物中已分割好的各个物体,给这些物体赋予特定的标记,它是机器视觉系统必须完成的一个任务。 按照图像识别从易到难,可分为三类问题。第一类识别问题中,图像中的像素表达了某一物体的某种特定信息。如遥感图像中的某一像素代表地面某一位置地物的一定光谱波段的反射特性,通过它即可判别出该地物的种类。第二类问题中,待识别物是有形的整体,二维图像信息已经足够识别该物体,如文字识别、某些具有稳定可视表面的三维体识别等。但这类问题不像第一类问题容易表示成特征矢量,在识别过程中,应先将待识别物体正确地从图像的背景中分割出来,再设法将建立起来的图像中物体的属性图与假定模型库的属性图之间匹配。第三类问题是由输入的二维图、要素图、2·5维图等,得出被测物体的三维表示。这里存着如何将隐含的三维信息提取出来的问题,是当今研究的热点。目前用于图像识别的方法主要分为决策理论和结构方法。决策理论方法的基础是决策函数,利用它对模式向量进行分类识别,是以定时描述(如统计纹理)为基础的;结构方法的核心是将物体分解成了模式或模式基元,而不同的物体结构有不同的基元串(或称字符串),通过对未知物体利用给定的模式基元求出编码边界,得到字符串,再根据字符串判断它的属类。这是一种依赖于符号描述被测物体之间关系的方法。所有这些应用都是和问题的性质密切不可分的。但是,至今还没有发展成统一的、有效的可应用于所有的模式识别的理论。当前的一种普遍看法是不存在对所有的模式识别问题都使用的单一模型和解决识别问题的单一技术,我们所要做的是结合具体问题把统计的和句法(结构)的识别方法结合起来,把统计模式识别或句法模式识别与人工智能中的启发式搜索结合起来,把人工神经元网络与各种以有技术以及人工智能中的专家系统,不确定方法结合起来,深入掌握各种工具的效能和应用的可能性,互相取长补短,开创模式识别应用的新局面。而伴随这种新局面是需要相应的处理设备的资源、速度等因素的提升。2.3基于计算机视觉处理图像的简单介绍近年来,图像技术受到人们广泛的关注。在人类接收的信息中有80 %来自视觉即图像( Image) 信息,这是人类最有效和最重要的信息获取、交流方式。随着计算机的普及,人们越来越多地利用计算机帮助人类获取与处理视觉(图像) 信息。图像技术就是对视觉图像获取与加工处理技术的总称。根据抽象程度和处理方法的不同,图像技术可分为三个层次:图像处理、图像分析和图像理解。这三个层次的有机结合也称为图像工程。图像处理是较低层的操作,主要在图像象素级上进行处理。比较狭义的图像处理主要包括对图像分割以改善视觉效果,或对图像压缩编码以减少传输时间或存储容量。图像分析则是进入中层的操作,分割和特征提取是把原来以象素描述的图像转变成简洁的非图形形式的符号描述。即图像分析是一个图像进而数据出的处理,数据可以是对某一特征测量所得的结果,或是基于测量的符号表示。图像理解也经常被称为计算机视觉,主要是高层操作。图像理解进一步研究图像中的目标和它们之间的联系,其处理过程和方法与人类的思维推理有不少类似之处。2.3.1视觉技术的研究人类很多研究都是以延伸人类能力为目的的,早期的工作是在体力上延伸,计算机发明以来,就拓展到对人类脑力和感知能力的延伸上。对人类视觉感知能力的计算机模拟导致了计算机视觉的产生。计算机视觉也经常被称为图像理解,是指研究完成一项任务所需的视觉信息及如何从图像中获取这些信息的研究领域。其基本目的有三个:(1) 根据一幅或多幅二维投影图像计算出观察点到目标物体的距离;(2) 根据一幅或多幅二维投影图像计算出观察点到目标物体的运动参数;(3) 根据一幅或多幅二维投影图像计算出观察点到目标物体的表面物理特性。要达到的最终目的是实现对于三维景物世界的理解,即实现人的视觉系统的某些功能。也就是利用二维投影图像来重构三维物体的可视部分。2.3.2 计算机视觉研究的对象与方法1以模型世界为主要对象的视觉基本方法研究这个阶段以Roberts 的开创性工作为标志。在Roberts 的工作中引入了三维物体与二维成像的关系,采用了一些简单的边缘特征提取方法并引入了组合线段的方法。这些早期的工作对视觉的发展起了促进作用,但对于稍微复杂的景物便难于奏效。因为他对三维关系的分析仅仅是靠简单的边缘线段的约束关系,并没有充分考虑人类或其他动物视觉系统感知三维空间关系的方式。2以计算理论为核心的视觉模型研究20 世纪70 年代开始,对计算机视觉的研究进入更为理性化的阶段,主要集中于各种本征特性的恢复,包括三维形状、运动、光源等的恢复。主要出发点是从生理学、光学和射影几何的方法出发,研究成像及其逆问题。在这一阶段中,以Marr 为代表的一些研究者提出了以表示为核心、以算法为中间转换过程的一般性视觉处理模型。在其理论中强调表示的重要性以及从不同层次上去研究信息处理问题,在计算理论和算法实现上又特别强调计算理论的重要性。在三维信息的感知方面,根据人类感知深度的不同提出了一系列Shape from X 的方法。这一阶段有代表性的工作包括:(1) 对视觉知觉现象中侧抑制现象的模拟。主要是通过采用不同尺度的LoG算子实现对不同尺度边缘信息的感知;(2) 对双眼深度线索的分析导致对立体视觉的研究;(3) 对单眼深度线索的分析导致了Shape from X技术的出现(这里X 包括阴影、纹理、遮挡、聚焦、线条透视等) ;(4) 对运动物体成像过程的研究导致光流计算以及从运动恢复结构等技术的出现。3以应用为目标的计算机视觉方法进入20 世纪90 年代之后,随着关于人工智能研究的反思,在计算机视觉的研究方面也开始考虑过去的方法是否正确,同时研究的方向开始从单纯的理论框架研究转入结合躯干运动、结合应用的研究。在以往的研究中,生物视觉的一些重要特点没有得到足够的重视,如主动性、视觉系统中的高分辨率中央凹陷与外围视觉的结合等。因此在80 年代末、90 年代初先后提出了主动视觉、定性视觉等新方法、新思路。利用主动视觉方法使得一些本来复杂的计算得到简化,一些病态问题可以转化为良性态问题,从而得到圆满解决。2.3.3计算机视觉的应用领域计算机视觉的应用领域主要包括对照片、视频资料如航空照片、卫星照片、视频片段等的解释、精确制导、移动机器人视觉导航、医学辅助诊断、工业机器人的手眼系统、地图绘制、物体三维形状分析与识别及智能人机接口等。早期进行数字图像处理的目的之一就是要通过采用数字技术提高照片的质量,辅助进行航空照片和卫星照片的读取判别与分类。由于需要判读的照片数量很多,于是希望有自动的视觉系统进行判读解释,在这样的背景下,产生了许多航空照片和卫星照片判读系统与方法。自动判读的进一步应用就是直接确定目标的性质,进行实时的自动分类,并与制导系统相结合。目前常用的制导方式包括激光制导、电视制导和图像制导,在导弹系统中常常将惯性制导与图像制导结合,利用图像进行精确的末制导。工业机器人的手眼系统是计算机视觉应用最为成功的领域之一,由于工业现场的诸多因素,如光照条件、成像方向均是可控的,因此使得问题大为简化,有利于构成实际的系统。与工业机器人不同,对于移动机器人而言,由于它具有行为能力,于是就必须解决行为规划问题,即是对环境的了解。随着移动式机器人的发展,越来越多地要求提供视觉能力,包括道路跟踪、回避障碍、特定目标识别等。目前移动机器人视觉系统研究仍处于实验阶段,大多采用遥控和远视方法。在医学上采用的图像处理技术大致包括压缩、存储、传输和自动/ 辅助分类判读,此外还可用于医生的辅助训练手段。与计算机视觉相关的工作包括分类、判读和快速三维结构的重建等方面。长期以来,地图绘制是一件耗费人力、物力和时间的工作。以往的做法是人工测量,现在更多的是利用航测加上立体视觉中恢复三维形状的方法绘制地图,大大提高了地图绘制的效率。同时,通用物体三维形状分析与识别一直是计算机视觉的重要研究目标,并在景物的特征提取、表示、知识的存储、检索以及匹配识别等方面都取得了一定的进展,构成了一些用于三维景物分析的系统。近年来,基于生物特征(biometrics) 的鉴别技术得到了广泛重视,主要集中在对人脸、虹膜、指纹、声音等特征上,这其中大多都与视觉信息有关。与生物特征识别密切相关的另一个重要应用是用于构成智能人机接口。现在计算机与人的交流还是机械式的,计算机无法识别用户的真实身份,除键盘、鼠标外,其他输入手段还不成熟。利用计算机视觉技术可以使计算机检测到用户是否存在、鉴别用户身份、识别用户的体势(如点头、摇头) 。此外,这种人机交互方式还可推广到一切需要人机交互的场合,如入口安全控制、过境人员的验放等。在计算机视觉的研究过程中,应考虑将功能模拟与认知模拟相结合。人类延伸其他能力的过程中,功能模拟起到了主要作用,但视觉是涉及心理和生理两方面的过程,因此必须在功能模拟的同时重视认知模拟。计算理论的进步与感知手段的改进有助于计算机视觉的研究。在计算机视觉中计算理论占有十分重要的地位,计算理论的进步,新的计算模型的提出可以解决以往一些困难的问题;另一方面,感知手段的进步也可以起到同样的作用。采用主动视觉可从另一个侧面去处理面对的视觉问题。要实现完整的视觉系统,视觉知识的获取、管理和利用是必不可少的。一个相对完备的视觉系统同时也是一个知识管理系统,在视觉过程中对一幅图像的理解需要大量的关于任务领域的知识,这些知识不同于问题求解中的知识可以明确的显性表示,而且人类获取信息的80 %是通过视觉得到的,因而这些知识涉及面之广难以预测,因此视觉系统中的知识管理是一个重要问题。从以往的研究看,过去的40 年虽然提出、解决了一些问题,但是由于视觉问题的特殊性和复杂性,还有大量的问题需要研究。研究的重点包括对新方法、新手段的探索。当然,在原有问题上采用新的描述方法、求解手段也是一个可能的突破点。在视觉领域中多数的问题不是问题本身正确与否,而是描述是否恰当以及求解是否有效的问题,因而描述方式、求解手段的探索是十分重要的。总之,随着对定量研究的重视,新的描述方式、求解手段的研究,以及感知手段的改进,计算机视觉的研究必将迎来一个更加繁荣的时代。2.4空域图形辨别方法介绍2.4.1图像预处理在图像分析中,对输入图像进行特征抽取、分割和匹配前所进行的处理。图像预处理的主要目的是消除图像中无关的信息,恢复有用的真实信息,增强有关信息的可检测性和最大限度地简化数据,从而改进特征抽取、图像分割、匹配和识别的可靠性。预处理过程一般有数字化、几何变换、归一化、平滑、复原和增强等步骤。 1. 数字化 一幅原始照片的灰度值是空间变量(位置的连续值)的连续函数。在M×N点阵上对照片灰度采样并加以量化(归为2b个灰度等级之一),可以得到计算机能够处理的数字图像。为了使数字图像能重建原来的图像,对M、N和b值的大小就有一定的要求。在接收装置的空间和灰度分辨能力范围内,M、N 和b的数值越大,重建图像的质量就越好。当取样周期等于或小于原始图像中最小细节周期的一半时,重建图像的频谱等于原始图像的频谱,因此重建图像与原始图像可以完全相同。由于M、N 和b三者的乘积决定一幅图像在计算机中的存储量,因此在存储量一定的条件下需要根据图像的不同性质选择合适的M、N 和b值,以获取最好的处理效果。 2.几何变换 用于改正图像采集系统的系统误差和仪器位置的随机误差所进行的变换。对于卫星图像的系统误差,如地球自转、扫描镜速度和地图投影等因素所造成的畸变,可以用模型表示,并通过几何变换来消除。随机误差如飞行器姿态和高度变化引起的误差,难以用模型表示出来,所以一般是在系统误差被纠正后,通过把被观测的图和已知正确几何位置的图相比较,用图中一定数量的地面控制点解双变量多项式函数组而达到变换的目的。 3.归一化 使图像的某些特征在给定变换下具有不变性质的一种图像标准形式。图像的某些性质,例如物体的面积和周长,本来对于坐标旋转来说就具有不变的性质。在一般情况下,某些因素或变换对图像一些性质的影响可通过归一化处理得到消除或减弱,从而可以被选作测量图像的依据。例如对于光照不可控的遥感图片,灰度直方图的归一化对于图像分析是十分必要的。灰度归一化、几何归一化和变换归一化是获取图像不变性质的三种归一化方法。 4.平滑 消除图像中随机噪声的技术。对平滑技术的基本要求是在消去噪声的同时不使图像轮廓或线条变得模糊不清。常用的平滑方法有中值法、局部求平均法和k 近邻平均法。局部区域大小可以是固定的,也可以是逐点随灰度值大小变化的。此外,有时应用空间频率域带通滤波方法。 5.复原 校正各种原因所造成的图像退化,使重建或估计得到的图像尽可能逼近于理想无退化的像场。在实际应用中常常发生图像退化现象。例如大气流的扰动,光学系统的像差,相机和物体的相对运动都会使遥感图像发生退化。基本的复原技术是把获取的退化图像g(x,y)看成是退化函数h(x,y)和理想图像f(x,y)的卷积。它们的傅里叶变换存在关系 G(u,vH(u,v)F(u,v)。根据退化机理确定退化函数后,就可从此关系式求出F(u,v),再用傅里叶反变换求出f(x,y)。通常把 称为反向滤波器。实际应用时,由于H(u,v)随离开uv平面原点的距离增加而迅速下降,为了避免高频范围内噪声的强化,当u2+v2大于某一界限值W时,使M(u,v)等于1。W0的选择应使H(u,v)在 u2+v2W范围内不会出现零点。图像复原的代数方法是以最小二乘法最佳准则为基础。寻求一估值弮,使优度准则函数值最小。这种方法比较简单,可推导出最小二乘法维纳滤波器。当不存在噪声时,维纳滤波器成为理想的反向滤波器。 6.增强 对图像中的信息有选择地加强和抑制,以改善图像的视觉效果,或将图像转变为更适合于机器处理的形式,以便于数据抽取或识别。例如一个图像增强系统可以通过高通滤波器来突出图像的轮廓线,从而使机器能够测量轮廓线的形状和周长。图像增强技术有多种方法,反差展宽、对数变换、密度分层和直方图均衡等都可用于改变图像灰调和突出细节。2.4.2图像分割介绍图像分割就是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程,此处特性可以是像素的灰度、颜色、纹理等预先定义的目标可以对应单个区域,也可以对应多个区域。 图像分割是由图像处理到图像分析的关键步骤,在图像工程中占据重要的位置。一方面,它是目标表达的基础,对特征测量有重要的影响;另一方面,因为图像分割及其基于分割的目标表达、特征抽取和参数测量的将原始图像转化为更抽象更紧凑的形式,使得更高层的图像分析和理解成为可能。 图像分割是图像理解的基础,而在理论上图像分割又依赖图像理解,彼此是紧密关联的。图像分割在一般意义下是十分困难的问题,目前的图像分割一般作为图像的前期处理阶段,是针对分割对象的技术,是与问题相关的,如最常用到的利用阈值化处理进行的图像分割。 图像分割有三种不同的途径,其一是将各象素划归到相应物体或区域的象素聚类方法即区域法,其二是通过直接确定区域间的边界来实现分割的边界方法,其三是首先检测边缘象素再将边缘象素连接起来构成边界形成分割。 1.阈值与图像分割 阈值是在分割时作为区分物体与背景象素的门限,大于或等于阈值的象素属于物体,而其它属于背景。这种方法对于在物体与背景之间存在明显差别(对比)的景物分割十分有效。实际上,在任何实际应用的图像处理系统中,都要用到阈值化技术。为了有效地分割物体与背景,人们发展了各种各样的阈值处理技术,包括全局阈值、自适应阈值、最佳阈值等等。 2.梯度与图像分割 当物体与背景有明显对比度时,物体的边界处于图像梯度最高的点上,通过跟踪图像中具有最高梯度的点的方式获得物体的边界,可以实现图像分割。这种方法容易受到噪声的影响而偏离物体边界,通常需要在跟踪前对梯度图像进行平滑等处理,再采用边界搜索跟踪算法来实现。 3.边界提取与轮廓跟踪 为了获得图像的边缘人们提出了多种边缘检测方法,如Sobel, Canny edge, LoG。在边缘图像的基础上,需要通过平滑、形态学等处理去除噪声点、毛刺、空洞等不需要的部分,再通过细化、边缘连接和跟踪等方法获得物体的轮廓边界。 4. Hough变换 对于图像中某些符合参数模型的主导特征,如直线、圆、椭圆等,可以通过对其参数进行聚类的方法,抽取相应的特征。 5.区域增长 区域增长方法是根据同一物体区域内象素的相似性质来聚集象素点的方法,从初始区域(如小邻域或甚至于每个象素)开始,将相邻的具有同样性质的象素或其它区域归并到目前的区域中从而逐步增长区域,直至没有可以归并的点或其它小区域为止。区域内象素的相似性度量可以包括平均灰度值、纹理、颜色等信息。 区域增长方法是一种比较普遍的方法,在没有先验知识可以利用时,可以取得最佳的性能,可以用来分割比较复杂的图像,如自然景物。但是,区域增长方法是一种迭代的方法,空间和时间开销都比较大。2.4.3模板匹配模板匹配是最早出现,也是最简单的模式识别方法之一,匹配是模式识别的一种分类操作,主要是判断同一类的两个实体(如点、曲线、形状等)之间的相似性。要进行模板匹配,首先需要存储一些已知模板,然后考虑所有可能的变化,将待识别模板与已知模板相比较,从而得出二者之间的相似性度量。为保证模板的通用性,已知模板一般是通过训练得到的。依照此系统的要求所实现模板匹配的算法如下:先要确定模板的形式,如3×3或4×4的模板如图(2-1)所示。然后将目标图形放到确定的模板中去,通过以图形包括的模板中点的不同,找出图形之间的差异,从而实现分辨图形的目的,典型图形(三角形,矩形,圆形)模板匹配示意图,见图(2-2)。通过图(2-2)可以看出模板越大、点数月多,判别的信息就越多,准确性越高。图2-1 3×3,4×4的模板图2-2 典型图形(三角形,矩形,圆形)模板匹配示意图 具体算法描述为:先找图形的中心点坐标,方法有:(1)找到图像的各顶点,使其坐标做差,算出顶点到图形中心的距离,从而得到图形的中心坐标;(2)通过对分割后的图像的所用坐标求和,在用图形总共像素数取平均。然后根据图形的中心点与模板其它点之间的距离,得到这些点在图像上的实际坐标,然后判断这些点是否被图形包含,从而判断是否实现模板匹配。对于一个图形的辨别还要考虑到其图形的大小的问题,模板匹配算