毕业设计(论文)基于数学形态学的车牌定位的方法研究.doc
-
资源ID:3981366
资源大小:919.50KB
全文页数:45页
- 资源格式: DOC
下载积分:8金币
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
毕业设计(论文)基于数学形态学的车牌定位的方法研究.doc
摘 要本文提出了一套简洁高效、基于数学形态学的车牌定位的方法。定位方法综合考虑了灰度和边缘信息,首先对图像进行了预处理,采用了灰度变换、去噪、增强对比度、边缘检测、二值化等方法对图像进行处理,提高了图像的质量,强化了图像区域;接着,采用一种基于二值图像灰度变化特征进行定位的方法,根据灰度的跳变搜索车牌区域,再利用车牌几何形状的特点对候选区进行筛选,得到车牌位置。关键词:车牌定位;边缘检测;数学形态学AbstractThis paper puts forward a set of concise efficiency, based on mathematical morphology method of license plate location. Locating method considering the gray and edge information, first the image preprocessing, using a gray transform, denoising and enhance contrast, edge detection, binary image processing methods, such as, improves the quality of the images, strengthened the image region, Then, using a method based on binary image gray-scale change characteristics of orientation method, according to the greyscale hopping search plate area, reuse plate geometric shape characteristics of the candidate area unselective and get license plate location. Keywords:license plate location, image preprocessing, mathematical morphology目 录摘要IABSTRACTII第1章 绪论11.1 课题背景11.2 国内外研究现状11.2 研究内容及技术指标5第2章 车牌图像的预处理62.1 图像的灰度化62.2 图像二值化72.2.1全局动态二值化82.2.2局部自适应二值化92.3 图像的边缘检测102.3.1 Roberts算子112.3.2 Sobel算子112.3.3 LOG(Lap1ac1anofGuass1an)算法122.3.4 Prewitt算子13本章小结17第3章 数学形态学的相关算法183.1 数学形态学183.2 数学形态学的基本运算193.2.1 腐蚀和膨胀193.2.2 开运算和闭运算20本章小结21第4章 基于数学形态学的车牌定位224.1 车牌的基本特征224.2 车牌定位的设计思路244.3 软件设计264.4 车牌定位的结果分析29本章小结29结论30致谢32参考文献33附录1 译文35附录2 英文参考资料38 第1章 绪论1.1 课题背景随着全球经济的快速持续发展,车辆数目迅猛增长,世界各国交通拥堵、交通事故和环境污染越来越影响着社会经济发展和生活。虽然道路运输增长的需求可以靠提供更多的道路设施来满足,但是在资源、环境矛盾越来越突出的今天,道路设施的增长收到限制,这就需要依靠提供除设施之外的技术方法来满足这一需求。智能交通系统(ITS)1是解决这一矛盾的重要途径之一,而且,其重要性正被越来越多的人所认可。ITS是21世纪地面交通运输科技、运营和管理的主要发展方向,是交通运输的一场革命。自20世纪80年代末以来,西欧、北美和日本竞相发展智能交通系统,制定并实施了开发计划。发展中国家也开始了ITS的全面开发与研究。智能交通系统(Intelligent Transportation System,ITS)的概念最初由美国智能交通学会CITS America(当时名为IVHS America)于1990年提出的。ITS系统就是将先进的信息技术、数据通讯传输技术、电子传感技术、电子控制技术以及计算机处理技术等有效地集成运用于整个交通运输管理体系,而建立起的一种在大范围内、全方位发挥作用的,实时、准确、高效的综合运输和管理系统。智能交通系统的开发,不仅可以减少与环境有关的不良影响,而且可以通过增加运输系统的效率来提高空气质量,减少道路拥堵、提高安全水平、确保环境储备,以及使我们的交通运输系统能够通过利用智能交通系统这样的技术而得到更好的利用。Christos Nikolaos2 M.H.terBrugge3 J.A.G.Nijhuis4 K.K.Kim5 Shyang-Lih Chang6等学者,科学家提出了自己的车牌定位方法。通过ITS系统和智能汽车的开发与应用,有助于增强道路规划和建设决策的科学性,对实现城市交通科学化、现代化管理,创造可持续发展的交通环境,具有重要的参考意义。1.2 国内外研究现状车牌识别系统是一项科技含量很高的多种技术结合的产品,主要有计算机视觉、数字图像处理、数字视频处理、模式识别等技术组成,也是智能交通系统的核心技术,产生于60年代。在80年代,由于城市交通问题日益严重,美国和欧洲许多国家投入了大量的人力和物力,建立了自动化的高速公路网,安装了摄像、雷达探测系统和光纤网络,建立智能交通系统。在美国、欧洲、日本等发达国家带动下,世界各国也开始建立了智能交通系统。由于公路车流量日益增大、道路交通日益拥挤,车辆管理相对越来越困难,因此各个发达国家和发展中国家都在积极建设适应未来交通运输需求的智能交通系统。目前,基于数字图像处理和模式识别的方法是车牌自动识别中最为常用和最为有效的方法。车牌识别的两个关键指标是识别精度和识别速度。随着计算机技术的发展,计算机处理能力越来越强,识别速度有了很大的提高。车牌识别的主要问题是如何提高识别正确率。很多因素例如复杂的背景、不同的车型、变化的天气、不同的光照条件、高速行驶等都会导致采集的图像质量差(如模糊、噪声大等)、识别率低。另外,中国车牌字符是由汉字、字母和数字混合组成,增大了字符识别的复杂度,导致识别系统难于实时处理、识别率低。国内外学者对于车牌识别进行了大量的研究,但是真正能够实用的车牌识别系统还很少。国内和国外的研究存在很大差距,国外车牌识别技术己经开始从实验研究转移到实际应用中。当然国内汽车车牌识别系统也取得了较大的进展,但还需进一步改进、完善,提高车牌整体识别率,特别是夜间识别率更为重要,如夜间交通事故、肇事等。目前,国内在车牌识别系统方面研究比较突出的主要有北京汉王公司和上海高德威公司,香港亚洲视觉公司也比较突出。总体而言,国内还很少有实用的车牌识别系统,基本还处在研究开发阶段。国外在车牌识别系统方面的研究已经比较深入和成熟了,并已形成了实际的应用系统。1国内外车牌识别技术研究存在较大差距,主要由于以下原因:(1)国外车牌识别技术研究起步较早。国外发达的国家由于道路交通高速发展,实际应用需求推动了技术发展,而我国只是在改革开放后,道路交通才有了很大发展。(2)中国标准车牌中存在汉字,笔划较多,识别难度较大。我国标准汽车牌照是由汉字、英文字母和阿拉伯数字组成,汉字的识别与字母和数字的识别有很大的不同,从而增加了识别的难度。(3)同发达国家相比,国内的车况条件比较差,致使车牌图像清晰度降低,增加了识别的难度。由于环境、道路或人为因素造成汽车牌照污染严重,这种情况下国外发达国家不允许上路,而在我国仍可上路行驶。(4)中国以前使用的车牌材质没有抗反光功能,另外有些人故意破坏车牌,恶意逃避交通责任。(5)国外许多国家汽车牌照的底色和字符颜色通常只有对比度较强的两种颜色(例如韩国,其车牌底色为红色,车牌上的字符为白色),而我国汽车牌照仅底色就有蓝、黄、黑、白等多种颜色,字符颜色也有黑、红、白等若干种颜色。(6)其他国家的汽车牌照格式(如汽车牌照的尺寸大小,牌照上字符的排列等)通常只有一种,而我国则根据不同车辆、车型、用途,规定了多种牌照格式(例如分为军车、警车、普通车等)。国内车牌还有单层和双层车牌之分,92式和2002式车牌之分。(7)我国汽车牌照的规范悬挂位置不唯一。2.目前,国内外车牌定位的方法可分为两大类,一类是基于黑白图像的车牌定位方法,另一类是基于彩色图像的车牌定位方法。(1)基于黑白图像的定位方法黑白图像只具有灰度层次而无彩色,对于人的视觉来说,是以灰度等级来体现深浅。在这类定位方法中,又大致有三种定位方法。一是基于车牌特征的车牌定位方法。车牌图像一般是在室外拍摄的,其背景往往很复杂,可能包括自然场景中的人、其它车辆、树木等;拍摄的光照条件也因拍摄时间、地点、天气等条件的不同而不同。但是,车牌照却具有不因外部条件变化而改变的特征,即可根据车牌区的纹理特征及灰度跳变等特征来定位。例如基于灰度特征,对二值化图像求垂直方向的梯度,根据车牌特征选择适当的阈值,或者逐行扫描,求图像灰度的变化,选择适当的阈值。然后可采用8领域寻找所有的长横线,由于车牌的高宽比是定数,可作为一种目标评定标准,寻找其中的两条线,并考虑变形因素,找高宽比在一定范围内的,认为是车牌的边缘。也可利用多个特征联合求解。但由于这些传统方法受图像质量的影响较大,所以准确率较低。南京航空航天大学的刘效静、成瑜提出了基于车牌文字特点的自动扫描识别算法,该方法利用汽车牌照中文字笔画变化频率比较稳定的特点,设定阈值,通过扫描确定上下界位置和左右界位置。中科院的刘志勇等人针对车牌特点,设计了一个变换函数来突出其特点,从而进行车牌提取。该方法采用最大方差法来进行二值化阈值的选取,并对二值化后的图像进行水平扫描,找出候选区域。J.Barroso提出了基于水平线搜寻的车牌定位方法,R.Parisi等提出了基于DFT变换频域分析的定位方法,Charl Coetzee提出了基于Niblack二值化算法及自适应边界搜索算法的定位方法。二是基于数学形态学、小波分析、遗传算法、神经网络等数学工具的车牌定位方法。在图像处理中,对一些复杂图像应用某些数学工具不仅可以加快处理速度,而且可以改善和优化处理效果。一些传统的定位技术在复杂背景、图像变形、噪声污染严重的情况下,无法达到有效的识别。利用数学形态学、小波分析、遗传算法、神经网络等方法可以对传统定位方法进行较好的改进。M.Raus等提出了应用人工神经网络进行车牌定位的方法,取得了一定成效,不过神经网络训练需要较多样本,同时耗时较长。南京理工大学的是湘全等人提出了利用遗传算法对图像进行优化搜索,结合区域特征矢量构造的适应度函数,寻找牌照区域的最佳定位参量。该方法具有一定抗噪性,但需对车辆与摄像头距离及车牌位置作一些限定,另外,遗传算法的计算量较大。另外,还有基于黑白图像的其它定位方法。如利用边缘检测和Hough变换进行倾斜车牌校正的算法及车牌上下界精确定位。J.Bulas-Cruz等人曾提出了基于扫描行的车牌定位方法,指出扫描行经过车牌区域时会产生有规律的起伏。东南大学的富煜清等人提出了利用扫描行离差数据、有效谷峰点特征及先验知识来初步定位车牌区域,并提出了利用边缘检测和Hough变换进行倾斜车牌校正的算法及车牌上下界精确定位算法。再如有学者提出基于线模板的二值图像角检测算法,将包含车牌的彩色图像转化为二值图像,再经过形态滤波后,利用快速角检测法寻找图像各角点,达到定位目的。刘伟铭,赵雪平也提出了一种基于扫描行的汽车牌照定位算法。(2)基于彩色图像的车牌定位由于车辆牌照具有与牌号、车身、背景不同的底色,因此考虑颜色来研究车牌的定位方法是车牌识别领域的一种新思路。近年来,国内在这方面作出尝试的有上海交通大学的赵雪春等人,他们提出了一种彩色分割及多级混合集成分类器的车牌自动识别方法。彩色图像的分割处理釆用的步骤是:首先将输入的RGB彩色图像转换成HIS彩色图像,并对该图像作色彩饱和度调整处理,为了减少计算量,可将图像抽稀。因为抽稀后的图像保持了原图的色彩分布信息,因此对抽稀后的图像作车牌定位,进而可计算得到原图中的车牌区域。其次将抽稀后的彩色图像通过神经网络进行色彩分割,将原来的色彩分割成黑、红、黄、绿、蓝、紫、白、及其它8种色彩。然后投影法分割出潜在的各种底色的车牌区域,接着计算出原图中的车牌区域位置,并用同样的方法对它进行彩色分割,以便进一步对车牌区域进行字符切割。投影法分割首先用神经网络对色彩进行训练,然后进行利用色彩投影进行统计得到车牌区域。不过该方法在车牌区域颜色与附近颜色非常相识时,车牌的定位误差会有所增加。郭捷,施鹏飞提出了一种基于颜色和纹理分析的车牌定位方法。Shyang-Lih Chang,Li-ShienChen等人提出了一种彩色边缘检测的车牌定位方法。对于车牌字符的切分与识别,目前主要有基于模板匹配的OCR算法以及基于人工神经网络的OCR算法。基于模板匹配的OCR算法:首先对待识别字符进行二值化并将其尺寸大小缩放为字符数据库中模板的大小,然后与所有的模板进行匹配,最后选最佳匹配作为结果。这种匹配算法稳定性较差、时间花费也较大。有研究人员提出了基于关键点的模板匹配算法,即只对字符的关键点进行提取,使用关键点进行模板匹配。因此提高了识别速度又具有较高的识别率。基于人工神经网络的OCR算法:一种方法是先对待识别的字符进行特征提取,然后用所得的特征来训练神经网络分类器,这种网络的识别效果与字符特征的提取有关,而字符特征的提取往往比较耗时。另一种方法是充分利用神经网络的特点直接把待处理图像输入网络,由网络自动实现特征提取直至识别,这种网络可连较多,待处理信息量大。如有研究者提出使用一种前馈神经网络进行识别,这种方法无需特征提取和模板匹配,由网络自动识别字符。近两年,有少数研究人员开始应用支持向量机(Support Vector Machine,简称SVM)来进行车牌字符识别,并且取得了一定进展,收到了较好的效果。支持向量机在避免神经网络的局部极值方面具有优势,同时,它不要求大样本训练。由于我国车牌识别的特殊性,采用任何一种单一识别技术均难以奏效,今后,基于视频采集的、综合应用数字图像处理、模式识别、人工智能等技术的车牌识别方法将成为比较有前途的研究方向。1.2 研究内容及技术指标在车牌定位方面,在对目前常用方法的原理和存在问题分析的基础上,本文采用数学形态学的方法,并根据车牌的长宽比例剔除非车牌区域。对采集到的车牌图像利用数字图像处理方法进行图像预处理操作,以减少噪声点的干扰,进行区域定位为车牌区域定位做好准备。经预处理后的边缘图像,根据车牌的外型特征,用数学形态学定位车牌区域的方法,完成了仿真。技术指标:1.定位图片为格式640*480的JPEG图片2.图像为单车牌静态图片3.准确定位率应达到90%以上第2章 车牌图像的预处理图像预处理的作用是突出图像中的有用信息,不同的图像预处理对应于不同的图像分割以获得最佳的车牌特征。车牌定位预处理目标是突出车牌区域的特征,抑制其它无用的特征。图像的预处理包括图像灰度化、二值化、边缘检测等内容。采集所得原始图片(车牌定位演示)如图2-1所示。图2-1采集所得原始图片2.1 图像的灰度化灰度图的特征是:只有亮度信息,没有颜色信息。彩色位图结构复杂,难以处理,灰度图较简单,易于处理。灰度图的亮度信息,已经足以判断对车牌进行定位了,所以选择较容易处理的灰度图。灰度图是只含亮度信息不含色彩信息的图像,其中亮度值量化为256级。灰度图进行算法处理比较方便,首先RGB值一样,且图像数据就是调色板索引值,也就是实际的RGB的亮度值,又因调色板是256色的,所以图像数据中一个字节代表一个。如果是彩色的256色图,则经过图像处理算法后,可能会产生不属于这256种颜色的新颜色,而真彩色RGB图像必须用三个与图像尺寸相同的矩阵来存储,这样计算代价过大。所以,一般采用256级灰度图来进行处理。由于采集的图像是彩色图像,所以要把彩色图像转化为灰度图像。灰度变换有时又被称为图像的对比度增强或对比度拉伸。假定输入图像中的一个像素的灰度级为Z,经过T(Z)函数变换后输出图像对应的灰度级为Z,其中要求Z和Z都要在图像的灰度范围之内。根据T()形式,可以将灰度变换分为线性变换和非线性变换。具体应用中采用何种T(),需要根据变换的要求而定。灰度变换的具体方法是:首先将原始图像从RGB空间转化为YCbCr空间,Y分量包含亮度信息,Cb和Cr分量包含色度和饱和度信息,然后仅提取Y分量生成灰度图。彩色图像由RGB空间变换为YCbCr空间的转换关系为:Y=0.299R0.587G0.114B (2-1)Cb=0.168780.3313G0.5B128 (2-2)Cr=0.5R0.487G0.0813B128 (2-3)彩色图像由YCbCr空间变换为RGB空间的转换关系为:R=Y+1.402(Cr128) (2-3)G=Y0.34414(Cb128)0.71414(Cr128) (2-4)B=Y+1.772(Cb128) (2-5)所以,最终我们得到RGB颜色和灰度值的转换关系:Gray=0.229R+0.587G+0.114B (2-6)得到的灰度图如图2-2所示。图2-2转换所得的灰度图2.2 图像二值化假设一幅灰度车牌图像大小为M行N 列,用那么二值化的处理可以用下式所示: (2-7)这里的T 称为阈值(Threshold),经过二值化处理后,字符前景和车牌背景就由黑白两种颜色分开,选择不同的阈值会得到不同的分离结果。在车牌识别中对车牌灰度图像进行二值化的方法有主要有全局动态二值化、局部自适应二值化。2.2.1全局动态二值化全局动态二值化从整个灰度图像的像素分布出发寻求一个最佳的门限值。(1)迭代式阈值选择迭代式阈值选择方法的基本思想是:开始时选择一个阈值作为初始值,然后按照某种策略不断改进这一估计值,直到满足给定的准则为止。在迭代的过程中,关键之处在于选择什么样的阈值改进策略,好的阈值改进策略具备两个特征:一是能够快速收敛,二是在每一个迭代过程中,新产生阈值优于上一次的阈值。下面给出一种迭代式阈值选择算法,其步骤如下:选择图像灰度的中值作为初始阈值T0 ;利用阈值T0 把图像分割成两个区域R1和R2,用式(2-8)计算区域R1和R2的灰度均值: (2-8)计算后,用式(2-9)计算出新的阈值Ti+1: (2-9)重复,直到Ti+1和Ti的差小于某个给定值。(2)Otsu法阈值选择Otsu法是一种使类间方差最大的自动确定阈值的方法。基本思想是:取一个阈值T0,将图像像素按灰度大小分为大于等于T0和小于T0两部分,然后求出两部分像素的平均值方差(类间方差)和两个类各自的均方差(类内方差),找出使两个方差比最大的阈值T,该阈值即为二值化图像的最佳阈值。这种方法不论图像的直方图有无明显的双峰,都能得到较为满意的效果。因此这种方法是阈值自动选取的较优方法。具体方法如下:设给定图像具有1,2 ,3 ,L,共L级灰度,阈值设为k,把灰度大于k和小于k的像素分为两类。类1中的像素总数为,平均灰度为,方差为;类2中的像素总数为,平均灰度为,方差为;所有图像像素的平均值为。类间方差和类内方差分别由式(2-10)和式(2-11)决定: (2-10) (2-11)算法的描述如下:求出图像中最大的灰度max_gray;令k = 0;求出大于和小于k的这两类像素总数和像素的灰度平均值;计算类间方差和类内方差;k = k + 1,循环步,直到k > max_gray;找出最大的值,得到相应的阈值k。Otsu算法基于图像像素的灰度值分类,按照使类间方差与类内方差比值最大的原则获得门限值,使目标占背景之间方差最大,即找出使两个方差比的最大的阈值T,这种算法具有以下优点:算法的实现简单;基于图像的整体特性的积分而非局部特性;可推广到多阈值的分割方法;该算法的适用性强。2.2.2局部自适应二值化局部自适应二值化是针对灰度图像中的每一个像素逐点进行阈值计算的,以当前点为中心选取一个适当的邻域模板,从这个模板中的像素灰度值中获得判据,来决定对当前点是置0还是置1对每一点计算阈值: (2-12)计算另一阈值T3: (2-13)对每点的阈值T2进行一次滤波处理得新阈值T4: (2-14)逐点对图像进行二值化:若(f (x ,y) > T4 (x ,y) ) 且 (T3 (x ,y) > (T1 - min) ),则b (x ,y) = 1,否则b (x ,y) = 0。其中T1 满足,H(x)为灰度直方图。2.3 图像的边缘检测图像的边缘是图像最基本的特征。所谓边缘(或边沿)是指其周围灰度有阶跃变化或“屋顶”变化的那些的集合。边缘广泛存在于物体与背景之间、物体与物体之间、基元与基元之间。因此,它是图像分割依赖的重要特征。图像的边缘对人的视觉具有重要意义,一般而言,当人们看到一个有边缘的物体时,首先感觉到的便是边缘,灰度或结构等信息的突变处称为边缘。边缘是一个区域的结束,也是另一个区域的开始,利用该特征可以分割图像。由于图像是二维的,而实际物体是三维的,从三维到二维的投影必然会造成信息的丢失,再加上成像过程中的光照不均和噪声等因素的影响,使得有边缘的地方不一定被检测出来,而检测出的边缘也不一定代表实际边缘。图像的边缘有方向和幅度两个属性,沿边缘方向像素变化平缓,垂直于边缘方向像素变化剧烈。边缘上的这种变化可以用微分算子检测出来,通常采用一阶或二阶导数来检测边缘,如图2-3所示。不同的是一阶导数认为最大值对应边缘位置,而二阶导数则以过零点对应边缘位置。(a) 图像的灰度变化(b) 一阶导数(c) 二阶导数图2-3 图像灰度变化与导数物体的边缘是由灰度不连续性形成的。经典的边缘提取方法是考察图像的每个像素在某个邻域内灰度的变化,用简单的方法检测边缘。这种方法称为边缘检测局部算子法。如果一个像素落在图像中某一个物体的边界上,那么它的邻域将成为一个灰度级的变化带。对这种变化最有用的两个特征:灰度的变化率和方向,它们分别以梯度向量的幅度和方向来表示。边缘检测算子检查每个的邻域并对灰度变化率进行量化,也包括方向的确定。边缘检测的算子很多,例如:如Sobel算子、Roberts算子、Prewitt算子、Laplacian算子等。2.3.1 Roberts算子在任意一对相互垂直方向上的差分可以看成求梯度的近似方法,Roberts边缘检测算子利用该原理,采用对角线方向相邻两像素之差代替梯度,即 (2-15)和的卷积算子为: : (2-16)梯度幅度值近似为 或 (2-17)通过差分可以求得Roberts算子在差分点处连续梯度幅度的近似值。适当选取阈值,如果,认为该点是边缘点。Roberts边缘检测算子采用对角线方向相邻两像素之差进行梯度幅度检测,其检测水平、垂直方向边缘的性能要好于斜线方向边缘,并且检测定位精度比较高,但对噪声敏感。 2.3.2 Sobel算子Sobel边缘检测算子在以像素点为中心的3×3邻域内做灰度加权运算,根据该点是否处于极值状态进行边缘的检测,其本质仍是一种梯度幅度。Sobel边缘检测算子定义为 或 (2-18)式中 (2-19) (2-20)与其他梯度算子一样,和可用如下卷积模板描述,即: : (2-21)Sobel算子是综合图像的每个像素点的上、下、左、右邻域灰度的加权和,接近模板中心的权值较大。适当选取阈值门限,如果,则认为点是边缘点。Sobel算子不但可以产生较好的边缘效果,而且对噪声具有平滑作用,减小了对噪声的敏感性,但是Sobel边缘检测算子也检出了一些伪边缘,使得边缘比较粗,降低了检测定位精度。在检测定位精度要求不是很高的情况下,Sobel算子是比较常用的边缘检测算子。 2.3.3 LOG(Lap1ac1anofGuass1an)算法拉普拉斯(LaPlacian)算子应用二阶微分运算算子提取边缘,定义为:(2-22)表2-1二阶微分模板121-24-21-21拉普拉斯算子是线性的、各向同性和位移不变的,但不能提供边界方向信息。拉普拉斯对噪声比较敏感,很少直接用于检测边缘,主要用于抑制边缘象素,确定该象素是暗区还是明域。2.3.4 Prewitt算子Prewitt边缘检测算子是一种类似于Sobel边缘检测算子的边缘模板算子,通过对图像进行八个方向的边缘检测,将其中最大的作为边缘幅度图像的边缘。Prewitt边缘检测算子定义为 (a)正西方向 (b)正东方向 (c)正南方向 (d)正北方向 (2-23)(e)西南方向 (f)东北方向 (g)西北方向 (h)东南方向Prewitt边缘检测算子并不把重点放在相邻的像素上,它对噪声有平滑作用。但是与Sobel边缘检测算子一样,它检测出得边缘比较粗,定位精度比较低,容易损失如角点这样的边缘信息。由于Prewitt边缘检测算子通过八个方向的模板对图像进行卷积运算,其运算量是比较大的。2.3.5 各种边缘检测算子的比较Roberts算子:利用局部差分算子寻找边缘,边缘定位精度高,但容易丢失一部分边缘,同时由于图像没有经过平滑处理,因此不具备抑制噪声能力。该算子对具有陡峭边缘且噪声低的图像效果较好,如图2-4(b)。Sobel算子和Prewitt算子:都是对图像先作加权平滑处理,然后再作微分运算,所不同的是平滑部分的权值有些差异,因此对噪声具有一定的抑制能力,但不能完全排除检测结果中出现的虚假边缘。虽然这两个算子边缘定位效果不错,但检测出的边缘容易出现多像素宽度, 如图2-4(c)和2-4(d)。Laplacian算子:是不依赖于边缘方向的二阶微分算子,对图像中的阶跃型边缘点定位准确,该算子对噪声非常敏感,它使噪声成分得到加强,这两个特性使得该算子容易失去一部分边缘的方向信息,造成一些不连续的边缘检测,同时抗噪声能力较差。LoG算子:该算子克服了Laplacian算子抗噪声能力比较差的缺点,但是抑制噪声的同时也可能将原有的比较尖锐的边缘也平滑掉了,造成这些尖锐边缘无法被检测到,如图2-4 (e)。Canny算子:虽然基于优化思想推导出的边缘检测算子,但实际效果并不一定最优,原因在于理论和实际有许多不一样的地方。该算子同样采用高斯函数对图像作平滑处理,因此具有较强的抑制噪声能力,同样该算子也会将一些高频边缘平滑掉,造成边缘丢失。Canny算子采用双阈值算法检测和连接边缘,采用的多尺度检测和方向性搜索比LoG算子好,如图2-4 (f)。 (a) 原图(b) Roberts算子边缘检测 (c) Sobel算子边缘检测(d) Prewitt算子边缘检测 (e) LoG算子边缘检测(f) Canny算子边缘检测图2-4 各种边缘检测算子本文采用的是Sobel边缘算子。Sobel算子有两个,一个是检测水平边沿的;另一个是检测垂直边沿的。Sobel算子对于像素的位置的影响做了加权,因此效果更好。由于Sobel算子是滤波算子的形式,用于提取边缘,可以利用快速卷积函数,简单有效,因此应用广泛。由Sobel边缘算子处理后的车牌图片如图2-5所示。图2-5边缘检测后的图像由Sobel边缘算子处理过的图片可以看出,车牌区域的特征非常明显。这种特征表现为跳变明显。在这里所谓的跳变,是指两个相邻像素点之间的灰度差异明显。本文的算法将通过这种差异来搜寻确定车牌的位置。本章小结本章主要对车牌定位的图像预处理进行了一个简单的说明,其中重点介绍了一下图像预处理中的图像灰度化、图像的边缘检测、灰度图像的二值化等主要内容,还简要介绍了一些算法。第3章 数学形态学的相关算法3.1 数学形态学数学形态学的基本思想是用具有一定形态的结构元素亮度和提取图像中的对应形状以达到对图像分析和识别的目的,其数学基础和所用语言是集合论。数学形态学的应用可以简化图像数据,保持它们的形状特性,并除去不相干的结构,其算法具有天然的并行实现的结构。用数学形态学算法对图像进行处理,方法比较简单,不需要计算每点的局部特征,故速度快且抗噪能力比较强。数学形态学是一门建立在严格数学理论基础上的学科,所用语言是集合论,其基本思想和方法对图像处理的理论和技术产生了重大影响。事实上,数学形态学已经构成一种新的图像处理方法和理论,成为计算机数字图像处理的一个重要研究领域,并且已经应用在多门学科的数字图像分析和处理的过程中。数学形态学的应用可以简化图像数据,保持它们基本的形状特性,并除去不相干的结构。数学形态学的算法具有天然的并行实现的结构,实现了形态学分析和处理算法的并行,大大提高了图像分析和处理的速度。数学形态学是由一组形态学的代数运算子组成的,它的基本运算有4个:膨胀(或扩张)、腐蚀(或侵蚀)、开启和闭合,它们在二值图像和灰度图像中各有特点。基于这些基本运算还可推导和组合成各种数学形态学实用算法,用它们可以进行图像形状和结构的分析及处理,包括图像分割、特征抽取、边界检测、图像滤波、图像增强和恢复等。数学形态学方法利用一个称作结构元素的“探针”收集图像的信息,当探针在图像中不断移动时,便可考察图像各个部分之间的相互关系,从而了解图像的结构特征。数学形态学基于探测的思想,与人的FOA(Focus Of Attention)的视觉特点有类似之处。作为探针的结构元素,可直接携带知识(形态、大小、甚至加入灰度和色度信息)来探测、研究图像的结构特点。迄今为止,还没有一种方法能像数学形态学那样既有坚实的理论基础,简洁、朴素、统的基本思想,又有如此广泛的实用价值。有人称数学形态学在理论上是严谨的,在基本观念上却是简单和优美的。形态学方法已成为图像应用领域工程技术人员的必备工具。目前,有关数学形态学的技术和应用正在不断地研究和发展。3.2 数学形态学的基本运算数学形态学的基本运算有4个:膨胀、腐蚀、开启和闭合。他们在二值图像和灰度图像中各有特点。由于我们要处理的为二值图像,因此只需对二值形态学的基本运算进行探讨。二值形态学中的形态变换是针对集合的处理。其形态算子的实质是表达物体或形状的集合与结构元素间的相互作用,因此结构元素的形态就决定了这种运算所提取的信号的形状信息。图像形态处理时,就是在图像中移动一个结构元素,然后将结构元素与图像进行交、并等集合运算。一般设A为图像集合,B为结构元素,形态运算就是B对A的操作。3.2.1 腐蚀和膨胀腐蚀和膨胀是最基本的形态学运算,他们互为对偶关系。腐蚀具有收缩图像的作用,膨胀具有扩大图像的作用。腐蚀的实现是基于填充结构元素的概念。利用结构元素填充的过程,取决于一个基本的欧式空间运算平移。将一个集合A平移距离x可以表示为A+x,其定义为: (3-1)从几何上看,A+x表示A沿矢量x平移了一段距离。探测的目的是标记出图像内部哪些可以将结构元素填入的位置。集合A被集合B腐蚀,表示为AB,其定义为: (3-2)其中,A称为输入图像,B称为结构元素。AB由将B平移x但仍包含在A中的所有点x组成。如果将B看作模板,那样,AB则由在平移模板的过程中,所有可以填入A内部的模板的原点组成。如果原点在结构元素的内部,则腐蚀具有收缩输入图像的作用,如图3-1所示。图中结构元素B为一个圆盘。从几何角度看,圆盘在A的内部移动,将圆盘的原点位置(这里为圆盘的圆心)标记出来,便得到腐蚀后的图像。图3-1 腐蚀类似于收缩腐蚀除了可以用填充形式的方程表示外,还有一个重要的表达形式: (3-3)这里,腐蚀可以通过将输入图像平移-b(b属于结构元素),并计算所有平移的交集而得到。膨胀是腐蚀的对偶运算,可以通过对补集的腐蚀来定义。A被B膨胀表示为AB,其定义为: (3-4)其中,Ac表示A的补集。为了利用B膨胀A,可将B相对原点旋转180°得到-B,再利用-B对Ac进行腐蚀。腐蚀结构的补集便是所求的结果。因为膨胀是利用结构元素对图像补集进行填充,因而它表示对图像外部作滤波处理。而腐蚀则表示对图像内部作滤波处理。与腐蚀相应,膨胀也可以表示为: (3-5)因此膨胀可以通过对相对结构元素的点平移输入图像,然后将其取并得到。3.2.2 开运算和闭运算开运算是一个二次运算,利用图像B对图像A作开运算。用符号AoB表示,其定义为: (3-6)与之等效的另一种表示为: (3-7)这个方程表明,开运算可以通过计算所有可以填入图像内部的结构元素平移的并求得。即对每一个可填入位置作标记,计算结构元素平移到每一个标记位置时的并,便可得到开运算的结果。事实上,就是先作腐蚀,后作膨胀运算的结果。闭运算是开运算的对偶运算,定义先作膨胀后作腐蚀。利用图像B对图像A作闭运算表示为A·B,其定义为: (3-8)开运算和闭运算都可以除去结构元素小的特定图像细节,同时不产生全局的几何失真,开运算可以把比结构元素小的突刺滤掉,切断细长搭接而起到分离的作用。闭运算可以融合窄的缺口和细长的弯口,去掉小洞,填补轮廓上的缝隙。二值数学形态学的基本运算之间的组合可以构成许多实用的算法。如二值图像噪声滤除、边界提取、区域填充、区域骨架提取等。另外,对于灰度图像还可以利用形态运算进行形态滤波、边缘检测和图像割等运算。不过,不当的组合会加大计算量,所以对于有实时性要求的图像处理,在满足要求的前提下组合的越精炼越好。本文在车牌定位的研究中,对二值形态学的基本运算也进行