毕业设计(论文)基于神经网络的车牌识别技术研究.doc
摘要:车牌自动识别系统是以汽车牌照为特定目标的专用计算机视觉系统。它的研究主要涉及到了模式识别和人工智能、计算机视觉、数字图像处理、人工神经网络等众多的学科领域。本文通过对车牌识别系统中车牌定位、图像预处理、倾斜矫正、字符分割、字符识别五个关键环节的分析研究,设计了一个完整的车牌识别系统,并在MATLAB环境下进行了仿真模拟。 在车牌的定位部分,本文采用的是基于颜色特征和纹理特征的车牌定位方法。首先将彩色图片从RGB空间转换到HIS空间,利用蓝底白字车牌中蓝色的色度和饱和度S值较大的特点,实现了车牌的粗定位。然后再对粗定位后的图像利用Canny算子进行边缘检测,根据车牌部分图像黑白跳变频率较高的特征,最终实现了车牌的精确定位。 在图像的预处理部分,本文将得到的车牌定位图像进行了灰度化处理,利用Otsu法将灰度图像转换为二值图像,并给出了一种灰度图像增强算法,对采集到的车牌图像进行增强处理;由于在实际中车牌的边框和上下铆钉会对车牌的识别工作形成干扰,因此在该部分中对车牌的边框和铆钉进行了去除。 在获取车辆图像的过程中,由于摄像机和车牌之间角度的变化,经常使所拍摄的车辆图像发生倾斜,导致车牌扭曲和字符变形,给字符分割和字符识别带来极大影响。为此,文章研究了一种基于空间扭曲校正和Hough变换的车牌图像校正方法。 在字符的分割部分,本文依据现行的车牌设计原则,利用改进后的水平投影法,将车牌图像分割7个待识别字符,并对分割后的字符进行了归一化处理。实践证明该方法对解决汉字的不连通问题、字符的粘连问题、噪声的干扰问题以及车牌的前2个字符和后面5个字符之间存在的小圆点问题是行之有效的。 在字符的识别部分,采用改进后的BP神经网络,针对汉字、字母、字母或数字、数字四种不同的识别问题,设计了四种不同的分类器。利用13特征提取法进行特征提取,将其结果作为网络的输入,最后将不同的识别结果组合得到车牌号码。关键字:车牌识别; BP神经网络; 字符识别Abstract:The Vehicle License Plate Automatic Recognition System(VLPR) is computer vision system,which target at license plate as particular target. Its research focuses primarily on Pattern Recognition, Artificial Intelligence(AI), Computer Vision, Digital Image Processing, Artificial Neural Networks(ANN) and some other field of study. In the text, we design a complete VLPR, through analytical study on Vehicle license plate Locating, image preprocessing, slant rectify, character segmentation and character recognition, the five key links of VLPR. And simulate it in the MATLAB environment. In vehicle license plate locating, we adopt VLPR base on colour features and textural features. Firstly, transfer colour pictures from RGB space into HIS space, according to feature which the chroma and saturation of the blue license plate with white words have higher S value. It achieves coarse locating, secondly, using Canny Operator to do an edge detection for the image that be located coarsely. Eventually,achieving the accurate locating, according to the feature which Black-White frequency hopping of license plate image is higher. In image preprocessing, we do a Gray-scale processing for the vehicle license plate locating. Using Otsu method convert gray level image into bianry image. And give the license plate image we collected a enhancement treatment, according to a sort of enhancement algorithm of gray level image. In fact, the frames of license plate and rivets can affect the recognition. So we removed them before test starting. In the process of access to vehicle images, because the changing angle between camera and license plate. It makes the vehicle image that we takes slanted, which lead to twist the license plate and characters and has a serious effect on character segmentation and character recognition. According to above problem, we invent a license plate image corrector method base on spatial warping adjustment and Hough transform. In character segmentation, according to the current license plate design principles, we use improved Horizontal Projection Method, segment license plate image into 7 characters to be recognized. And do a normalization processing for the characters. Practice has proved that it is effectual to the problem that Chinese characters are not connected, character conglutination, noise interference and the dots of between the first 2 characters and the last 5 ones of license plate. In character recognition, targeting at Chinese characters, letters, letters or digits and digits, the four sorts of recognition problem, we adopt improved BP Neural Networks to design four sorts of classifiers. Then use 13 Feature Extraction Method to get the result as network input. Finally, combine the different recognition results to get license plate numbers.Key Words :license plate recognition; BP neural networks; character recognition第一章 绪论1.1课题的背景及研究意义 随着社会经济的不断发展和人民生活水平的普遍提高,整个社会对交通运输的需求日益增加,交通变得越来越拥挤,给社会和环境带来了很大的压力。在此情况下,仅仅依靠大力发展交通设施已不能解决现在已经存在的交通拥挤、交通事故频发、环境污染加剧等问题,尽管在世界上的许多国家依然依靠建设更多的道路基础设施,建立完善的道路网络缓解道路交通增长的需要,但是由于城市空间的严格限制,以及资金和环境方面的压力,建设更多的设施将受到限制。因此保持道路建设和现代管理齐头并进,在发展设施的同时,大力发展现代交通系统(Intelligent Transportation System,简称ITS),已成为亟待解决的问题。智能交通管理系统是21实际道路交通管理的发展趋势,高速路的不断发展和车辆管理体制的不断完善,为以图像识别为基础的智能交通管理系统进入实际应用领域提供了契机。在智能机他管理系统中,汽车牌照系统是一个核心发展方向,汽车牌照识别(license plate recognition简称LPR)系统是一种能够自动实时地检测车辆经过和识别汽车牌照字符的智能系统,它具有广泛的应用前景。其应用场合包括:高速公路、桥梁、隧道等自动收费管理系统;城市交通车辆管理,如超速和违规车辆的识别、纪录,电子警察,海关边境交通监控,以及管制区、国家重要机关部门的进入控制;智能小区、智能停车场管理:存车牌验证,被盗汽车的检测、跟踪,车流量统计等。车牌识别系统作为智能交通的核心,在高速公路、城市道路和停车场等项目管理中占有了举足轻重的作用,因而,车牌是别的研究具有极其重要的现实意义。LPR所涉及的研究方向较多,其主要有数字图像处理、模式识别、神经网络等。智能交通系统在先进的信息服务系统的基础上,提供先进的交通管理系统,提高公共交通的安全性、可靠性、高效性,为大众提供更优质的公共交通服务。智能交通系统提供了无人值守的电子收费系统,可以实现在收费道、停车场等场所的无人管理、不停车、无需票据的服务,减少传统管理方式引起的延误,提高各种交通场所的通行能力和运行效率,同时也可以为系统管理提供实时、准确地叫哦哪该数据。完善智能交通系统还应该包括紧急事件处理系统,提供道路交通对各种突发事件的预警和快速反应能力。总的来说,智能交通系统主要应该具备感知能力与自适能力、记忆与逻辑思维能力、表达能力和判决能力等特点。智能交通系统能为出行者提供信息服务、快速应急服务、安全行车服务、预警机制减少交通阻塞、高质量低成本的运输及方便快捷的支付手段。1.2车牌识别系统的概述 车辆牌照识别系统是一个基于数字图像处理和字符识别的智能化交通管理系统,该系统通过视频采集接口采集摄像头摄入包含车牌的视频图像,再对动态采集到的图像进行预处理以克服图像干扰,改善识别效果,接着在动态采集到的图像中自动找到车牌的位置也就是车牌定位,再分割出车牌字符形成一个个大小相同的单个字符,其次对车牌进行二值化,最后把大小归一化好的字符输入字符识别模块进行识别,它主要涉及到图像采集、图像预处理、车牌定位、字符分割、字符识别等主要环节,其流程图如图1-1所示:车辆图像采集图像预处理车牌定位字符分割字符识别图1-1 牌照识别流程图车辆图像采集主要是利用摄像机室外拍摄车牌图像,并且存在许多干扰,如天气、背景因素、车牌磨损、污染、图像中车牌倾斜等因素。为了减小干扰对车牌识别产生误差,就必须涉及到图像处理技术(灰度化、图像滤波、二值化等);车牌定位就是从含有车牌的车牌图像中提取出车牌区域,也是车牌识别系统的关键点,一个难点。车牌定位的准确与否直接影响到后面的步骤。目前已经有许多牌照定位的方法,如灰度特征法、颜色特征法、几何特征法、数学形态学方法、颜色和纹理分析结合方法、线模板角检测方法、综合多种特征的车牌定位算法。字符分割的任务就是把车牌图像中的每个字符从整个图像中分割出来,使其成为单个字符。只有从车牌图像中准确的切割出单个车牌字符出来,并进行归一化,才能为之后的神经网络或模板匹配识别器进行识别做好准备工作。字符分割常用算法主要有水平投影法、模板匹配法、聚类分析法。 车牌字符识别实际上就是对车牌上的汉字、字母、数字进行准确确认的过程,关键技术就在于字符特征的选择和提取,它基本上决定了识别系统的性能和识别精确度,甚至还可能影响到整个系统的识别的成功与否。字符识别模块流程如图1-2:单个字图像输入特征选择识别字符输出图1-2 字符识别模块流程图由于汉字结构比数字、字母结构复杂,而在车牌图像采集有时会有严重污染、变形、模糊、粘连、断裂的字体出现,如何正确地识别出来成为一个难点。目前识别方法采用多特征(字符结构特征和统计特征)和多分类方法(模板匹配、神经网络),并使用多种形式混合来解决这个问题。现在已经有了一些比较成熟的方法,文献4提出了一种基于模板匹配的车牌识别方法,只需提取字符整体特征,避免了字符的分割,能有效地完成降低解析度和模糊的车牌字符识别,但缺点是识别时间太长。文献5提出了基于一种模板匹配和神经网络的车牌识别方法,该方法集成了模板匹配识别车牌字符和神经网络识别车牌字符的各自优势。对于字符可单独分割出来的一类车牌和字符不可分割或分割困难的另一类车牌,分别采用神经网和加权模板匹配方法进行识别。 神经网络是一种非线性动力系统,它所具有的学习算法能使其对事务和环境具有很强的自学习能力,很强的鲁棒性,它可以通过不断的自我学习,自我试验,纠错,使信号处理过程更接近于人的思维活动。它可模拟人脑处理不完整的,不准确的,甚至非常模期的信息,并能联想记忆,从部分信息重新获得全部的信息。经过训练可有效地提取信号、语间、图像、声纳等感知模式的特征并能解决现有启发式模式识别系统不能很好解决的不变量控测、自适应、抽象等问题。人们根据生物神经元的结构与工作原理,得出不同结构的神经网络模型,比如BP神经网络和脉冲耦合神经网络。脉冲耦合神经网络模型是1987年ECKHORN根据猫的大脑视觉皮层同步脉冲发放现象,提出了展示脉冲发放现象的连接模型,对其进行改进得到了脉冲耦合神经网络基本模型。脉冲神经网络模型对周围信号的处理能力就更强,对环境的适应能力理好;另外脉冲耦合神经网络为单层模型号神经网络,不需要训练过程即可实现模式识别、图像分割和目标分类等,因此非常适合于实时图像处理环境。 因脉冲神经网络模型用于特征提取时,具有平移,旋转,尺度,扭曲等不变性,同时它还具有很好的抗噪性,它具育提取图像形状,纹理,边缘的属性,并且非常适应实时图像处理环境。在此本文将探讨脉冲耦合神经网络应用在车牌字符识别环节中的特征提取,并且BP神经网络作为识别器的研究,试法进一步提高车牌字符识别率。1.3本文研究的主要内容 不同学科之间的相互渗透和结合是科学发展的趋势,车牌字符识别技术涉及到了数字图像处理、机器视觉、模式识别、神经网络等方面的知识。本文研究的主要内容是对数码相机拍摄的二维车牌图像进行基于神经网络的车牌字符识别系统的研究与开发,并重点研究脉冲耦合神经网络和BP神经网络在车牌自动识别系统中的应用。车牌字符识别系统的总体设计方案如图1-3所示,在图像预处理、车牌定位、字符分割关键阶段中,将结合各种先进技术和算法进行充分整合优化得到各个阶段的详细设计方案。图像预处车牌定位字符分别特征提取汉字神经网络数字神经网络字符输出图1-3 车牌字符识别系统的总体设计方案第二章车牌图像预处理 车牌图像样本大多是通过CCD摄像机拍摄获得,由于天气、照明、车辆位置的不同都会对图像质量造成不良的影响,如灰度分布不均匀、对比度低、噪声干扰等,这些不利因素将直接影响到后续的车牌定位分割和识别工作的精确度,因此需要利用数字图像处理的相关知识,对原始汽车图像进行预处理增强图像质量。数字图像处理技术是图像检测和识别的前提,车牌图像预处理分成以下几个步骤研究: (1)灰度变换。由于车牌自身的损坏、污点和天气影响使彩色图像不容易分割,因此需要将彩色图像转化为灰度图像。 (2)图像滤波。为了消除或尽量减少噪声,改善图像的质量,应对图像进行滤波处理。 (3)二值化处理。二值图像是指每个像素不是黑就是白,其灰度值没有中间过渡的图像。图像的集合性质只与像素值为O或255的点的位置有关,不再涉及像素的多级值,使处理变得简单,而且数据的处理和压缩量小 (4)形态学滤波。通过设置大小不同的结构元素,应用不同的操作进行处理,达到滤除噪声的最佳效果。 (5)边缘检测。边缘检测在图像处理与计算机视觉中占有特殊的位置,它是底层视觉处理中重要的环节。边缘检测的实质足检测图像特性发生变化的位置,为下一步处理做铺垫。2.1灰度化 通过摄像头采集到的车牌图像是24位的彩色位图,考虑到图像文件的存储量和处理图像需要占用大量的系统资源,所以第一步要进行图像灰度变换,图像灰度化有各种不同的算法,比较直接的一种是给原像素的RGB值各自加权一个系数,然后求和,作为新灰度值。基于此原理,首先逐个将像素颜色分解成3个原色灰度R、G、B,然后考虑具有相同灰度值的不同原色对视觉亮度的反应不同【51】,将三原色灰度按照如下比例公式: Y =0.299*R+0.587*G+0.114*B (2-1) 在实际计算时,可按下式进行: Y=0.30*R+0.59*G+O.11*B (2-2) 计算得到一个新的灰度值,用这个值分别作为三原色的灰度合成一个新颜色。通过上述方法将24位彩色图像变换后的效果图如图2-1所示: (a)灰度变换前 (b)灰度变换后图2-12.2二值化处理 二值图像是指整幅图像内仅有黑、白二值的图像,在它们之间不存在其它灰度层次的变化。二值化算法又称阈值算法,目的是找出一个合适的阈值将待研究的车牌区域划分为前景和背景两部分。二值化后的车牌要能再现原字符图像,基本不出现笔画断裂和粘连现象,尽量不丢失原字符的特征。另外二值化算法可以用于车牌定位过程中精确定位车牌的上下左右边界。 常用的二值化算法有基于灰度的二值化和基于彩色的二值化。基于灰度的二值化主要有全局动态二值化和局部自适应二值化;基于彩色的二值化主要有基于HSV(Hue Saturation Value)空间的彩色二值化。本文首先提取有关色彩的信息,然后对灰度图像进行二值化处理。 图像二值化的关键在于阈值T的选取,根据阈值T来区分图像中的对象和背景。设原始灰度图像为f(x,y),变换过后的二值图像为g(x,y),则二值化的过程表示为: (2-3) 根据阈值选取情况,分为全局阈值、局部阈值和动态阈值。全局阈值法根据图像的直方图或灰度空间分布确定一个阈值,实现灰度图像到二值图像的转化;典型的全局阈值法包括Qstu方法,最大熵方法等;全局阈值算法简单,对于目标和背景明显分离、直方图分布呈双峰的图像效果良好,对那些由于光照不均匀、噪声干扰较大等原因使直方图分布不呈双峰的图像效果明显变差。局部阈值法通过定义考察点的领域,并由领域计算模板,实现考察点灰度与领域点的比较;非均匀光照条件等情况虽然影响整体图像的灰度分布,但是对局部图像的性质没有什么影响,从而局部阈值法比全局阈值法有更广泛的应用;如Bernsen算法是一种典型的局部阈值法;光照不一致的情况,如文献提出一种局部二值化的适应算法,应用车牌字符自身布局的先验知识来进行区域门限校正,取得了比较理想的实验效果,与以往的逐点进行二值化的方法相比,这种方法大大提高计算速度,因而在处理大规模的图像数据时能起到更明显的效果。根据上述两种方法的优缺点,有效结合使用是一种不错的方法。自适应二值化方法的动态阈值法是利用像素自身及其领域灰度变化的特征,此算法充分考虑每个像素领域的特征,所以能够更好的突出背景和目标的边界。 由于拍摄受外界因素影响,车牌直方图中两峰之间的谷不明显,导致最佳分割阈值不好确定。鉴于这种情况,采用模糊C均值算法进行二值化。FCM(FlowCytometry)算法通过对目标函数 (2-4)的迭代优化对数据集进行模糊分类。其中,n是数据的个数,c是类别数,m是加权指数,u表示数据x属于类别c的程度,d表示数据x和类别c的聚类中心之间的距离。 二值化后的车牌周围有一个长方形的边框,在字符识别中经常被认为是字符的一部分而影响识别效果。因而使用水平和垂直投影来检测并取出周围的边框。2.3图像增强 由于光照影响、照相机曝光不足以及动态范围太窄等原因,车牌图像往往会产生对比度不足的弊端,使图像细节分辨不清,如果不经过处理必然会影响识别率。图像增强的方法有两类:一类是空域增强法,包括灰度变换、直方图均衡化和邻域平均法;另一类是频域增强法,主要有高通滤波、低通滤波和带通滤波等。鉴于计算速度上的考虑,本文采用灰度拉伸和邻域平均法来增强对比度,利用空间域的中值滤波技术来消除噪声干扰。2.3.1灰度拉伸 许多拍摄的图像中,灰度级集中在很小的区域内、对比度不强,影响人和机器对图像的处理。此时可以利用灰度的线性拉伸将灰度范围拓展到0-255的灰度范围。灰度拉伸和灰度的线性变换有点类似,都用到灰度的线性变换,但拉伸不是完全的线性变换,而是分段进行线性变换,它的拉伸范围和拓展程度可以自由选择。灰度拉伸的函数表达式如式(2-5)。 (2-5)变换函数的运算结果是将原图在xl和x2之间的灰度拉伸到y1和y2之间。如果一幅图像灰度集中在较暗的区域而导致图像偏暗,可以用灰度拉伸功能来拓展(斜率>l)物体灰度区间改善图像;同样如果图像灰度集中在较亮的区域而导致图像偏亮,也可以用灰度拉伸功能来压缩(斜率<1)物体灰度区间改善图像质量。关键是如何选取适当xl、x2和y1、y2使得对比度增强明显。xl、x2的选取有多种方法,总的原则选取灰度最为集中一段的左右端点。可以利用灰度直方图,xl、x2分别选取为直方图的最大波峰两侧波谷所对应的灰度值;也可以固定灰度步长进行扫描,对步长内的像素点个数累积求和,找出最大值,xl、x2分别选取为取得最大值的灰度范围的左右端点。本文xl、x2选取为两大谷底对应的灰度值、y1=xl/2、y2=3x2/2,将高灰度区和低灰度区压缩、中间灰度区域拉伸,取得了很好的效果。其处理效果如图2-2所示: (a)灰度拉伸前 (b)灰度拉伸后图2-2 灰度拉伸效果图2.3.2邻域平均法滤波 为了消除图像中的噪声,直接在空间域上对图像进行平滑滤波。它的作用是模糊和消除噪声。空间域的平滑滤波一般采用简单平均法进行,即求邻近像素点的平均亮度值,称为邻域平均法。邻域的大小与平滑的效果直接相关,邻域越大平滑的效果越好,但邻域过大平滑会使边缘信息损失的越大从而使输出的图像变得模糊,因此需要选择合理邻域的大小,实际中一般采用邻域窗口大小为3x3。 图像由灰度值相近的小块组成,相邻像素间存在很高的空间相关性,噪声是独立的,我们用像素预定邻域内的各像素的灰度平均值代替该像素原来的灰度值,就可以实现图像的去噪。最简单的局部平滑算法称非加权邻域平均,它均等地对待邻域中的各像素,即把各个像素灰度的平均值作为中心像素的输出值。设有一幅N×N的图像,用非加权邻域平均法所得图像为,则有 (2-6)上式中,=0,1N-1;为不包括(x,y)的邻域中各像素的集合,即去心邻域;膨表示集合S内像素的总数。典型的邻域有两种:四邻域和八邻域,模板分别为: 如果图像中的噪声是随机不相关的加性噪声,窗口内各点噪声是独立分布的,经过上述平滑后,信号与噪声的方差比可提高M倍。这种算法简单,处理速度快,但它的主要缺点是在降低噪声的同时使图像产生模糊,特别在边缘和细节处。随着邻域的增大增强了去噪能力,但模糊程度更严重。为克服简单邻域平均法的弊病,目前提出保持边缘、保持细节的邻域平均算法。出发点都集中在如何选取邻域的大小、形状、方向、参加平均的像素个数以及邻域中各像素的权重系数等。 邻域加权平均法是对非加权邻域平均法的一种改进。邻域加权平均的基本思想是:离中心点越近的点对该中心点的影响越大,因此在求平均值时应赋予较大的权重,它用窗口内像素灰度级加权均值来取代窗口中心像素原有灰度级,公式如下: 为加权系数矩阵。 邻域平均法是一种空间域的低通滤波。由信号频谱分析知识可知:信号变化较慢的部分在频率域属于低频部分,信号变化较快的部分在频率域属于高频部分。对于图像而言,它的边缘和噪声干扰附近的灰度变化较大,属于频域中的高频分量,因此采用低通滤波去除噪声。频域的滤波是乘积运算,变换到空间域为卷积运算,对一幅灰度图像的空间域滤波是进行二维离散卷积运算,把用于二维离散卷积计算的邻域称为冲激响应阵列、卷积阵列、卷积模板。2.3.3中值滤波 中值滤波是一种非线性滤波,也是一种邻域运算,类似于卷积。中值滤波的计算不是加权求和,是把它邻域内的所有像素按灰度值进行捧序,取该组的中间值作为邻域中心像素点的输出值。中间值取法如下:当邻域内像素个数为奇数时,取像素灰度值捧序后的中间值;当邻域内的像素个数为偶数时,取捧序后的中间两像素灰度值的平均值。邻域可以选择不同大小和形状的窗口,如线状、方形、十字形、圆形、菱形等。不同形状的窗口产生不同滤波效果,使用中必须根据图形的内容和不同的要求加以选择。从以往的经验看:方形或圆形窗口适宜外廓线较长的图像,十字形窗口对有尖顶角状的图像效果好。使用中值滤波去除噪声的方法多种多样,十分灵活。一种方法是先使用小尺度邻域,后逐渐加大邻域尺寸进行处理;另一种方法是一维滤波和二维滤波交替使用。此外还有迭代操作,对输入图像反复进行中值滤波,直到输出不再有变化为至中值滤波的突出优点是在消除噪声的同时,还能防止边缘模糊。如果图像的噪声多是孤立的点,这些点对应的像素又很少,而图像则是由像素较多、面积较大的块构成,中值滤波效果很好。 在一维图像下,中值滤波是一个含有奇数个像素的滑动窗口,经过大小排序后,将窗口中各点灰度的中间值来代替指定点的灰度值,计算公式如下: (2-8)其中,v= (L-1)2,L为窗口长度,表示取窗口中值。推广到二维,这时取某种形式的二维窗口,将窗口内的像素排序,生成单调二维数据序列。类似于一维,二维中值滤波为。 邻域平均法滤波和中值滤波处理车牌图像的效果如图2-3、2-4所示: 图2-3 邻域平均法滤波 图2-4 中值滤波比较可知,邻域平均法滤波减少了部分噪声,改善了图像质量,同时也产生了图像细节的损失,图像中字符变得模糊;而中值滤波不仅减少部分噪声干扰,而且没有使边缘模糊。因此图像滤波选择中值滤波。2.4数学形态数学形态学广泛应用于图像处理和计算机视觉领域,它能够进行各种几何参数的间接测量,反映图像的体视性质,适于描述图像的随机性质。数学形态学基于形状集合理论而提出,运算本质上是并行的,便于并行处理实现。用数学形态学算子对图像进行滤波,不需计算每点的局部特征,速度快且抗噪能力比较强。2.4.1数字形态学概述数学形态学(Mathematical Morphology,简称形态学)是研究数字图像形态结构特征的理论,它通过对目标图像的形态变换实现结构分析和特征提取,利用形态学作为工具从图像中提取对于表达和描述区域形状有用的图像分量,比如边界、骨架以及凸壳等。形态学用于图像预处理或后处理,如形态学滤波、细化和修剪。下面将介绍形态学在滤波方面的应用。 数学形态学是一种非线性滤波算法,Minkowski结构和、差运算,即形态膨胀和腐蚀是数学形态学的基础。结构元素是数学形态学中的关键概念,是一个可以在图像上平移、且尺寸比图像小的集合。结构元素起着主、客观之间界面的作用,可以方便的按照目的选用不同形状和尺寸的结构元素,来度量和提取图像中对应的形状,达到对图像进行分析和识别的目的。数学形态学运算是将结构元素在图像范围内平移,同时施加交、并等几何运算。数学形态学可以用来解决抑制嗓声、边缘检测、特征提取、图像分割、形状识别、纹理分析、图像恢复与重建和图像压缩等问题。最初,数学形态学是具有一定约束条件的集合变换,称为连续形态学;后来发展为基于离散点集的离散形态学。从研究对象看,形态学由最早的二值形态学扩展为灰度多值形态学。近年来,数学形态学与其它相关学科的渗透和融合,使数学形态学出现许多新的分支,如排序统计学的注入,使数学形态学发展成为顺序形态学(Order Statistical Morphology),它研究的对象是离散多值信号,主要运算是局部的捧序统计运算,模糊逻辑与数学形态学的结合出现了模糊形态学(Fuzzy Morphology),它是将模糊集合引入到形态学运算中,从而构成模糊形态变换处理图像信号。形态学与神经网络的相互融合构成了形态神经网络(MNN)。经典神经网络中每个节点的信息组合是通过相关节点的各个响应值与权值相乘,再将乘积结果相加完成;而在形态神经网络中,节点的信息组合是由相加和取极值运算完成的。软数学形态学也是数学形态学发展的一个重要分支,用排序加权统计方法代替最小、最大法,结构元素由核心和软边界两大部分组成,具有强抗噪干扰能力,对加性噪声和微小形状变化不敏感。Goustias提出的形态小波是一种非线性的多分辨率分析方法,兼顾数学形态学和小波变换的优点,具有更好的多分辨率分析特性和更好的抗噪声性能。数学形态学已经成为图像处理理论的一个重要知识,广泛应用到图像处理的各个领域。2.4.2影态学滤波的基本操作 本文针对二值图像进行形态学滤波处理。在二值图像中,所有黑色像素的集合是图像完整的形态学描述,采用从小到大不同的结构元进行处理达到滤除噪声的目的。式(2-9)到式(2-12)给出了二值形态变换的基本变换公式,基本形态变换包括腐蚀、膨胀、开操作和闭操作。对图像先腐蚀后膨胀,称开操作;对图像先膨胀后腐蚀,称闭操作。 设和均为二维离散空间上的两个离散函数,其中为图像位于(x,y)力处像素的灰度值,为具有一定形状和大小的结构元素,则对灰度图像膨胀与腐蚀运算定义如下: 膨胀: (2-9) 腐蚀: (2-10)结构元素对灰度图像进行形态开运算和闭运算定义如下: 开操作: (2-11) 闭操作: (2-12)2.4.3实验结果图2-5给出了膨胀、腐蚀、开、闭运算的实例。对二值图像(a)分别进行膨胀、腐蚀、开操作和闭操作的结果如图(b)至图(e)所示: (a)原始二值图像 (b)膨胀后图像 (c)腐蚀后图像 (d)开运算后图像 (e)闭运算后图像 (f)形态学滤波结果 图2-5 二值图像形态学滤波实验结果表明:膨胀使图像扩大而腐蚀使图像缩小;开操作使对象的轮廓变得光滑,断开狭窄的间断和消除细的突出物;闭操作通常弥补狭窄的间断和长细的鸿沟,消除小的孔洞,并填补轮廓线中的断裂。通常经过一次处理的图像都不符合处理标准,根据各种形态学滤波的性质,采用膨胀、腐蚀、开操作和闭操作相结合的综合操作,最后得到的车牌结果如图2-5(f)所示。2.5 Sobel算子边缘检测 图像边缘是图像的基本特征之一,它包含对人类视觉和机器识别有价值的物体图像边缘信息。边缘是图像中特性分布的不连续处,图像周围特性有阶跃变化或屋顶状变化的像素集合。图像边缘存在于目标与背景、目标与目标、基元与基元的边界,它标示出目标物体或基元的实际含量,是图像识别信息最集中的地方。 经典的边缘提取方法是考察图像的每个像素在某个领域内灰度的变化,用边缘邻近一阶或二阶方向导数变化规律的方法进行检测边缘,这种方法称为边缘检测局部算子法。 边缘增强是要突出图像边缘,抑制图像中非边缘信息,使图像轮廓更加清晰。边缘占据图像的高频成分,边缘增强属于高通滤波。边缘的种类分为两种:一种称为阶跃性边缘,它两边的像素灰度值有显著不同;另一种称为屋顶状边缘,它位于灰度值从增加到减少的变化转折点。对于阶跃性边缘,二阶方向导数在边缘处呈零交叉;而对于屋顶状边缘,二阶方向导数在边缘处取极值。如果一个像素落在图像中某个物体的边界上,那么它的领域将分成一个灰度级的变化带。对这种变化最有用的两个特征是灰度的变化率和方向,它们分别以梯度向量的幅度和方向来表示。 边缘检测算子检查每个像素的领域并对灰度变化率进行量化,包括方向的确定。通常使用基于卷积算子求卷积的方法,由于Sobel算子提取的轮廓失真最小,本文采用Sobel算子边缘检测。Sobel算子是一种将方向差分运算与局部平均相结合的方法。该算子是在以为中心的邻域上计算x和y方向的偏导数,即 (2-13)上式应用邻域图像强度的加权平均差值,其梯度大小为 (2-14)或取绝对值 (2-15)Sobel边缘检测的卷积算子为: 上面两个卷积算子对图像运算后,代入(2-13)式,求得图像的梯度幅度值,然后选取适当门限,作如下判断:如果,则为阶段状边缘点,为二值边缘图像。Sobel算子容易在空间实现,Sobel边缘检测器产生较好的边缘检测效果,同时引入局部平均受噪声影响也比较小。当使用大的邻域时,抗噪声特性会更好,但会增加计算量,兵器得到的边缘较粗。 So