基于BP网络的车牌字符识别毕业设计(论文).doc
-
资源ID:3938264
资源大小:2.38MB
全文页数:44页
- 资源格式: DOC
下载积分:8金币
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
基于BP网络的车牌字符识别毕业设计(论文).doc
(2013届)本科毕业设计(论文)资料题 目 名 称: 基于BP网络的车牌字符识别 学 院(部): 专 业: 学 生 姓 名: 班 级: 学号 指导教师姓名: 职称 职称 最终评定成绩: 湖南工业大学教务处 2013届本科毕业设计(论文)资料第一部分 毕业论文(2013届)本科毕业设计(论文)学 院(部): 电气与信息工程学院 专 业: 电子信息工程 学 生 姓 名: 班 级: 学号 指导教师姓名: 职称 职称 最终评定成绩 2013年6月 摘 要基于BP网络的车牌字符识别是一门对车牌字符识别的技术,它的产生是为了完善智能交通系统,使得交通系统更具有信息时代意义。本文利用BP神经网络与图像处理技术相结合的方法,将BP神经网络应用到车牌字符识别中。针对车牌图像的处理的过程包括:车牌图像去噪、车牌图像灰度化、车牌图像二值化、车牌字符图像分割、车牌字符图像归一化、车牌字符图像特征值提取。前面五个过程是为了保证字符信息能更好的体现出来有利于将特征值得提取。BP神经网络通过对组建的车牌字符库的学习后才会具有识别功能,然后将车牌字符图像提取到的特征值送入到BP神经网络中就能识别出来。通过实验证明了通过上述的过程是能够将车牌字符识别出来,在这个识别过程中对于BP网络训练的收敛性是十分重要的,本文认为可以通过修改隐含层节点的个数、训练函数和激发函数来完成BP网络的训练以使得BP神经网络具有识别功能。对于识别的关键部分在于对特征值的提取,只有采可靠的提取办法才能保证字符信息部丢失这样才有利于识别。关键词:车牌字符识别,BP神经网络,特征值提取ABSTRACTBP network based license plate character recognition is one pair of license plate character recognition technology, which is produced in order to improve intelligent transportation system, making the transport system more meaningful information age.In this paper, BP neural network and image processing technology, a combination of methods will be applied to the license plate BP neural network character recognition. For the license plate image processing process includes: license plate image denoising, gray plate image, license plate image binarization, license plate character segmentation, license plate character image normalization, license plate character image feature extraction. During the previous five character information in order to ensure better reflected the benefit is worth the feature extraction. Through the formation of BP neural network library for license plate character recognition function after learning will have, and then extract the license plate character image characteristic value fed to BP neural network can be identified.The experimental results show the process by the above license plate characters can be identified, in this process for identifying convergence BP network training is very important that this can modify the number of nodes in the hidden layer, training function and stimulate function to complete BP network training to enable BP neural network has recognition. For the identification of the key part of the feature value extraction, mining only reliable way to ensure the character information extracting unit lost that help identify, extract the paper also proposed several ways.Keywords: LPR,BP neural network,Feature extraction目 录摘 要IABSTRACTII目 录III第1章 绪论11.1 车牌识别技术11.1.1 车牌识别技术11.1.2 智能交通系统21.2国内外研究现状41.3本文研究内容4第2章 字符识别方法62.1 车牌图像预处理62.1.1 车牌规律62.1.2车牌图像去噪72.1.3车牌图像的灰度化和二值化72.2 字符分割92.2.1 边缘检测102.2.2 字符切割112.2.3 字符图像归一化122.2.4字符特征值提取122.3 BP神经网络142.3.1 BP网络152.3.2 BP网络的模型结构152.3.3 BP网络算法17第3章 基于BP网络的字符识别203.1 车牌图像预处理实现203.1.1 车牌图像滤波实现203.1.1 灰度化技术及二值化实现203.1.2 车牌图像分割实现233.1.3 归一化和字符特征提取实现253.2 字符库与BP网络的建立273.3 BP网络字符识别31第4章 结 论33参考文献I致 谢II第1章 绪论 1.1 车牌识别技术1.1.1 车牌识别技术二十一世纪是一个信息化时代,是经济和科技飞速发展的时期,智能系统被广泛应用到人们生活当中。国民经济快速的发展在当今许多的人拥有了私家车,这使得城市交通问题日益严峻起来1。对于交通的管制也不能全靠交警来完成,这时智能交通系统便产生了。智能交通系统是以信息技术为代表,融合先进的电子技术、控制技术、传感器技术以及计算机处理技术等,应用于各种交通场合的综合管理系统。智能交通系统中包括了许多部分,而其中最为关键的部分就是要能对车辆进行识别。车辆的信息主要在于它的车牌,车牌就是车辆的身份证,每辆车都有唯一对应的车牌号码,通过车牌号码就了解到车辆的信息。智能交通系统要对车牌进行识别就是要让计算机能自动识别出车辆的车牌,这个识别过程有许多方法,其中最简单的办法就是将已有的车牌号码存入到计算机中,再将抓拍到的车牌号码进行对比。这种办法需要计算机有大量的存储空间和全部的车牌模板,并且对抓拍到的车牌图像要求比较高,否则是很难识别出来的。在现代神经网络算法得到广泛应用,这种算法是根据生物神经网络而建立起来的模型能较好的实现人类存储知识及处理信息的技能,使得系统可以模拟人类思维。神经网络中BP网络是其中应用比较广泛技术较为成熟的网络,BP网络在如今已被广泛的应用各个行业领域,它优越性主要体现于四个方面:函数逼近、模式识别、分类、数据压缩。由于在各个行业领域它已经得到了生活应用,所以BP网络技术也相对成熟,而且BP网络的变化形式也多种多样,采用BP网络作为车牌字符识别技术是一个相对合理选择2。对于车牌识别还有一个较为关键的问题,经过统计发现车牌字符是有规律的。在存储空间上把车牌字符分割出来就可以大大减小存储空间,这是由于车牌字符的组成的原因。对于识别方面分割字符必须比较精准才能使得识别正确,所以对于字符图像的切割也要选取较为合理。而对于图像的切割就包含了一列的图像处理问题,图像处理技术的好坏是直接影响到识别的准确性的3。所以基于BP网络的车牌字符识别不仅仅是对BP网络进行研究也要对图像处理技术进行研究,这样才能使得计算机能准确的识别出车辆的车牌。车牌识别技术是现代智能交通系统重要组成部分,其应用十分广泛。它以计算机视觉处理、数字图像处理、模式识别等技术为基础,对摄像机所拍摄的车辆图像或者视频图像进行处理分析,得到每辆车的车牌号码,从而完成识别过程。通过一些后续处理技术其可以实现停车场出入口收费管理、盗抢车辆管理、高速公路超速自动化管理、闯红灯电子警察、公路收费管理等等功能。对于维护交通安全和城市治安,防止交通堵塞,实现交通全自动化管理有着现实的意义车牌识别技术实现的方法主要是模板匹配法和人工神经网络法,模板匹配法需要实际得到的车牌字符图像与标准库的车牌字符图像完全达到匹配要求才能识别。而人工神经网络它是具有一定的容错能力的,所以它相对于模板匹配法精度要求每那么高,但是实现比较复杂。识别方法的好坏在于它们的识别率和识别速度。识别技术是智能交通系统的关键技术,是现在智能交通系统主要研究的对象。识别技术不仅是在智能交通系统中被用到,在其它领域也是被广泛应用,研究这门技术对社会的发展起着重大作用。1.1.2 智能交通系统智能交通系统起源于二十世纪六七十年代的交通管理计算机实施。美国早在1989年制定了智能交通系统发展计划“IVHS战略”4。 我国部分学者于1994年参加了在法国巴黎的第一届智能交通系统世界大会,为我国智能交通系统的发展揭开了序幕。交通部公路科学研究所于1996年开始了交通部重点项目智能运输系统发展战略研究工作,在1999年正式出版发行智能运输系统发展战略研究一书。1999年,交通部公路科学研究所组织全国数百名专家学者投入到“九五”国家科技攻关重点项目中国智能交通系统体系框架研究工作,于2001年把课题完成,并且顺利通过国家科技部验收,2002年发行中国智能交通系统体系框架一书。2000年,我国国家科技部主办北京第四届亚太地区智能交通年会,并且得到全国ITS协调指导小组办公室协助。同年,科技部与国家计委、公安部、经贸委、交通部、铁道部、建设部、信息产业部等相关性部门的充分协商和酝酿的基础上,建立了发展中国智能交通系统的政府协调领导机构全国智能交通系统协调指导小组及办公室,并成立了智能交通系统专家咨询委员会。2002年4月科技部正式批复“十五”国家科技攻关“智能交通系统关键技术开发和示范工程”重大项目正式实施,北京、上海、天津、重庆、广州、深圳、中山、济南、青岛、杭州十个城市作为首批智能交通应用示范工程的试点城市。2002年9月,由中国科技部和交通部共同举办的“第二届北京国际智能交通系统技术研讨暨技术与产品展览会”在北京举行。2003年11月,科技部马颂德副部长第一次率中国政府代表团参加在西班牙马德里举办的第十届智能交通系统世界大会,科技部联合交通部、建设部、公安部和北京市政府联合申办“2007年第十四届智能交通系统世界大会”获得成功,标志着中国的智能交通系统建设将在更加开放、竞争与合作并存的环境中加速发展。2004年10月,科技部第一次大规模组团参加第十一届在日本名古屋举办的第十一届智能交通系统世界大会,中国政府展览团在智能交通系统大会的首次展览,获得成功。2007年,第十四届智能交通世界大会在北京展览馆举行。大会展示了中国多年来各部门、各地区在ITS领域所取得的成就,并加强了中国在智能交通系统领域的对外交流。2012,由北京交通大学主办,香港交通运输协会协办的2012年智能交通系统国际研讨会在中苑宾馆举行。本次国际会议旨在加强智能交通系统领域专家学者的学术交流,进一步加深我国与其他国家和地区在智能交通系统领域的合作与研究,扩大我国交通科学研究在国际上的影响。智能交通系统可划分成四个子系统。1)车辆控制系统指辅助司机驾驶车辆系统又称为替代司机智能驾驶车辆的系统。该系统是经过对汽车前部和旁侧安装的雷达或红外探测仪,可以准确地计算出车辆与障碍物之间的距离,遇危机情况,车辆中的电脑能迅速地发出警报或采取措施避让,而且可以根据路面情况自行调节行车速度,俗称“智能汽车”。2)交通监控系统类似于机场的航空控制器,它将在道路、车辆和驾驶员之间建立快速通讯联系。将道路的情况马上通知给驾驶员使得他能选择一条好的道路走。3)运营车辆高度管理系统通过车辆中的电脑、高度管理中心计算机与全球定位系统卫星联网,实现驾驶员与调度管理中心之间的双向通讯,来提供商业车辆、公共汽车和出租汽车的运营效率。该系统通讯能力极强,可以对全国乃至更大范围内的车辆实施控制。4)旅行信息系统是一种能及时给外出旅行人员提供交通信息的系统。给这个系统提供信息的媒介是多种多样的,如电脑、电视、电话、手机、路标、网络等,任何一种方式都可以。不管你是在哪里,只要采用其中任何一种方式,你都能从该系统中获得所需要的信息。有了这个系统,外出旅行者就可以获得许多有效的信息对自己的行程安排可以好好的规划。而在本文中主要是研究智能交通系统中交通监控系统中的一小部分,主要是实现基于BP网络的车牌字符识别,能进一步完善这个交通监控系统。智能交通监控系统是通过视频监控将视频监控区域的情况传输到指挥中心,使得管理人员能对监控区域的交通情况得到全面的了解,而且能根据区域内的交通情况,计算机进行自动处理。智能化的交通监控系统就相当于监控区域内站有交警一样,能够即使对一些交通问题进行处理。智能交通监控系统采用识别技术进行监控,有异常发生时就会自动通知交通人员,交通人员也可以及时得到车辆在监控区域内的基本情况,调整信号灯或者通过其他手段来疏导交通,改变交通流量的分布,已达到缓解交通堵塞的目的。总而言之,智能交通监控系统可以直观地监控交通肇事逃逸案件的全过程。协助办案民警全面、直观了解交通事故发生过程,及时掌握逃逸车辆车型、颜色、碰撞损坏部位,为客观查证案发当时情况,追究事故责任提供最直接的依据。1.2国内外研究现状从制定智能交通系统发展计划“IVHS战略”开始人们就对对车牌识别技术进行研究,这是因为车牌识别是智能交通系统必不可少的技术。至今,智能交通系统一直在被研究着,说明车牌识别技术也没有停止研究过。到20 世纪 90 年代,随着电子技术的高速发展,计算机性能得到很大的提升,车牌识别技术被系统化地研究。如YuniaoCul提出了一种车牌识别系统,在车牌定位以后,利用马尔科夫场对车牌特征进行提取和二值化,对样本的识别达到了较高的识别率。EunRyung等利用图像中的颜色分量,对车辆牌照进行定位识别,其中提到了三种方法:1)以Hough变换为基础的边缘检测定位识别;2)以灰度值变换为基础的识别算法;3)以HLS彩色模式为基础的车牌识别系统,识别率分别为81.25%、85%、91.25%。日本对车牌图像的获取也做了大量的研究,并为系统产业化做了大量工作4。目前,国内外已研制出相当一些实用的车牌识别系统,并已在电子收费、车流监控、出入控制、超速检测、移动稽查等场合进行应用,取得了一定的成就,但与人们所期望的需求目标仍有一定差距10。我国较成熟的产品有中科院自动化所汉王公司的“汉王眼”,深圳市科安信实业有限公司以及中国信息产业部下属的中智交通电子有限公司等。香港的亚洲视觉科技有限公司研发的慧光车牌号码自动识别系统,能够自动侦测、识别并验证正在行驶或停泊中的车辆的牌照号码,并能辨认含有中、英及韩文的车牌。此外,各高校部门实验室也相继投入科研力量,如清华大学人工智能国家重点实验室、上海交通大学计算机科学和工程系、浙江大学自动化系等,在车牌识别方面均有类似研究,并都取得了不错的成绩。中国科学院自动化所的刘智勇等人发表文章,提出在具有 3180 个样本的样本集中,车牌定位的准确率为99.4%,切分的准确率为 94.5%;北京航空航天大学的胡爱明等利用模板匹配技术,开发了一种可应用于收费站的车牌识别系统,该系统的识别正确率能够达到 97%以上5。关于车牌识别的研究,国内外学者己经作了大量的工作,但仍然存在一些问题,比如车牌图像的倾斜、车牌自身的磨损、光线的干扰都会影响到定位的精度。车牌字符识别是在车牌准确定位的基础上,对车牌上的汉字、字母、数字进行有效确认的过程。目前已有的方法很多,但其效果与实际的要求相差很远,难以适应现代化交通系统高速度、快节奏的要求。因而对字符识别的进一步研究也同样具有紧迫性和必要性。1.3本文研究内容本文主要是针对定位后的车牌字符图像进行预处理再进行分割并且识别,在这个过程中主要是要实现利用BP网络进行车牌字符识别。首先对所设计的识别技术进行了原理性的叙述。对于车牌图像首先要进行预处理,预处理的部分就包括车牌图像去噪,车牌图像灰度化和车牌图像二值化。预处理完之后就要对图像进行分割处理,在把车牌中的每个字符给提取出来形成单个字符的图像。提取出单个的车牌字符图像后就要低车牌字符进行特征值提取,将把这些特征值送入到BP网络进行识别。BP网络是一个需要预先学习的网络,所以需要建立字符库,这个库就是要把车牌字符一般性特征给表现出来,把字符库的特征值送入到BP网络进行学习得到一个具有识别功能的BP网络。由于在实际生活当中公安部门为了防止车牌伪造,在车牌字符的字体上进行改变,使得目前通用的计算机上都不能输出这样的字体,所以在本文中采用的字符库就没有用车牌字符的字体。对于BP网络的识别利用一种相似的字体做的实验,以验证BP网络识别的可行性和可靠性。在图像处理技术上有许多实现的方法,这些都是可以大胆的尝试,得出数据加以分析求得某种技术才是实现识别技术的最好方法。基于上述的思想实现车牌字符识别的程序流程图应如图1.1。图1.1 BP网络字符识别流程图根据流程图要实现车牌字符的识别,就需要对图像处理和BP网络进行研究与分析。第2章 字符识别方法 2.1 车牌图像预处理图像预处理就是对将要利用的图片进行处理使得图像有更好的利用效果,可以很好的从处理过得图片中得到想需要的信息。这个过程中有车牌图像去噪、车牌图像灰度化、车牌图像二值化。2.1.1 车牌规律要对车牌图像做处理就需要先归纳统计我国的车牌特点和规律。我国车牌种类比较多,有黄底黑字、蓝底白字、黑底白字、白底红字。这些种类也代表这车辆不同的信息,黄底黑字为中型、大型车以及农用车、摩托车的牌照;蓝底白字是小型民用车的牌照;黑底白字及红色“领”字标志是代表大使馆外籍汽车和领事馆外籍汽车;白底红色字是临时车牌。不仅仅颜色上的区别,而且车牌字符的排版也有不同,一般车辆车牌字符都是在行上高度一致,而像公交车它们的表示地区的两个字符是在牌号的上方并且大小有区别。由于车牌的种类多排版不一样,在本文中主要是针对蓝底白字的小型民用车进行识别。我国的小型民用车车牌一共是七位(除去分隔符),前面两位是地区信息,后面五位是号码。第一位是一个汉字它代表这该车辆属于某个省或直辖市自治区,第二位是所在省市的代表,例如:湘A代表湖南长沙、湘B代表湖南株洲。后面五位是由09和AZ(除去O和I)一共是34种字符。我国标准小型车采用蓝底白字的车牌,轮廓尺寸为 440mm×140mm,宽和高比例近似为 3:1。车牌中的每个字符居中分布在一个宽度是 45mm,高度是 90mm 的矩形范围内,字符间隔为 12mm,因为第二和第三字符间存在一个 10mm 的间隔符,因此,二、三字符的间隔为 22mm。如图2.1所示。图2.1 车牌的规格2.1.2车牌图像去噪车牌图像去噪目的是为了改善车牌图像的质量,减少图片上的噪声干扰。在获取到的车牌图像中第一步就要先消除噪声干扰。经常影响图片质量的噪声源可分为三类。首先,记录在感光片上的图像会受到感光颗粒噪声的影响;其次图像从光学到电子形式的转换是一个统计过程,这是因为每个图像像素接收到的光子数目是有限的;最后处理信号的电子放大器会引入热噪声8。这三种噪声都有相应的数学模型,主要是要对噪声进行滤除,滤波的方法有许多种,例如中值滤波、变换域滤波、小波去噪等等。这些滤波方法在文献7、8、9中有详细说明.中值滤波也称为中值平滑是一种空间域非线性滤波技术,它能够在滤除噪声的同时保持边缘不被模糊。中值滤波的做法是以处理窗内原灰度值得“中值”作为“窗口”中心处的新值。不论孤立噪声有多大,都可以被彻底滤除;若噪声不是孤立的,有可能就无法滤除,总之若像素变化的空间尺寸不大于窗宽的一半,则可用中值滤波完全滤除。如果原图中本身就含有这类像素,也会被滤除掉,因此,在选择窗的大小是应尽量在去除噪声的同时又能保留图像中的细节。中值滤波器是最常用的非线性滤波技术,它是一种领域运算,类似于卷积,但是计算的不是加权求和,而是把领域中的像素按灰度级进行排序,然后选择该组的中间值作为输出像素值。对于一个N×N的中值滤波器(N为奇数),若某输入像素的灰度级大于或等于领域中个像素的灰度级,则该像素的灰度级就作为输出灰度级。中值滤波器计算一般来说比卷积运算要慢,这是由于它需要对领域中的所有像素按灰度级排序。和相近的低通线性滤波器相比,中值滤波器能够在衰减随机噪声的同时不使边界模糊。一般来说小于中值滤波器面积一半的亮或暗的物体基本上会被滤掉,而较大的物体则几乎会原封不动地保存下来。因此中值滤波器的空间尺度必须根据遇到的问题不同而进行相应的调整。指导中值滤波器设计的理论要比指导线性滤波器设计的理论少得多,所以用实验代替分析。2.1.3车牌图像的灰度化和二值化在进行视频流目标识别与跟踪时,通常第一个步骤就是对采集到的彩色图像进行灰度化,这是因为黑白照片数据量小,相比彩照更易实现实时算法,另一方面黑白照片是由未处理的光线所形成的照片,因此从图像处理学角度来看,这种未经特殊滤光处理的图片所涵盖的信息更有价值。目前,在图像处理过程中,最常用的彩色图片格式有RGB,HSV、YUV以及HLS三种。以下分别对这三种格式的彩色图像进行灰度化实现。(1)RGB空间图像定义于RGB空间的彩色图,其每个像素点的色彩由R、G、B三个分量共同决定。每个分量在内存所占的位数共同决定了图像深度,即每个像素点所占的字节数。以常见的24深度彩色RGB图来说,其三个分量各占1个字节,这样每个分量可以取值为0255,这样一个像素点可以有1600多万(255*255*255)的颜色的变化范围。对这样一幅彩色图来说,其对应的灰度图则是只有8位的图像深度(可认为它是RGB三个分量相等),这也说明了灰度图图像处理所需的计算量确实要少。不过需要注意的是,虽然丢失了一些颜色等级,但是从整幅图像的整体和局部的色彩以及亮度等级分布特征来看,灰度图描述与彩色图的描述是一致的。对于RGB图像进行灰度化,通俗点说就是对图像的RGB三个分量进行加权平均得到最终的灰度值。最常见的加权方法如下五种:1) 2) 3)4)5) 这五种方法中,第一种为分量法,即用RGB三个分量的某一个分量作为该点的灰度值;第二种方法为最大值法,将彩色图像中的三分量亮度的最大值作为灰度图的灰度值。第三种方法将彩色图像中的三分量亮度求平均得到一个灰度图;后两种都是属于加权平均法,其中第四种是OpenCV开放库所采用的灰度权值,第五种为从人体生理学角度所提出的一种权值(人眼对绿色的敏感最高,对蓝色敏感最低)。(2)他颜色空间的灰度化关于YUV空间的彩色图像,其Y的分量的物理意义本身就是像素点的亮度,由该值反映亮度等级,因此可根据RGB和YUV颜色空间的变化关系建立亮度Y与R、G、B三个颜色分量的对应:Y=0.3R+0.59G+0.11B,以这个亮度值表达图像的灰度值。二值化处理是一种将图像变为只有黑白两色的二值图像的灰度处理方法,对图像进行二值化处理是接下来对车牌字符进行分割的关键步骤。二值化的关键是阈值的选取,选择恰当的阈值,不仅能够有效去除图像噪声的干扰,而且能够使整个图像被明显地划分成目标和背景两个部分,进而把图像特征清晰的突显出来,以减少信息量,提高处理速度。通常可将阈值的选取方法分为全局阈值法和部分阈值法两种。全局阈值法,是用同一阈值对整个图像中的每个像素进行二值化。常用的方法有直方图变化法、Otsu算法等;而局部阈值法则是对图像中的每个像素使用不同的阈值。当图像的灰度直方图呈双峰,或图像的目标灰度和背景灰度分离明显,使用全局阈值方法处理图像速度较快而且效果较好。 2.2 字符分割图像分割是图像识别工作的基础,图像分割是将图像分成一些有意义的区域,然后对这些有意义的区域进行描述,相当于提取出某些目标区域图像的特征,判断图像中是否有感兴趣的目标。图像分割的基础是像素间的相似性和跳变性。所谓“相似性”是指在某个区域内像素具有某种相似的特性,如灰度一样,纹理相同;所谓“跳变性”是指特性不连续,如灰度值突变等。从总体上来说,图像分割就是把图像分成若干有意义的区域的处理技术。这些区域互不相交叠,每一个区域内部的某种特性或特征相同或接近,而不同区域间的图像特征则有明显差别,即同一区域内部特性变化平缓,相对一致,而区域边界处则特性变化比较剧烈。区域内是一个所有像素都有相邻或相接触的像素的集合,是像素的连通集。在一个连通集中任意两个像素之间,都存在一条完全由这个集合的元素构成的连通路径。连通路径是一条可在相邻像素间移动的路径。图像分割的度量准则不是惟一的,它与应用场景图像及应用目的有关,用于图像分割的场景图像特征信息有亮度、色彩、纹理、结构、温度、频谱、运动、形状、位置、梯度和模型等。由于图像的多义性和复杂性,许多分割的工作无法依靠计算机自动完成,而手工分割又存在工作量大,定位不准确的难题,因此,人们提出了一些人工交互和计算机自动定位相结合的方法,利用各自的优势,实现目标轮廓的快速定位。图像分割的方法又多种,依据工作对象来分,可分为点相关分割和区域相关分割;按照算法分类,可分为阈值法、界限检测法、匹配法、跟踪法等。近年来出现了一些新的算法和设想。如先使用经典的边缘检测算子对图像做初步的边缘检测,然后再利用边缘之间空间结构关系来协调,增强初始检测结果。经典提取算法通过首先对原图像进行平滑,再进行边缘检测能较成功地检测出真正的边缘。在边缘检测之后,找出目标物体的轮廓,进行目标物体的分析、识别、测量等。这些内容在数字图像处理应用中,有着广泛的用途。借助集合的概念可以将图像分割进行定义如下,设一幅数字图像中所有像素的集合为R,P为逻辑谓词(分类准则),则图像分割将R分成N个子集,这些子集满足:1);2),其中;3);4)对于,;5)相对于的那个区域是连通的。其中,条件2)表示分割结果中的每个子区域是互不重叠的。条件3)表示同一个子区域内部具有相似的特性。条件4)表示不同的子区域具有不同的特性。 根据像素特性在目标区域内部性质一致性和区域边界上不连续性,分割算法可分为基于边缘的分割算法和基于区域的分割算法。2.2.1 边缘检测图像边缘是图像基本特征之一。边缘可以定义为图像局部特性的不连续性,例如,灰度的突变,颜色的突变,纹理结构的突变等等。边缘通常意味着一个区域的终结和另一个区域的开始。边缘信息对信息分析和人的视觉都是很重要的。边缘的检测常借助空域微分算子进行,通过微分模板与图像卷积完成。如果一个像素落在图像中某一个物体的边界上,那么它的领域将成为一个灰度级变化的带。对这种变化最有用的两个特征是灰度的变化率和方向,他们分别以梯度向量的幅度和方向来表示。边缘检测算子检查每个像素的领域并对灰度变化率进行量化,通常也包括方向的确定。有若干种方法可以使用,其中大多数是基于导数掩模求卷积的方法。1)Robert边缘检测算子Robert边缘检测算子是一种利用局部差分算子寻找边缘的算子。它由下式给出出:其中是具有整数像素坐标的输入图像。其中的平方根运算使该处理类似于人类视觉系统中发生的过程。2)Sobel边缘检测算子如图所示的两个卷积核形成了Sobel边缘算子。图像中的每个点都用这两个核做卷积。一个核对通常的垂直边缘响应最大而另一个对水平边缘响应最大。两个卷积的最大值作为该点的输出值。运算结果是一幅边缘幅度图像。图2.2 Sobel边缘检测算子3)Prewitt边缘检测算子如图所示的两个卷积核形成了Prewitt边缘算子。与使用Sobel算子的方法一样,图像中的每个点都用这两个卷积核进行卷积,取最大值作为输出。Prewitt算子也产生一幅边缘幅度图像。图2.3 Prewitt边缘检测算子4)阈值分割阈值分割算法是图像分割中算法数量最多的一类,阈值话分割技术是基于下列假设的:每个区域是由许多灰度值相近的像素构成的,物体和背景之间或不同物体之间的灰度值有明显地差别,这样可以通过区域之来区分。待分割图像的特性越接近于这个假设,用这个方法分割的效果越好。该分割技术的基本原理是确定一个处于图像灰度变化范围内的灰度阈值T,让后把图像中每一个像素的灰度和这个阈值T相比较,并且根据一定规则将像素分为两类,例如:把灰度值大于阈值的像素归为一类;像素值小于阈值的像素归为另一类。不同的像素一般属于图像中不同的区域,这样根据阈值对像素进行分类即可以达到区域分割的目的。阈值分割算法可分为两个步骤:1)根据一定的规则确定适当的分割阈值;2)将该阈值和像素值相比较来分类像素。在上述步骤中,确定适当的阈值是该分割算法的关键。阈值T的正确选择对于正确检测目标是十分重要的,直接关系到分割精度。要特别注意的是,阈值分割时只要考虑了像素的本身值,未考虑像素的空间位置。因此根据阈值划分同一类的像素可能属于图像中不连通的区域,这时,通常需要借助于其他一些方法来进一步确定目标区域。2.2.2 字符切割字符分割是将车牌图像的七个字符分割成一个个独立的字符图像。字符分割时识别的基础,分割的好坏直接影响到识别的效果。而大致的分割方法有如下几种:1)直接分割法即基于车牌字符的规格来分割的,其优点是方便简单,局限在于需要找到精准分割点。2)基于投影法的分割方法即基于对二值图像像素的列进行叠加,也就是对车牌进行水平投影。这样就得到投影图像,而投影图像就会出现波峰和波谷,而最低的谷底就是要找的分割点。此方法主要优点在于程序逻辑设计简单,便于设计程序。但是由于车牌字符中的汉字有些并不连通,投影法也存在着一些问题。3)上述两种办法是基本的字符切割方法,但都是有缺点的,可以结合两种办法来设计一种办法。由于投影法存在问题主要是由汉字的不连通性造成的,那么可以根据直接分割原理大约估计第一个字符的宽度,在利用投影方法进行切割,当第一个最低波谷的列数比直接分割的列数要小那么就不说明这个汉字是不连通不能在这个波谷分割,等到第二个最低波谷出现时再分割。当第一个最低波谷大于了直接分割的列数要大,那么就说明可以分割。这中方法不需要直接分割精确地找到分割点只需要找到一个大约的分割点就可以了,也较好的解决了投影法的由于汉字不连通带来的问题。2.2.3 字符图像归一化在视频抓拍到的车牌图像中,得到的车牌图像大小不一存在着差异所以需要对图像进行归一化处理。归一化处理实质上就是要统一即将识别图像的规格,这样可以方便于识别。归一化的过程就是根据原图像和目标图像大小计算缩放比例,然后按比例将字符图像线性的放大或者缩小到指定的大小的标准图像1。假设原图像为的大小,要归化为大小的图像其算法如下式子: (2-1)其中,为原图图像大小,为原图图像中某一点坐标,归一化后该点坐标为。在归一化过程中产生像素有些事在原图中找不到的,这里需要自己赋值或者插值。插值方法有许多种,例如最邻近插值法、双线性插值法和高阶插值法等。最邻近插值法就是令转换后图像素的灰度值等于离它所映射到的位置最近的原图像素的灰度值。也就是将变换前图像的像素点代替转换后图像离它最近的像素点。双线性插值法也称为一阶插值法,它是根据一个方程式来定义的一种插值方法,也就是在已知一个矩形的四个定点的值,来拟合这个矩形内的任意一点的值。其拟合方程式如下: (2-2)可以根据已知四个定点的值来确定a、b、c、d的值。2.2.4字符特征值提取在字符图像中需要提取出字符的特征来表示这个字符,所以需要设计出一组能代表字符特征的数据。这里有几种方法:1)投影法:根据字符图像行列投影的像素累计值来作为字符的特征,根据对实际字符图像投影出来的数据经过BP网络进行识别。图2.4 投影示意图示意图如图所示,按照行列来计算图像中每行每列的值可以提取出不同字符不同的特征。基于这种思路,可以选取合适数目的的行和列来进行特征提取,这样可以大大减少计算量,只需要能有效的提取出特征值就可以识别出字符。2)区域法:将字符图像划分成几个小区域,对几个小区域分别进行像素值得累计,根据这些区域的像素值来作为字符特征。图2.5 区域法特征提取法示意图如图所示