课程设计(论文)图像中的字符分割系统的设计.doc
目录1 引言31.1 课题研究的背景和意义32 应用领域42.1交通监控42.2交通流控制指标参量的测量42.3高速公路上的事故自动测报42.4对养路费交纳、安全检查、运营管理实行不停车检查42.5车辆定位43 研究的主要内容车牌识别系统53.1图像采集部分53.2 图像预处理部分53.3车牌定位63.4 字符分割63.5 字符识别74 车牌识别系统的评价指标74.1识别率84.2识别速度84.3后台管理体系85 识别技术95.1采集方式决定了车牌识别的技术路线95.2 软硬件体系结构105.3 触发方式116 总结11摘要: 车牌的自动识别是计算机视觉、图像处理与模式识别技术在智能交通领域应用的重要研究课题之一, 是实现交通管理智能化的重要环节, 主要包括车牌识别、字符预处理和特征提取三个关键环节。车牌识别包括车牌定位、灰度(或彩色)图像二值化、字符切分及字符识别等。图像预处理包括图像灰度变换、图像增强、图像二值化、梯度锐化、噪声去除、倾斜度调整、车牌边框去除、字符分割、尺寸标准归一化、紧缩重排。特征提取本文采用逐象素特征提取法来对支付进行识别。理论上,本系统可以对中国大陆普通汽车车牌的字符进行识别。关键词:车牌识别 图像预处理 特征提取The image characters segmentation system designAbstract:Automatic license plate recognition in computer vision, image processing and pattern recognition technology in intelligent traffic domain application one of the important research topics, is the realization of intelligent traffic management important link, including license plate recognition, character pretreatment and feature extraction in three key link. License plate recognition including the license plate location, gray ( or color ) images of the two values, character segmentation and character recognition. Image processing including image transform, image enhancement, image two values, gradient sharpening, noise removal, tilt adjustment, character segmentation, license plate frame removal, standard size normalization, tightening rearrangements. Feature extraction using pixel-by-pixel feature extraction method to pay recognition. In theory, this system can on the mainland of China general car license plate character recognition.Keywords: license plate recognition image preprocessing feature extraction1 引言1.1 课题研究的背景和意义随着经济全球化的发展和人民生活水平的提高,世界各国汽车数量迅速增加,城市的交通压力也越来越大。如何有效地进行交通管理日益成为各国政府相关部门所关注的焦点。针对这一问题,智能交通系统Intelligent Transport Systems,ITS的研究被提到了重要的位置。智能交通系统 ITS 是 90 年代兴起的新一代交通运输系统,迄今为止国际上没有公认的定义。第一届 ITS 世界大会认为,智能交通系统是将先进的信息技术、计算机技术、数据通信技术、电子控制技术、人工智能技术等有效的集成并应用于地面交通系统,从而建立起可以在大范围内发挥作用的,实时、准确、高效的地面交通系统。智能交通系统在有效利用现有交通设施、减少交通负荷和环境污染、保证交通安全、提高运输效率、促进社会经济发展、提高人民生活质量、推动社会信息化及形成新产业等方面均具有极其重要的作用,从而受到世界各国的重视。 车辆自动识别Automatic Vehicle Identification,AVI是智能交通系统中的一项基础技术,它通过辨别车辆所具有的车牌、条形码、射频识别标志等特征来自动识别车辆,为交通管理、通行收费、区域出入控制等工作的开展提供条件。车辆牌照识别Vehicle License Plate Recognition,VLPR技术是车辆自动识别技术的重要组成部分:其功能是对采集到的汽车图像进行处理和分析,以自动识别其中的牌照编号。牌照是机动车辆的身份标志。通过车牌识别系统的图像采集和处理获得尽可能多的车牌信息,达到识别车牌号码的目的,从而使现代交通领域达到更高的智能化管理程度。 智能交通系统的研究领域十分广阔,各国各地区的侧重点也有所不同。如:电子收费系统是ITS在公路收费领域的具体表现,可解决收费站的“瓶颈”制约,较好地缓解收费站的交通拥挤、排队等候以及环境污染等问题。为了满足这些需求,十分有必要在智能交通管理系统引入车辆牌照自动识别技术。汽车牌照是车辆最清晰、准确、唯一的标志。车辆牌照识别系统作为一个专门的计算机视觉系统,它能够自动拍摄车辆行进中的动态数据,有效判断和提取有车牌的图像数据,并实时准确的识别出车辆牌照上的字符。车牌识别技术自 1988 年提出以来,受到了人们的广泛关注。2 应用领域2.1交通监控利用车牌识别系统的摄像设备,可以直接监视相应路段的交通状况,获得车辆密度、队列长度、排队规模等交通信息,观察和防范交通事故。它还可以同雷达测速器或其它的检测器配合使用,以检测超速的车辆。当发现车辆超速时,摄像机获取该车的图像,并得到该年的牌照号码,然后给该车超速的警告信号。2.2交通流控制指标参量的测量一些交通流指标的测量对交通流控制相当重要。该系统能够测量和统计很多交通流指标参数,如总的服务效率,总行程时间,以后简称为车辆牌照识别为车牌识别。总的流入量和流出量,年型及年流组成,日车流量,小时年流量,年高峰时间段,平均车速,车辆密度等。这也为交通诱导系统提供必要的交通流信息。2.3高速公路上的事故自动测报这是由于该系统能够监视道路情况和测量交通流量指标,能及时发现超速,堵车,排队、事故等交通异常现象。2.4对养路费交纳、安全检查、运营管理实行不停车检查根据识别出的车牌号码从数据库中调 m 该车档案材料,可发现没及时交纳养路费的车辆。另外,该系统还可发现无车牌的车辆。若与车型检测器联用,可迅速发现所挂车牌与车型不符的车辆。 2.5车辆定位由于能自动识别车牌号码,因而极易发现被盗车辆。,以及定位出车辆在道路上的行驶位置。这为防范、发现和追踪涉及车辆的犯罪,保护重要车辆如运钞车的安全有重大作用,从而对城市治安及交通安全有重要的保障作用。由于车牌识别系统在智能化交通控制管理中发挥着越来越重要的作用,吸引了各国的科研工作者对其进行广泛的研究。由于需适应各种复杂背景,加之要识别的车辆种类繁多、颜色变化多端,以及检测时要适应不同天气变化导致的不同光照条件,因此,目前的车牌识别系统都或多或少地存在一些问题。但是,随着计算机性能的提高和计算机图像处理技术的发展,车牌识别技术必将日趋成熟。3 研究的主要内容车牌识别系统 车牌识别系统是以特定目标一一车辆牌照为对象的专用计算机视觉系统。该系统能够从一幅图像中自动提取车辆牌照,进行字符分割,进而对分割出的字符图像进行识别。一个典型的车牌识别系统包括图像采集、车牌定位、字符分割、字符识别以及结果输出五个功能模块。 系统的核心部分为图像采集、车牌定位、字符分割、字符识别。下面简述各部分的主要功能: 3.1图像采集部分当系统发现有车辆通过时通过检测器检测或是通过视频中运动目标的检测,触发图像采集系统,一般采用 CCD 摄像机摄取车牌前视图或后视图,由光照检测装置控制现场的光照,位置检测装置控制摄像机的拍摄角度。图像采集目前主要采用专用摄像机连接图像采集卡,或者直接连接便携式笔记本进行实时图像采集,同时将模拟信号转换为数字信号。图像处理主要是对采集的图像进行增强、恢复、变换等处理,目的是突出车牌的主要特征,以便更好地提取车牌区域。3.2 图像预处理部分需要对采集到的图像进行图像增强、平滑、恢复等操作,目的是突出车牌的主要特征,以便更好地提取车牌。 字符图像预处理就是对输入的字符图像进行处理,以使其变成某种特定的标准形式,使后续的特征提取和字符识别更容易进行。其主要功能有两点:一是消除图像中的噪声,修正图像断线或粘连现象;二是通过各种线性、非线性归一化方法,使变换后的图像相对稳定,便于识别。LPR的摄像部分工作于开放的户外环境,拍照时的光线,摄像机与牌照的距离和角度等都会造成采集图像的模糊、歪斜等,严重影响车牌的分割识别。所以在进入车牌识别模块之前,首先要对采集到的车牌图像进行预处理。目前,适应于各种应用环境的,较为通用的图像预处理方法还不是很成熟,论文在现有车牌预处理算法的基础上,针对车牌图像提出了改进的预处理方案。具体过程是在现有的中值滤波、灰度化及二值化的常规处理后,又提出了对二值图像进行二次中值滤波来对二值图像降噪,并将通常用于实现车牌定位的锐化边缘算法运用到预处理中,为去除车牌图像背景,提取车牌字符做好了准备。3.3车牌定位车牌的定位是一个寻找最符合车牌特征区域的过程,从本质上讲,就是一个在参量空间寻找最优定位参量的问题。车牌定位算法需要挖掘并提取车牌区域的独有特征,从而将车牌图像分割提取出来。在车牌定位过程中,由于采集到的图像中军牌区域经常是倾斜的,为避免后续的字符分割和字符识别的失败,必须对车牌行倾斜校正。从人眼视觉的角度出发,同时根据车牌的字符目标区域特点,在二值化图像的基础上,可以提取其相应的定位特征。这从本质上说,就是一个在参量空间寻找最优定位参量的问题,它需要用最优化方法予以实现。一般可计算边缘图像的投影面积,寻找峰谷点,大致确定车牌位置,再计算此连通域内的宽高比,剔除不在域值范围内的连通域,最后得到的就是车牌区域。车牌定位是车辆牌照自动识别系统中的关键和难点,实际图像中的噪声、复杂的背景等干扰都会给定位增加困难。车辆牌照的分割是一个寻找最符合牌照特征区域的过程。 车牌检测定位方法包括图像预处理,车辆牌照粗定位,车辆牌照精确定位等几个组成部分。 3.4 字符分割即从定位得到的车牌图像中分离出单个字符包括汉字、字 母和数字等的图像,以便于字符识别。车辆牌照的字符分割是把经过定位后的车牌区域切分成若干个子区域,每一个子区域包含一个字符。字符分割的任务是把多行或多字符图像中的每个字符从整个图像中分割出来,使其成为单个字符。对于一般的字符识别来说,其识别过程是从输入的待识别字符(样本)点阵图形中提取描述该字符的特征,再根据一定准则来判定该样本所属的模式类别。因此,字符描述、特征提取与选择、分类判决等是字符识别的三个基本环节。论文利用车牌图像小且内容简单的特点,将自顶向下分割法与边缘检测分割法相结合,采用了改进的垂直投影法,对边缘锐化了的纯字符图像做垂直投影,从右向左扫描黑白跳变点来实现车牌字符分割。由于是对纯字符的二值图像进行垂直投影,且车牌的边框和铆钉等背景已经去除,所以有连续黑点的地方就是字符所在地,连续黑点的间断点(白点)则是分割点。再根据车牌字符分隔点的初始位置比例关系为6:8:6:6:6:6,以及字符的平均字宽和两字符左边界之间的平均距离关系,去除可能存在的错误切分。3.5 字符识别对分割得到的字符图像进行归一化处理,进行字符识别,转换为文本存入数据库或直接显示出来。字符识别是车牌照识别系统的最重要的组成部分,该部分需要对图像采集,图像处理,车牌照定位,字符切分所得到的结果进行识别处理,以最终得到车辆牌照的字符。本文论述的车辆牌照字符识别方法分为字符图像预处理、特征提取、分类器设计等部分。车牌字符的识别算法主要有模板匹配法、统计模式识别和基于神经网络法。基于模板匹配算法首先将待识别字符二值化,再将其尺寸大小缩放为字符数据库中模板的大小,然后与所有的模板进行匹配,最后选最佳匹配作为结果23。由于这种算法稳定性较差且耗时较长,所以论文提出基于特征向量的匹配算法,具体算法是将待识别字符的特征向量与模板字符特征库中的特征向量依次对应相减,若结果为零向量则完全匹配,其对应的模板字符即为识别结果。若为非零向量,则对这9个差值的绝对值求和,取最小值对应的标准模板字符作为最佳匹配字符并将其输出,完成了字符识别。由于数字“1”的字高与字宽之比大于3,而其他字符的高宽之比都小于3,所以论文首先根据这一特性判断分割字符是否为“1”,若是则识别结果输出标准字符“1”,若不是则依次对分割字符进行字符归一化、特征提取和基于特征向量的模板匹配,输出识别结果。这样既可以较为简单和准确的识别字符“1”,而且不需要建字符“1”的模板特征向量,减少了计算量,提高识别了速度,同时也降低了整体识别的难度。4 车牌识别系统的评价指标 从技术上评价一个车牌识别系统有三个指标,即识别率、识别速度和后台管理系统。4.1识别率 一个车牌识别系统是否实用,最重要的指标是识别率。国际交通技术作过专门的识别率指标论述,要求是 24 小时全天候全牌正确识别率为 8595。为了测试一个车牌识别系统的识别率, 需要将该系统安装在一个实际应用环境中, 全天候运行 24 小时以上,采集至少 1000 辆自然车流通行时的车牌照进行识别, 并且需要将车辆牌照图像和识别结果保存下来,以便调取查看。然后,还需要得到实际通过的车辆图像以及正确的人工识别结果,之后便可以统计出以下识别率 (1)自然交通流量的识别率全牌正确识别总数/实际通过的车辆总数; (2)人工可识别车牌的百分率人工正确读取的车牌总数/实际通过的车辆总数; (3)系统可识别车牌的识别率全牌正确识别总数/人工正确读取的车牌总数; 这三个标决定了车牌识别系统的识别率,诸如可信度、误识率等都是车牌识别过程中的中间结果必须认识到的一点是系统的识别率达到 100是不可能的,因为车牌照污损、模糊、遮挡或者恶劣的天气情况下雪、冰雹、大雾等都会影响到系统的识别率。4.2识别速度 识别速度决定了一个车牌识别系统是否能够满足实时应用的要求。一个识别率很高的系统,如果需要几秒钟,甚至几分钟才能识别出结果,那么这个系统就会因为满足不了实时要求而毫无实用价值。例如,在高速公路收费中车牌识别系统的作用之一是减少通行时间,处理速度是这一类应用减少通行时间,避免车道堵车的有力保障。国际交通技术提出的识别速度是 1 秒以内,越快越好。4.3后台管理体系 一个车牌识别系统的后台管理体系,决定了这个车牌识别系统是否好用。从人眼视觉的角度出发,同时根据车牌的字符目标区域特点,在二值化图像的基础上, 可以提取其相应的定位特征。这从本质上说,就是一个在参量空间寻找最优定位参量的问题,它需要用最优化方法予以实现。一般可计算边缘图像的投影面积,寻找峰谷点,大致确定车牌位置,再计算此连通域内的宽高比,剔除不在域值范围内的连通域,最后得到的就是车牌区域。车牌定位是车辆牌照自动识别系统中的关键和难点,实际图像中的噪声、复杂的背景等干扰都会给定位增加困难。车辆牌照的分割是一个寻找最符合牌照特征区域的过程。图像预处理部分的功能是将已经变成电信号的信息加以区分,同时去除信号中的污点、空白等噪声,并根据一定准则除掉一些非本质信号,再对文字的大小、位置和笔划粗细等进行规范化,最后简化判断部分的复杂性。车牌照粗定位部分将给出若干个待进一步判断识别的候选车牌区域,如果候选区域的个数为零,则说明本幅图像不含车牌,也就不用进行下一步的识别。车牌照精确定位就是对车牌候选区域进行分类,以判断哪一个是真正的车牌区域并给出车牌区域的坐标。后台管理体系的功能应该包括:(1) 识别结果和车辆图像数据的可靠存储。当多功能的系统操作使得网络出差错时,后台管理系统应能保护图像数据不会丢失,同时便于事后人工排查。(2) 有效的自动比对和查询技术。识别出的车牌号码应能够同数据库中成千 上万的车牌号码自动比对和提示报警。如果车牌号码没有被正确读取时,可采用模糊查询技术以得出相对quot最佳quot的比对结果。(3) 完善的系统功能。 一个好的车牌识别系统不仅可联网运行,还需要提供实时通信、网络安全、远程维护、动态数据交互、数据库自动更新、硬件参数设置、系统故障诊断等功能。车牌识别系统的实际配置 即便是一个达到实用标准的车牌识别系统,由于所选择的技术路线,软硬件体系结构以及触发方式不同,要发挥其有效的功能,还需要根据实际的应用需求确定相应的系统配置。5 识别技术5.1采集方式决定了车牌识别的技术路线目前国际通行的两条主流技术路线是自然光和红外光图像采集识别。自然光和红外光不会对人体产生不良的心理影响,也不会对环境产生新的电子污染,属于绿色环保技术。 自然光路线是指白天利用自然光线,夜间采用辅助照明光源,用彩色摄像机采集车辆真彩色图像,用彩色图像处理方法识别车牌。自然光技术路线与人眼感习惯一致,并且真彩色图像能够反映车辆及其周围环境真实的图像信息,不仅可以用来识别汽车牌照,而且可以用来识别车牌颜色、车流量、车型、车体颜色等车辆特征。红外光路线是指利用车牌反光和红外光的光学特性,用红外摄像机采集车辆灰度图像,由于红外特性,车辆图像上儿乎只能看见车牌,然后用黑白图像处理方法识别车牌。特征提取的主要目的是从原始数据中抽取出用于区分不同类别的本质特征。由于不同的特征的适用性不同,故对不同效果的字符所提取的特征性能也不尽相同,因此,用单一的特征已经很难适应受多种条件影响的车牌照字符的识别。另外,由于不同特征的不同维之间所表示的意义也不太相同,且权重也可能相差很多,如果采用直接组合的方法,就会使权重较大的特征占主导地位,而忽略了权重较小的特征。要解决这种问题,可以采用特征向量归一化法或者加权的办法,将两种特征通过加权的方法组合起来,从而达到组合使用两种特征的目的。分类器就是在特征空间中用某种方法将被识别对象归为某一类别。其基本做法是在样本训练集的基础上确定某个判决规则,以使按这种判决规则对被识别对象进行分类所造成的错误率最小或引起的损失最小。采用神经网络作为分类器时,需要有一定的训练样本,而且样本个数不能太少,但是,本文的实验环境中的车牌上,汉字、英文样本较少,甚至某些汉字英文仅有一个或者几个样本,因而无法保证神经网络的训练程度。因此,本文采用模板匹配法。模板匹配法实际上就是采用多个标准样本的距离分类器。通常可利用平均样本法来计算样本均值以将其作为每个类别的标准样本,然后计算待识别样本与标准样本间的距离,最后选择距离最小的标准样本作为待识别的样本类别。950nm 的红外照明装置可抓拍到很好的反光车牌照图像。因红外光是不可见光,它不会对驾驶员产生视觉影响。另外,红外照明装置提供的是不变的光,所抓拍的图像都是一样的,不论是在一天中最明亮的时候还是在一天中最暗的时候,唯一的例外是在白天,有时会看到一些牌照周围的细节,这是因为晴朗天气下太阳光的外光波的影响。采用红外灯的缺点就是所捕获的车辆牌照图像不是彩色的,不能获取整车图像,并且严重依赖车牌的反光材料。5.2 软硬件体系结构一个车牌识别系统的基本硬件配置是由摄像机、主控机、采集卡、照明装置组成的,而软件是由一个具有车牌识别功能的图像分析和处理软件,以及一个满足具体应用需求的后台管理软件组成。车牌识别系统于是出现了两种产品形式一种是软硬件一体,或者用硬件实现了识别功能的模块,形成一个全硬件的车牌识别器,例如 DSP。另外一种形式是开放式的软、硬件体系,即硬件采用标准工业产品,软件作为嵌入式软件。两种产品形式各有优缺点。开放式体系的优点是由于硬件采用标准工业产品,运行维护容易掌握,备品备件采购可以从任何一家供应商获得,不必担心因为一家供应商倒闭或供货不足而出现产品永久失效或采购困难的问题。5.3 触发方式车牌识别系统有两种触发方式,一种是外设触发,另一种是视频触发。外设触发工作方式是指采用线圈、红外或其他检测器检测车辆通过信号,车牌识别系统接收到车辆触发信号后,采集车辆图像,自动识别车牌,以及进行后续处理。视频触发方式是指车牌识别系统采用动态运动目标检测和图像序列处理技术,实时检测车道上车辆的运动状况,发现车辆通过时捕捉车辆图像,识别车辆牌照,并进行后续处理。视频触发方式不需借助线圈、红外或其他硬件车辆检测器。车牌识别系统中的难点 车牌识别系统在实验室里已经取得了令人满意的效果,但很难应用于实际工程中,这是因为实验室的环境是处于理想状态的,而在自然环境里,由于受到天气等因素的影响,识别率很难达到要求。6 总结本文提到的车牌照识别方法具有很好的识别效果,并可针对出现的漏识和识别错误等现象做出改进,预处理时还可对图像亮度进行分析,针对过亮或者过暗的图像采取不同的二值化策略;也可以根据字符识别的结果采用回溯方法来验证车牌定位和字符切分的准确性;字符识别部分可增加字符模版的训练样本数量,而采用神经网络作为分类器均可以提高字符识别的准确率。论文基于DSP对车牌识别模块中的图像预处理,字符分割及字符识别技术分别提出了改进算法。图像预处理部分,改进点在于提出了对二值图像进行二次中值滤波来对二值图像降噪,并将锐化边缘算法运用到了预处理中。CCS仿真结果表明,论文提出的预处理方案能够有效的提高图像的质量,同时采用Roberts算子进行边缘锐化,为车牌纯字符区域的提取打好了基础。字符分割部分的改进点,一是通过对边缘锐化并二值化的车牌图像进行局部投影,有效的去除了车牌的边框和铆钉,准确的提出了车牌的字符区域。二是对纯字符图像进行字符分割,使分割正确率达到了99.16%,提高了分割的准确性。车牌字符识别部分,改进处在于对各字符的外部轮廓进行统计特征提取,并基于特征向量的进行匹配识别。仿真结果表明,改进的算法具有良好的鲁棒性,识别正确率达到了99.16%,提高了识别效率。参考文献1谢盛嘉,梁竟敏车牌识别系统的设计与实现J微计算机信息,2010(6):1651672刘卫国MATLAB 程序设计与应用M北京:高等教育出版社,20023王刚,冀小平基于的车牌识别系统的研究J电子设计工程,2009(11):72734赵建春,李文举,王新年基于Simulink 的车牌识别系统仿真平台5计算机工程与设计,2009(5):115411566 史忠科,左奇一. 一种基于数学形态学的实时车牌图象分割方法J .中国图象图形学报.2003,8( 3):281-285.7 李树广,吴舟舟,罗小伟.基于边缘统计和颜色特征的车牌综合自动定位方法J .山东大学学报:工学版,2005,35(3):44-49.8 齐永奇,王文凡,赵岩,赵耀.基于纹理特征和垂直投影的车牌定位算法研究J .现代电子技术.2007,17:184-186.9 Rodolfo and St efano,2000 Z.Rodolf o an d R.St ef ano,Vectorquant izat ion for license plat e locat ion and image coding, IEEET ransJ .Indust rial Elect ron.47(2000)(1) , pp. 159-167.