毕业设计(论文)字符识别算法的设计与实现.doc
《毕业设计(论文)字符识别算法的设计与实现.doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)字符识别算法的设计与实现.doc(38页珍藏版)》请在三一办公上搜索。
1、淮 阴 工 学 院毕业设计说明书(论文)作 者:王书娇学 号:1071302107学 院:计算机工程学院专 业:通信工程题 目:字符识别算法的设计与实现讲师高尚兵指导者: (姓 名) (专业技术职务)评阅者: (姓 名) (专业技术职务)2011年6月毕业设计说明书(论文)中文摘要字符识别属于模板识别的一种,模板识别就是用计算机自动识别,目的在于让机器自动识别实物。常用的字符识别方法很多,主流方法有3大类:采用基于模板匹配的OCR算法、基于人工网络的OCR算法以及主分量分析OCR算法。模板匹配方法是实现离散输入模板分类的有效途径之一, 实质是度量输入模板与样本之间的某种相似性, 取相似性最大者
2、为输入模板所属类别。模板匹配算法简单,很容易实现。模板匹配法在对于具有特定形态的字符识别系统中还是会被广泛使用的。本论文提出的字符识别算法的原理是:在原有模板匹配算法基础上,提出一种改进的模板匹配方法。这种新的模板匹配算法不仅使字符识别率得到提高,而且实现样品匹配效率理论上的提高。实验表明:对于具有一定形态的字符如车牌字符、印刷字和文本字符等字符的识别率确实是有所提高。在提高识别率的基础上,也实现了系统的运算速率的提高。关键词 字符识别,模板匹配,特征 ,识别率毕业设计说明书(论文)外文摘要Title Design and Implementation on Algorithm of Char
3、acter Recognition AbstractCharacter recognition belongs to a template recognition, Template identification is to use the computer automatically recognize. The purpose of the template identification is to automatically identify the kind by the computer.Common character recognition method are many, ma
4、instream method have three categories:OCR algorithm of the template matching, OCR algorithm of artificial network and OCR algorithm of principal component analysis.Template matching method is an effective way to realize discrete input template classification, Essence is to measure the similarity of
5、input template and sample, input template belongs to the category of biggest similarity. Template matching method is simple and easy to implement.Template matching method with a specific form for the character recognition system is still widely used.This paper presents the principle of the character
6、 recognition algorithm is:An improved template matching method was proposed based on the original template matching algorithm.This new template matching algorithm not only improve the rate of character recognition, and improve the efficiency of realizing samples matched in enhancement.The result sho
7、ws that the character recognition rate of them is really improved for a certain form of characters, such as the license plate characters, text characters and printed word. Based on these, the rate of operation system increase.Keywords character recognition, template matching, features, recognition r
8、ate目 录1 引言11.1 字符识别技术发展11.2 课题研究背景和意义21.2.1 课题背景21.2.2 课题研究意义21.3 字符识别主要技术介绍31.3.1 模板匹配算法31.3.2 人工网络算法31.3.2 主分量分析算法81.4 字符识别介绍91.4.1 本课题要研究和解决的问题91.4.2 系统开发环境和开发工具92 特征提取介绍102.1 特征的定义102.2 特征提取分类102.2.1 边缘102.2.2 角102.2.3 区域112.2.4 脊112.3 常见的特征112.3.1 颜色特征112.3.2 纹理特征122.3.3 形状特征132.3.4 空间关系特征153 字
9、符识别算法实现183.1 一般模板匹配算法实现183.1.1 特征提取介绍193.1.2 特征提取举例193.1.3 样本库建立203.1.4 模板匹配原理203.1.5 模板匹配算法实现举例213.2 改进模板匹配算法实现223.2.1 特征提取介绍223.2.2 样本库建立243.2.3 模板匹配原理243.2.4 模板匹配算法实现举例253.3 算法比较263.3.1 程序实现263.3.2 匹配效率273.3.3 识别效率29小结30致 谢31参 考 文 献321 引言字符是人类历史文明发展的产物,是人类交流的工具。字符识别是模板识别领域内多数课题均会遇到的基本问题。字符识别作为一个运
10、用计算机和图像处理相结合的技术在各个领域发挥着重要的作用。字符识别时工业运用中的一个重要的方面,其发展水平一直受到图像界的关注,原因在于:一方面,字符识别技术的发展难度很大,这种难度不仅在于字符的图像识别,而且在于实际应用的复杂性和应用部门对系统价格的承受能力;另一方面,图像处理技术的发展所产生的效益也是十分显著的,其实际应用系统也将产生很大的经济效益和社会效益。例如,车牌号码的识别、手写字符的识别等。手写字符识别技术在计算机、手机上都得到广泛的运用。在国外,车牌识别作为字符识别的一个应用领域,技术已经成熟,而在我国,对于车牌识别技术研究还主要是集中在对各种车牌定位、字符分割和识别等方面的算法
11、进行研究上。1.1 字符识别技术发展字符识别的两大重要领域是手写字符识别和车牌号码识别。手写字符技术是在八十年代后期,计算机硬件资源发生了巨大变化的基础上发展起来的。八十年代末九十代初,手写体识别研究数目剧增,大量的OCR方面的论文和系统见诸于世;SOPIE、IEEE在这一方向举办了多次会议。到1922年大致形成了以结构方法和统计方法两个方向,系统逐渐向实用化发展。1992年后单字符手写体识别,尤其是数字识别率接近95%,实用系统进入市场。有代表性的国内系统和研究小组由美国的Expervision的RTK(Recognition Cool Kits)、美国纽约州大学buffalo分校的ceda
12、r研究中心、加拿大concordia大学的CENPARMI实验室等,国内则以清华大学电子系、北京信息工程学院、中自汉王、北京邮电大学信息系、沈阳自动化所以及清华大学计算机系为代表3。而作为另一个重要领域车牌号码识别技术,在国外已经发展较为成熟。目前国外车牌识别系统已经有很多的成熟产品。以色列Hi-Tech公司的See/CarSystem系列,新加坡optasia公司的IMPS系列都是比较成熟的产品。其中IMPS产品主要是和新加坡的车牌,近年来也有一些新产品来适应不同国家的车辆,可以识别汉字以及特殊草体文字等。另外,日本、韩国、德国、意大利、英国等国家都有是和本国的识别系统。虽然,国外的车牌识别
13、系统研究工作已经有很大进展,但对我国不适合,只能做某方面的借鉴。国内在90年代也开始了车牌识别的研究。目前比较成熟的产品有中科院自动化研究所汉王科技的“汉王眼”,深圳吉通电子有限公司的“车牌通”、上海高德威只能交通系统有限公司的汽车牌照识别器等等。1.2 课题研究背景和意义1.2.1 课题背景随着计算机应用领域的不断扩大和图像处理技术的不断提高,越来越多的人将目光放在了研究字符识别上。现在很多工厂实现了机器作业全自动化,各行各业都朝着那个方向发展。有人提出了给车辆建立它们的身份系统,有了这个系统,当检测车辆超载、超车等违规现象可以自行对车主进行处罚、记录,当车辆被收取过路费时可以自动从车主账户
14、处理,以及对被盗车辆和犯罪车辆实时监控等。虽然国外技术已经成熟,但发达国家并不对外公布这种技术。我国的车牌系统具有自身的特殊性,国外的车牌识别系统一般不能直接使用。我国的车牌中不仅有英文字母和阿拉伯数字,还包括笔画繁杂的汉字,导致其识别难度比仅有之母、数字的识别大的多,加上国内部分车道路条件差,车辆污染比较严重,而且实际运行车辆号码牌收到泥、油、漆等影响,车牌往往会有断裂现象。同时号牌制作工艺的不规范也会出现字符变浅、变模糊,是车牌字符识别的难度比不同的字符识别大的多。这也是国内现有的车牌识别系统识别效率不够高的主要原因。所以准确的识别车牌字符,现已成为了国内车牌识别系统的重点和难点。这不仅需
15、要计算机技术、拍摄技术,还需要图像处理技术等。图像分割在字符识别研究中是非常重要的技术之一。图像分割是图像处理中最为基础和重要的领域之一,它是指将一幅图像分解为若干互不交迭区域的集合。图像处理技术的发展为和计算机技术的发展为字符识别打下了很好的基础。1.2.2 课题研究意义字符识别属于模板识别的一种,模板识别就是用计算机自动识别,目的在于让机器自动识别实物。自动识别也就代替了人的工作。车辆牌照自动识别系统是图像模板识别领域的一个经典课题。作为字符识别技术中一个重要领域车牌识别,也被越来越多的人关注。车牌自动识别系统能广泛应用于高速公路不停车收费站、城市交叉口、港口和机场、国家重要机关出入地等场
16、所,对提高这些场所交通系统的管理水平和自动化程度具有重要的意义。有了这个系统,交警不用担心有人违规而没被发现;收费站也就不需要那么多人来对过往车辆进行人工收费,省下不少劳动力,而且也减少了过往车主的时间;被盗车和犯罪车辆都能及时发现和处理等。而手写字符识别在信息处理、办公自动化、邮政处理系统等多方面具有着重要的使用价值和理论意义。字符识别也具有广泛的运用前景,比如电脑阅卷,把考试试卷都扫描到电脑上,根据扫面的图片识别出学生的答案,然后和标准答案比较,自动评分并将学生的姓名和分数记录在相应表格中,呈现给老师。在未来可以设计字符识别电子锁,讲房子主人的签名录入电子锁内,当主人要开门时,只要拿和电子
17、锁配备的笔在屏幕上写上自己的名字,电子锁根据原有的档案和现在的图形进行比较,相符就会开门,不符则不会开门。相应的原理还可以用在保险箱上,银行卡密码设置上等。对于盲人而言,如果有一个装置,在盲人需要读书、看报、使用电脑是,可以语音播报扫面到的字符。这样对于盲人来说,这是他们的另一双眼睛,代替他们那双不能用的眼睛来看这个世界,他们的世界就不会障碍重重。对于哑巴来说,如果有这样一个放在手写并能朗读出所写内容的装置,相信他们出门会更方便,即使我们大多数人不懂哑语,但有了这个装置,我们也能和轻松地明白他们要说什么,沟通起来更方便。相信字符识别技术随着慢慢的发展,会更好的为人类服务。1.3 字符识别主要技
18、术介绍常用的字符识别方法很多,主流方法有3大类:采用基于模板匹配的OCR算法、基于人工网络的OCR算法以及主分量分析OCR算法。1.3.1 模板匹配算法模板匹配方法是实现离散输入模板分类的有效途径之一, 实质是度量输入模板与样本之间的某种相似性, 取相似性最大者为输入模板所属类别。它根据字符的直观形象抽取特征, 用相关匹配原理进行识别, 即是将输入字符与标准字符在一个分类器中进行匹配。模板匹配算法主要通过使用相应字符特征向量之间的距离进行匹配,这类算法只有找到了准确的字符特征描述方法,才能较好的识别出相应的字符,但方法简单。常用的字符特征包括字符像素点值、字符边界有向链表、字符笔画、字符拐点等
19、。1.3.2 人工网络算法人工神经网络的研究,可以追溯到 1957年Rosenblatt提出的感知器(Perceptron)模型 。它几乎与人工智能AI(Artificial Intelligence)同时起步,但30余年来却并未取得人工智能那样巨大的成功,中间经历了一段长时间的萧条。直到30年代,获得了关于 人工神经网络切实可行的算法,以及以Von Neumann体系为依托的传统算法在知识处理方面日益显露出其力不从心后,人们才重新对人工神经网络发生了兴趣,导致神经网络的复兴。从神经细胞处理刺激的角度看,每个神经细胞可以简单地看做由三部分组成:树突,轴突,细胞体。对每个神经细胞,树突可以由多个
20、,它们是接受来自其他神经细胞 的刺激的通道;细胞体只有一个,它接受刺激并进行相应的处理;轴突也只有一个,它负责输出刺激,通过神经连接传递给其他神经元。当某个来自大脑或者感受器的刺激发生,神经细胞就通过树突-胞体-轴突-神经连接-其他细胞这样的迅速将刺激通过处理传到其他神经细胞。这样一条通路就是一个信息处理的通路。整个神经系统由无数的神经细胞及神经连接组成,构成一个神奇的巨大的信号处理系统。图1-1神经细胞处理系统但是刺激在神经系统里并非毫无规律地广播式地传播。通常某条通道对某类刺激传播的速度比较快,而且神经细胞每传播一次这类刺激,似乎这类刺激就在这个神经细 胞里留下了痕迹,就好像很多动物会在走
21、过的路上留下分泌物。渐渐地这类刺激在大多数情况下多会从这条通道经过,通过这条通道相同的处理后输出。聪明的科学家从生物的神经系统里得到启示,创造了一种新的处理信号的具有一定智能的人工神经网络。他们仿造生物神经系统建立了这样一个信号处理的模型:每个信息处理单元接受n个输入X1,X2Xn,对每个输入的灵敏度为W1,W2Wn,处理单元的处理功能用一个函数y = f(X1*W1+X2*W2+Xi*Wi+Xn*Wn- )表示,而处理单元处理的结果就是输出Y。由多个这样的信息处理单元构成的一个网络就是人工神经网络。让我们看一下美国神经网络学家Hecht Nielsen对人工神经网络的定义:人工神经网络是由多
22、个非常简单的处理单元彼此按某种方式相互连接而形成的计算机 系统,该系统考其状态对外部输入信息的动态响应来处理信息。(一)设计信息处理单元连接的方式 按照信息处理单元的连接方式,神经网络可以分为多种类型。这里介绍按照结点有无反馈划分的两种典型的网络结构:(1)前馈网络网络可以分为几个层。各层按信号传输先后顺序依次排列,第i层的神经元只接受第i-1层神经元给出的信号。各神经元之间没有反馈。输入层结点与输出层结点称为“可见层”,其他中间层则称为“隐层”。(2)反馈网络网络分层,某些结点除了接受外加输入以外,还要接受其他结点的反馈,或者是自身的反馈。当然,除了这种划分方式,还有按照层数划分为单层网络与
23、多层网络,按照输入数据的特点划分为离散网络和连续网络等。不同的网络在性能和效率上会有很大的差异,一般来说,跨层连接的结点越多,网络越是可靠;层数越多,网络的效率越低;反馈越多,网络的学习能力越强;结点个数越多,网络的记忆能力就越好。因此往往要根据实际应用设计网络的连接。在这里,我们不难得出一个结论:信息处理单元连接的方式的设计是人工神经网络算法设计的一个重要方面。目前研究得相对成熟的是BP误差反传神经网络,Hopfield反馈神经网络,BAM双向联想记忆神经网络,CMAC小脑神经网络,RBF径向基函数神经网络,SOM自组织特征映射神经网络,CPN对偶传播神经网络,ART自适应谐振理论,量子神经
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业设计 论文 字符 识别 算法 设计 实现
链接地址:https://www.31ppt.com/p-3981988.html