[理学]毕业论文唐炜炜.doc
《[理学]毕业论文唐炜炜.doc》由会员分享,可在线阅读,更多相关《[理学]毕业论文唐炜炜.doc(46页珍藏版)》请在三一办公上搜索。
1、 2010 届毕业设计(论文) 题 目: 手写数字识别方法研究 学 院: 电子与信息工程学院 专 业: 通信工程 班 级: 通信0602 姓 名: 唐炜炜 指导教师: 谭红 起讫时间: 2010-3-20-2010-6-14 2010年6月37手写数字识别方法研究摘 要手写数字识别是图像处理和模式识别领域中的研究课题之一。手写数字由于书写者的因素,使其数字图像的随意性很大,如:笔画粗细、字体大小、字体的倾斜度等差异都将直接影响到数字字符的最终识别结果,因此手写数字识别是模式识别领域内最具有挑战性的课题。本文主要对手写数字识别的方法进行研究。文中描述了手写数字识别的研究背景和发展状况,并且详细介
2、绍了手写数字识别的预处理方法,讨论了灰度化、二值化、去噪、字符分割、归一化、细化、特征提取和分类识别等方法。在此基础上实现了一个数字识别系统。本系统提取数字的粗网格特征,采用BP神经网络进行训练和识别,并且创建了一个图形用户界面对系统的识别效果进行验证。实验结果表明,本系统其识别正确率达到了预期设想,是行之有效的系统。关键词:数字识别 粗网格特征 BP神经网络目 录摘 要Recognition of handwritten digitsAbstractHandwritten number recognition is one of the research topic field of ima
3、ge processing and pattern recognition. As a result of the written factors that make number images very arbitrary, such as: stroke thickness, font size, the inclination of handwritten numbers, which have a direct impact on the correct identification of numbers. So recognition of handwritten numbers i
4、s the most challenging issues of pattern recognition area.The paper aims to study the methods of handwritten number recognition. In this paper, the background and development of the handwritten number recognition method are introduced. Also the preprocessing of the handwritten number recognition is
5、introduced, which discuss the algorithms of binarization, the smooth, character segmentation and refinement. And then it uses the characters of coarse grid to pick up the numbers characters. After that it use the BP neural network to train and recognize. At last, a GUI is created to verify the resul
6、t. The experimental results show that the recognition systems recognition accuracy meets the expected requirements. The system is effective. Key Words: Number recognition; Characters of coarse grid; BP neural network 目 录摘 要IAbstractII第一章 绪论11.1 手写数字识别的意义和应用前景11.2 字符识别的研究与发展21.3 手写数字识别的难点31.4 本文的主要内容
7、和安排3第二章 字符图像预处理52.1 图像灰度化52.2 图像二值化62.3平滑去噪82.4 字符分割92.5 字符图像的归一化和细化102.5.1 字符图像的归一化102.5.2 字符图像的细化102.6 本章小结11第三章 字符特征提取123.1 统计特征提取123.1.1 复杂指数特征123.1.2 四周边特征133.1.3 投影特征133.1.4 弹性网格特征133.2 结构特征提取143.2.1 笔道密度函数143.2.2 空洞和缺口143.2.3 字符的特殊节点数143.2.4 字符链码153.3 本文的特征提取153.4 本章小结16第四章 神经网络训练及识别174.1 人工神
8、经网络模型174.1.1 生物神经元模型174.1.2 神经元模型184.1.3神经网络模型184.2 BP神经网络194.2.1 BP神经网络介绍194.2.2 BP神经网络的构建204.2.3 BP神经网络的学习训练204.3 基于BP神经网络的字符分类器的设计214.3.1 BP网络的结构设计214.3.2 BP神经网络学习参数设计224.4 本章小结23第五章 系统实现和性能分析245.1 系统的实现245.1.1 预处理模块245.1.2 特征提取模块255.1.3 基于BP神经网络分类器模块265.2 系统性能测试与分析285.2.1 系统性能测试285.2.2 系统性能分析29第
9、六章 总结与展望306.1 工作总结306.2 对未来的展望30参考文献31附1 字符预处理模块程序32附2 BP神经网络分类器的设计34附3可视化GUI识别验证程序35致谢38南京工业大学本科生毕业设计(论文)第一章 绪论手写体数字识别是多年来的研究热点,是指利用计算机自动识别手写在纸张上的数字,它是模式识别领域中最成功的应用之一,具有很高的商业价值。目前,市场上也出现了一些手写体数字识别产品,在许多特定系统(如邮政编码自动识别系统、银行支票自动处理系统等)中有广泛的应用。但由于各人、各地的写法不同,要完全正确的识别手写体数字仍是一件不容易的事情。总之,机器的识别能力与人自身的识别还是有很大
10、差距的,这种差距激励着更多的研究者不断的研究各种各样的手写体数字识别方法。1.1 手写数字识别的意义和应用前景对手写体数字的识别研究不仅有着重大的现实意义而且还有十分广阔的应用前景。当今经济的发展,金融市场化进程的日益加快,票据业务发展很快,票据数量也与日俱增。其中个人凭证、支票、发票、进账单等等票据均需要处理大量的信息。而目前,人类的许多信息是记录在纸上的文字图像,将这些信息输入计算机是比较繁琐且低效的工作。如果通过手写体字符识别技术来实现信息的自动录入,无疑将会有效解决传统人工处理方式中存在的工作量大、成本高、效率低、时效性差等问题。此外,手写数字识别应用领域还有:(1) 手写数字识别在大
11、规模数据统计的应用。例如:人口普查、成绩单录入、行业年检、财务报表录入等应用中。(2) 手写数字识别在财务、税务、金融领域应用。随着我国经济的快速发展,每天会有大量的财务、税务、支票等需要处理。(3) 手写数字识别在邮件分拣系统中的应用。由上可见,对手写体数字识别有着很高的实用价值,除此之外,手写体数字识别作为模式识别领域的一个重要问题,也有着重要的理论价值:(1) 阿拉伯数字是唯一的被世界各国通用的符号,对于手写体数字识别的研究基本上与文化背景无关,这样就为世界各国研究者提供了一个供大家共同探讨技术的平台,研究并比较各种算法的优缺点。(2) 由于手写体数字识别的类别少,有助于作深入分析与验证
12、一些新的理论。这方面最明显的例子是人工神经网络(Artificial Nenural Network,ANN)。很多ANN模型和算法都是以手写体数字识别作为实验测试平台,验证其理论的有效性,评价各种方法各自的优缺点。(3) 尽管人们对手写体数字识别已经从事了很长时间的研究,并取得了一定的成果,但是到目前为止,机器识别本领与人的认知能力相比,还是有很大的差距。(4) 手写体数字识别的方法很容易被推广到其它相关问题上,比如英文字母识别、汉字识别等等。1.2 字符识别的研究与发展字符识别的最早能追溯到1890年一项帮助盲人阅读装置的发明专利。1929年,由德国人Tausheck首先正式提出光学字符识
13、别(Optical Character Recognition ,OCR)的概念,并取得了OCR专利权,四年后美国人Handel也取得了同样的专利权。但真正OCR是在本世纪50年代随着计算机的出现而到来的。在字符识别大发展时期(1990年后),许多研究者对字符识别进行了探索与研究,当时提出许多新的有效识别工具,其中人工神经网络(Artificial Neural Network ,ANN),支持向量机(Support Vector Machine),隐马尔科夫模型(Hidden Markov Model,HMM)等,而这些识别工具至今仍然是研究的热点。(1) 在人工神经网络识别方法中,模式类的
14、描述方法一般还是特征向量,只是在分类时,利用了神经网络的自动学习和记忆功能,通过对样本的训练建立起记忆,然后将未知样本作为输入让神经网络“回忆”出该样本所属的类别。(2) 支持向量机是Vapnik 等人根据统计学理论提出的一种新型机器学习方法。由于其出色的学习性能,该技术已成为机器学习界的研究热点,并在很多领域都得到了成功的应用,如人脸识别、手写体数字识别、文本自动分类等。(3) 隐马尔科夫模型是一类基于马尔科夫随机过程的统计模型。隐马尔科夫模型对于随机信号具有很强的学习和建模能力,因此在语音识别中取得了很大的成功。从上世纪90年代开始,一些研究者已经将隐马尔科夫模型引入到了图像处理、识别和分
15、析中来。手写体数字识别在学科上属于模式识别和人工智能的范畴。在过去的数十年中,研究者提出了许多识别方法,目前手写体数字识别方法可以分为两类:基于结构特征的方法和基于统计特征的方法。通过几十年来各国研究学者得对数字识别的研究,国内外在手写识别上也取得了一定的成就。在我国邮电部第三研究所,以信函分拣为目的,识别书写在信封上的邮政编码。其它用传统方法进行识别研究的有中国科学院自动化研究所,该所对手写体数字识别的研究历史几乎有20年了,在他们新近的报告中,利用以有限状态自动机为主的识别途径识别1100个手写体数字,识别率达95.2%,拒识4%,误识0.2%,上海交通大学基于压缩字结构特征的手写体数字识
16、别算法选取了12600个样本组成训练集,6000个样本组成测试集,用BP网络进行分类,识别正确率为97.58%,误识率为1.04%,拒识率为1.38%。 德国E9的Friedhelm Schwenker采用SV-RBF40对手写体数字进行识别,测试样本10000个,识别正确率为98.56%。清华大学采用SVM对金融票据中的手写体数字进行识别,测试样本20000个,识别率约为92%。然而以上提到的系统,要么对书写的正规程度有要求,要么其测试样本和训练样本出于同一批人之手。总之,一般的系统对书写人员限制较多,或者对书写的正规程度有要求,或者对书写位置有要求,或者对所用笔、纸有要求,例如对税务报表的
17、识别就要求用规定的字型书写数字,并且对书写的位置有要求,而真正的无限制手写体数字的识别的研究还有待进一步提高。1.3 手写数字识别的难点数字识别的难点主要在于以下几方面:(1) 阿拉伯数字的字型信息量很小,不同数字写法字形相差又不大,使得准确区分某些数字相当困难。(2) 数字虽然只用10种,而且笔画简单,但书写上带有明显的地域特性,同一数字写法千差万别,不同地域的人写法也不相同,所以很难做到兼顾各种写法的极高识别率的通用型数字识别系统。(3) 在实际应用中,对数字的单字识别正确率的要求要比文字要苛刻得多。这是因为文字组合一般都存在上下文关系,但数字组合存在极少的或没有上下文关系,所以每个孤立数
18、字的识别都至关重要。而且数字识别经常涉及到财务、金融领域,其严格性更是不言而喻的。因此,对手写数字识别系统的要求不仅仅是单纯的高正确率,更重要的是极低的误识率。(4) 由于脱机手写数字的输入只是简单的一幅图像,它不像联机输入那样可以从物理输入设备上获得字符笔画的顺序信息,因此脱机手写数字识别是一个更有挑战性的问题。1.4 本文的主要内容和安排 本文将对手写数字识别的预处理、特征提取及分类识别的方法进行研究,一个数字识别系统包括图像预处理模块,特征提取模块,字符分类模块。本文的系统框图如图1.1所示。图1.1 系统结构框图 由图1.1可知,数字图像在送入计算机后要先对其进行预处理操作,本文将在第
19、二章介绍图像预处理的相关步骤,并给出一些步骤的效果图。第三章将对数字识别中的特征提取进行介绍,将涉及到特征提取的两大类方法:结构特征提取及统计特征提取。最终介绍本系统使用的特征提取方法:粗网格特征提取法。对于数字识别而言,字符分类器的设计至关重要。在第四章中,本文将对BP神经网络分类器的背景、设计、算法等进行介绍。在本文的第五章,将使用图形用户界面对所设计的系统进行验证。并对结果进行分析,找出不足。最后对论文的工作进行总结和展望。第二章 字符图像预处理数字识别是将写在纸张上的数字,经过扫描变为模拟信号,再经模数变换变为数字信号输入计算机。由于纸张的厚薄、光洁度、书写质量等会造成计算机读取的数字
20、变形,加上扫描、输入过程中不可避免的存在噪声,从而会给实际识别造成干扰。因此在识别前要对输入的图像进行预处理。2.1 图像灰度化图像按色彩类型分为彩色图像、单色图像或称灰度图像。大多数图像是用32位RGB格式表示的,在RGB真彩色图像中,每个像素由相应于红、绿、蓝的3个不同的值组成。当然彩色图像还可以表示成HSL,HSV,HSI等模式。而灰度图像是彩色图像的一个分量之一,一般是8bit的,每个像素用(0,255)表示。只有0和1(或0和255)二值表示的灰度图我们称之为二值图。为了保留更多的图像信息,减小目测结果的误差,本研究采集的是RGB模式的彩色图像。由于印刷的污点和纸张不清洁的影响使彩色
21、图像不容易实现图像分割,故需将彩色图像转化为灰度图像,以利于待识别图像的进一步处理。 设经过扫描输入计算机的图像点阵为: (2.1)式(2.1)中的是图像每个像素点的色彩值。彩色图片上每个像素颜色由RGB三个分量决定,每个分量有255种值可取。 (a)原彩色图像 (b)灰度化图像图2.1 图像灰度化效果图将彩色图像的灰度化处理成灰度图像可用两种方法来实现:第一种方法是求出每个像素点的R, G, B三个分量的平均值,然后将这个平均值赋予给这个像素的三个分量;第二种方法是根据YUV的颜色空间中,Y的分量的物理意义是点的亮度,由该值反映亮度等级,根据RGB和YUV颜色空间的变化关系可建立亮度Y与R,
22、 G, B三个颜色分量的对应:,以这个亮度值表达图像的灰度值。本系统将使用方法二进行灰度化操作,灰度化效果如图2.1。 2.2 图像二值化 二值化就是将灰度图像进行二值化处理,将图像上的点的灰度置为0或255,使整个图像呈现出明显的黑白效果,且二值化图像仍可以反映图像整体和局部特征。对图像进行二值化,需要选择合适的阈值,同时为了得到理想的二值图像,一般采用封闭、连通的边界。由于字符笔画内部有均匀一致的灰度值,使用阈值法就可以得到比较好的分割效果。字符灰度图像中灰度小于阈值T的像素被判定为字符笔画,灰度值置为0。否则这些像素点被认为是背景,其灰度值用255表示。一般的二值化方法有整体阈值法、局部
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 理学 毕业论文 唐炜炜
链接地址:https://www.31ppt.com/p-4544009.html