挑战杯基于鼠标的联机手写项目结题报告.doc
《挑战杯基于鼠标的联机手写项目结题报告.doc》由会员分享,可在线阅读,更多相关《挑战杯基于鼠标的联机手写项目结题报告.doc(43页珍藏版)》请在三一办公上搜索。
1、 宜宾学院 Y I B I N U N I V E R S I T Y “挑战杯”科技创新项目结题报告项目名称: 基于鼠标的联机汉字手写识别输入软件系统项目负责人: 院校班级: 计算机与信息工程学院12级创新班 指导老师: 时 间: 2014.11.16 简表:项目名基本情况项目名称基于鼠标的联机汉字手写识别输入软件系统类别社科论文和调查报告 自然科学论文 科技发明制作项目负责人情况姓名雷晓鸣学院/年级/专业计算机学院/12级/数字媒体专业学号121104035性别男联系电话18383118113电子邮箱570302586 项目合作者情况姓名性别学院专业学号联系电话曾帆东男计算机与信息工程学院
2、计算机科学与技术12110103718383118182何爱林男计算机与信息工程学院软件工程14060101115775973892项目简介 (1)实现了采用鼠标书写汉字的笔迹识别及存储方法。解决了脱离手写板后的汉字书写轨迹的记录技术。(2)研究分析了手写汉字的基本特点,设计了软件系统的初步功能及操作界面。如下图所示:输入汉字信息提示区汉字识别文本区菜单区手写汉字区域工具栏区图一 汉字手写识别输入系统主界面摘 要随着计算机技术特别是互联网技术日新月异的发展,人类步入了信息时代。在中国,个人计算机已进入千家万户。在计算机上使用汉字,首先遇到的问题是如何有效地输入汉字,汉字输入直接影响着计算机中文
3、信息处理的应用与发展。 在计算机上输入汉字,大都使用拼音法输入,常常不是拼不出,就是读不准,想用类似五笔法输入却往往不会拆字。针对这种情况,“手写式”输入方法变得越来越受大众欢迎。该方法完全符合人们的日常书写习惯,与平常书写汉字时一样,差别仅仅是使用者需要将输入的汉字写在“手写板”上,计算机通过捕获书写笔迹的点进行汉字识别,从而完成汉字输入。 论文论述了一种基于汉字笔划的联机手写汉字识别系统的研究与实现,在设计上通过实时捕获书写笔划的轨迹,识别出汉字的笔划,再根据笔划序列查找对应的汉字;当存在多个相似的笔划序列时再根据输入笔划的像素统计结果给出最可能的结果。在实现上不需专用的“书写板”,仅用鼠
4、标作为手写汉字输入的工具。 论文所采用的笔划识别方法是以笔划方向码的概念为基础。笔划可以细分成笔划段,本文将这些笔划段分别用8个笔划方向码来表示。在书写笔划的过程中,笔划轨迹是由一系列坐标点组成, 这些坐标点是离散的。本文用8个笔划方向码标记每1段最小直线所属的方向。每1个笔划的书写轨迹都可以产生出1个方向码序列即当前笔划的笔段序列。算法通过对方向码进行噪声处理、归并之后得到笔划的方向码序列;并通过对笔划的像素进行统计得到分区处理后的像素比例。论文设计了基于汉字笔划的联机手写汉字识别系统的工作流程。汉字识别中主要讨论了以下几个问题:(l)单一笔划的识别方法;(2)汉字笔划串的匹配;(3)图像统
5、计特征的匹配以及相关问题。 在书写工整的情况下系统识别率可达到90%左右。 关键词:联机手写汉字识别;笔划;方向码;模式识别;统计特征ABSTRACTWith the computer technology,especially the rapid development of internet technology,mankind entered the information age. In China,many families have personal computers. The use of Chinese characters in computers,the first en
6、countered the problem is that how to effectively input Chinese characters. Chinese character input directly affecting the computer and information processing application development. Many Chinese keyboard input methods,mainly boil down to two categories: Pinyin input method and Codes input method. W
7、hen people input Chinese words into computer they have such worries. When using of phonetic input method,user pronunciation is not correct. When using of Codes input method,user dont know how to split the Chinese characters. In light of this situation,handwritten input method has become increasingly
8、 popular. People can write entirely in accordance with their daily habits. When writing characters,users only need to input the Chinese characters in “tablet”,and computer captures the points of handwriting to accomplish Chinese characters recognition,and then complete inputting Chinese characters.
9、Paper discusses an online handwritten Chinese character recognition system and its implementation based on strokes. The system identifies the Chinese character strokes by real-time capturing the trajectory of strokes, and then identifies the corresponding Chinese character stroke sequence. When ther
10、e are several similar stroke sequences, it use the pixel statistics to give the most possible results. In realization, special input tool is not needed but a mouse. The method of stroke recognition which is taken by this thesis is based on the concept of the code of stroke direction. Stroke can be b
11、roken down into stroke sections, which are coded by eight directions. In the process of writing strokes, stroke path consist of a series of coordinate points, and these coordinates are discrete. In this paper, eight directions are used to mark the smallest section of the stroke. Each stroke is marke
12、d by a code sequence of direction. First the algorithm processes the noise of the direction, and then gives the most simple code sequence by merging the direction of strokes. And through the pixel statistics of strokes the proportion of pixels is given after partition. Thesis designs the workflow of
13、 the online handwritten Chinese character recognition system based on strokes. Chinese character recognition focuses on the following issues: (l) the identification of a single stroke; (2) the matching of Chinese characters strokes sequence; (3) the matching of pixel statistics and some related issu
14、es. Written neatly the systems identification rate can achieve around90%. Key words: On-line handwritten Chinese character recognition; Stroke; Directioncode; Stroke segment; Pattern recognition; Pixel statistics结案研究报告目录引言6编写目的6项目背景71.联机手写汉字识别概念71.1模式识别71.1.1模式识别基的本概念71.1.2模式识别的基本方法81.2联机手写识别91.2.1联
15、机手写汉字识别基本概念91.2.2联机手写的基本方法91.2.3发展现状102可行性研究的前提112.1要求112.2目标112.3条件、假定和限制122.4需求分析123对现有系统的分析133.1处理流程133.2费用支出143.3人员143.5设备144所建议技术可行性分析144.1对系统的简要描述14配置需求144.2与现有系统比较的优越性154.3采用建议系统可能带来的影响154.3.1对设备的影响154.3.2对现有软件的影响154.3.3对用户的影响154.3.4对系统运行的影响154.3.5对开发环境的影响154.3 .6对运行环境的影响155用户使用(社会)因素可行性分析166
16、成果转化措施及社会、经济效益分析167任务概述167.1目标167.2运行环境168功能需求168.1功能划分168.2功能描述179运行需求179.1用户界面1710总体设计2110.1总体简介2110.2模块外部设计2110.3拟采取的研究方法2210.3实现难点2211. 创新点2312. 软件操作说明2313. 部分代码参考32参考文献43引言编写目的 数量浩大、结构繁杂、变化多端的汉字难以输入计算机的问题,曾一度成为我国信息化进程的瓶颈之一。作为模式识别技术的组成部分,汉字识别技术也是世界各国文字识别领域最为困难的问题。汉字识别涉及模式识别、图像处理、数字信号处理、自然语言理解、人工
17、智能、模糊数学、信息论、计算机、中文信息处理等学科,是一门综合性技术,在中文信息处理、办公室自动化、机器翻译、人工智能等高技术领域,都有着重要的实用价值和理论意义。汉字识别可以分为印刷体汉字识别和手写汉字识别两类。手写汉字识别可再分为脱机识别和联机识别两种类型。当前手写汉字识别的研究主要集中在联机识别技术这一领域。经过近十年的研究,手写汉字联机识别技术已取得了一定成果,也开发出了许多产品,电子手写笔和手写板是其典型的代表。然而,手写汉字联机识别技术在理论上也存在许多尚待解决的问题,如:任意连笔书写和较少笔顺限制的手写汉字识别技术等。因此在理论上如何解决连笔书写等识别技术难题以有效提高汉字识别的
18、准确率有待进一步研究。同时,在产品方面,当前的联机识别产品都借助于手写板这一硬件来实现,其产品成本和产品升级都需要较大代价。本项目将借助于电脑通用配置的鼠标来实现手写汉字的输入,配以项目开发的软件完成联机手写汉字的识别和输入。这一技术有着广泛的市场应用前景和较高的经济效益。主要表现为:(一)不再需要手写板这一硬件,只需电脑的通用配置鼠标即可,节约了产品成本。(二)克服了手写板损坏的成本问题。手写板在损坏以后需要一定的维修费甚至重新购买,而对于项目开发出的软件出现问题的时候,可以重新安装,不需要增加任何成本。(三)克服了产品升级的成本问题。手写板的升级一般都需要更换产品,则意味着一定的硬件成本,
19、而项目完成后的应用软件升级则不需要成本,可以通过网络直接在线升级。因此,本项目在理论研究和应用软件开发方面都用着重要意义和实用价值。项目背景联机手写字符识别的发展历史可以追溯到本世纪五十年代,伴随着手写板硬件的出现,人们开始研究联机手写字符识别技术。联机手写汉字识别技术相对起步较晚。1981年,IBM公司E.F.Yhap等推出了第一套较为成熟的联机手写汉字识别系统。该系统是基于对汉字进行笔划、字根编码的思想进行识别的。系统中每个汉字用72种字根拼成,而每个字根又可分解为42 种笔划的组合,通过对笔划和字根的判定识别所输入的汉字。1988年我国中科院刘迎建等人提出利用笔段为基元的联机手写汉字识别
20、技术。该方法把汉字分为笔段、笔划、字根、单字和词组五个层次,分别用模糊属性文法进行描述,以启发式模板引导匹配。该系统采用了对笔段进行基于位置关系的排序方法,摆脱了对笔顺的依赖。识别字典可达到6763-12000字。目前,中科院仍在进行联机手写汉字识别技术的研究与开发,其产品“汉王九九”联机手写识别系统在国内的市场占有率目前占据首位。当前,国外公司也开始注意联机手写汉字识别这一领域。IBM、Apple 等大公司均已经投资于该方向的研究。市场上也出现了许多较成熟的产品,如:蒙恬输入系统,联想1+1手写连笔王,IBM超薄手写板等。然而,绝大多数产品都采用手写板为载体。而直接单纯以软件的方式实现汉字联
21、机输入的应用软件系统几乎没有。因此,直接借助于鼠标和配套软件实现汉字输入和识别将是对目前联机汉字识别产业的有益补充,也将成为这一领域的重要发展力量,有着广阔的市场前景。1. 联机手写汉字识别概念1.1模式识别1.1.1模式识别基的本概念模式识别(Pattern Recognition)是人类的一项基本的智能,在日常的生活中工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。(计算机)模式识别在20世纪60年代初迅速发展并成为一门新科学。模式识别(Pattern Recognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或
22、现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式识别又常称作模式分类,从处理问题的性质和解决问题的方法等角度,分为有监督的模式识别方法和无监督的识别方法两种。这两种模式识别方法的主要差别在于,各实验样本所属的类别是否预先已知。一般说来,有监督的分类往往需要提供大量已知类别的样本,但在实际问题中,这是存在一定困难的,因此研究无监督的分类就变得十分有必要了。1.1.2模式识别的基本方法1.决策理论方法决策理论方法又称统计方法,是发展较早也比较成熟的一种方法。被识别对象首先数字化,变换为适于计算机处理的数字信息。一个模式常常要用很大的信息量来表示。许多模式识别系统在数字
23、化环节之后还进行预处理,用于除去混入的干扰信息并减少某些变形和失真。随后是进行特征抽取,即从数字化后或预处理后的输入模式中抽取一组特征。所谓特征是选定的一种度量,它对于一般的变形和失真保持不变或几乎不变,并且只含尽可能少的冗余信息。特征抽取过程将输入模式从对象空间映射到特征空间。这时,模式可用特征空间中的一个点或一个特征矢量表示。这种映射不仅压缩了信息量,而且易于分类。在决策理论方法中,特征抽取占有重要的地位,但尚无通用的理论指导,只能通过分析具体识别对象决定选取何种特征。特征抽取后可进行分类,即从特征空间再映射到决策空间。为此而引入鉴别函数,由特征矢量计算出相应于各类别的鉴别函数值,通过鉴别
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 挑战 基于 鼠标 联机 手写 项目 报告
链接地址:https://www.31ppt.com/p-2396179.html