联机藏文手写识别概述.ppt
《联机藏文手写识别概述.ppt》由会员分享,可在线阅读,更多相关《联机藏文手写识别概述.ppt(23页珍藏版)》请在三一办公上搜索。
1、2023/7/6,1,联机藏文手写识别概述,吴健孙嫣中国科学院软件研究所基础软件国家工程研究中心,2,2023/7/6,摘要,准备工作手写识别过程联机藏文手写识别的预处理联机藏文手写识别特征提取聚类实验方法和结果,3,2023/7/6,准备工作,藏文文字的组成藏文的字符集编码标准GB/T 16959-1997信息技术 藏文编码字符集 基本集GB/T 20542-2006信息技术 藏文编码字符集 扩充集A,字母字丁(字符)音节词句子,4,2023/7/6,藏文字丁的书写特点基本处理单元的选择藏文文字的结构特点相关国家标准识别编码范围基本集和扩充集A在内的910多个字丁,剔出掉了不常用的梵文字符,
2、准备工作,5,2023/7/6,准备工作,联机藏文手写识别的研究基础参考结构文字的联机特征提取方案还是拼音文字的联机特征提取方案?藏文识别相对于汉字识别的特点宽高比1:2笔画方向性圈、弧状结构,6,2023/7/6,准备工作,藏文手写识别难点易混淆字过多印刷体相似字手写体相似字,7,2023/7/6,联机藏文手写识别流程,识别基本流程预处理了对手写输入的字符在字形上进行修正,减少同类字符输入样本间字形上的变异。是保证特征提取和识别算法的有效性的前提。特征提取根据经过预处理后的联机手写字符,提取出相对于位移、大小、旋转、变形等具有不变形的模式特征。,预处理,特征提取,分割,分类,后处理,语料库,
3、word,8,2023/7/6,联机藏文手写识别的预处理,预处理主要操作线性归一化,减少字符大小的变异。加入虚拟点,使字的每个笔画的点密度相同。非线性归一化,减少笔划形状的变异(笔画太长、太短,笔画太集中等)。重采样,减少点的间距的变异以及笔划上点的数目的变异。点的平滑,去除笔画上的噪点。,9,2023/7/6,线性归一化操作的选取公式及宽高比确定进一步改进,联机藏文手写识别的预处理,10,2023/7/6,非线性归一化方案的选取基于线密度基于交叉距离基于点密度,联机藏文手写识别的预处理,方案1:“初始方案”,使用基于点密度的非线性归一化操作;方案2:基于线密度的非线性归一化操作。方案3:基于
4、基交叉距离的线密度非线性归一化操作。方案4:改进后的基于点密度的非线性归一化操作。,11,2023/7/6,联机藏文手写识别的预处理,对基于点密度的非线性归一化方案的改进笔画断裂、笔画间不连续的原因直方图投影变化剧烈解决方案,12,2023/7/6,联机藏文手写识别的预处理,笔画等距离采样和平滑基本作用都是为了消除噪音。应用在非线性归一化操作之后,除了能消除手写字符本身由于抖动带来的噪音以外,还可以消除由于预处理阶段中前续处理带来的附加噪音。等距离采样 平滑,New,Old,W和H是经过重采样操作处理后的手写样本的宽和高。,13,2023/7/6,联机藏文手写识别的特征提取,特征提取根据经过预
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 联机 藏文 手写 识别 概述
链接地址:https://www.31ppt.com/p-5430086.html