欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    文通THOCR资料数字化系统.ppt

    • 资源ID:5740270       资源大小:934.50KB        全文页数:22页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    文通THOCR资料数字化系统.ppt

    文通TH-OCR资料数字化系统,自有产品事业部 编写人:王亚鹏,专业的档案、公文、图书、剪报册等纸介质文档及电子文档的数字化工具。1.系统特点:双层PDF技术及版式还原技术处于业内领先水平单字识别率达到行业内领先水平题录信息可以自定义工序可以自定义2.应用领域政府部门出版社图书馆电力行业报社,一.软件用途,二.软件简介,1.总体架构,2.管理端,2.1管理端简介:角色管理角色管理分为:角色创建、修改、删除、成员管理用户管理用户管理:用户管理包括添加用户、用户资料修改、用户权限设置工作量统计按照工作量、时间段等进行各种统计及生成报表题录数据设置根据客户要求进行题录项的设置,3.加工端,加工工序选择生成加工工序数据流通道,3.1任务调度中心,自动倾斜校正 二值化 去装订孔 去黑边 去杂点,3.2图像处理,可以对档案、图书、公文、报纸等进行自动版面分析。将版面分为横排文本、竖排文本、图像、表格四种类型。用户也可以根据需求,进行手动版面分析。,3.3版面分析,竖排文本 图像 表格 横排文本,识别核心流程版内置文通科技最新研发的高性能文字识别引擎,识别率达99.8%以上。Unicode编码采用UNICODE国际编码标准。系统可在一个统一的平台下,同时处理包括中文、日文、韩文、英文在内的多种文字的识别和校对修改。XML技术系统基于开放式的XML数据结构,可以对数据进行扩充和再定义。支持第三方开发厂商方便地进行文档数据的转换、迁移和再利用。,3.4识别核心技术,可以进行简繁日韩英五种语言的文字识别:简体多体繁体多体简体全字集繁体全字集手写体纯英文日文韩文,识别语言种类,横向校对在识别结果区域中,通过人工逐字逐句比较识别结果与原始图像,找到错误的地方并修改。浮动跟踪条可以提高横向校对的速度,它是将识别的原始图像块跟踪显示在识别结果上,使识别结果与原始图像一一对应的显示,直观、方便、快捷,3.5校对,查错率高,集字校对编辑器把识别结果相同的文字对应的图像显示在一起。由于少数错误的字与大量正确的字有差别,可以比较容易地发现错字,不易漏掉错误。集字校对编辑器重新组织文字顺序,不会使校对人员陷入到识别文字的故事情节中。校对效率高,不易疲劳。把集字校对的结果与传统方法校对的结果进行比较、综合,就能得到最高的查错和纠错效果,得到尽可能低的错误率和最好的最终结果。,集字校对,集字校对,识别结果经修改编辑后,可根据需要将文档存为RTF、PDF或直接保存为TXT格式。导出为PDF格式导出为RTF格式导出为TXT格式导出题录数据,3.6生成多种格式文件,PDF中的文字层用于查询、检索、利用,图像层用于浏览,提供给用户多种应用方式。图像部分压缩存储。对黑白图像采用G4压缩,对彩色、灰度图像采用JPEG压缩。文字部分所占空间极小。整个文件与压缩过的图像文件大小相差无几。,识别图像,文本层,图像层,双层PDF,双层PDF特点,题录著录:根据题录项要求录入题录数据,3.7题录数据录入,题录校验、全文文件检查、题录项修改、数据导出或上传,3.8质检、导出或上传,三、典型应用,政府行业:中央办公厅、组织部、纪检委、保密局等图书馆:清华大学图书馆、北京大学图书馆等出版社:商务印书馆、中华书局等电力行业:国电信息中心、各省市电力设计院、各省市电力科学院报杜:大连日报社、深圳特区报、南方周末,四、销售策略,1、政府行业客户:省级中共办公厅:机要局、秘书局、交通局等中共纪检委:各省市的纪检办公室组织部:省委组织部、市委组织部保密局、国安局等需求:档案数字化需求,2、图书馆行业客户:高校图书馆、国家图书馆、省图、市图、区图、县图等需求:特色馆藏,期刊,论文,图书等3、集成商客户:方正电子、方正阿帕比、同方知网、万方数据、书生、龙源等需求:数字出版、资料加工、档案数字化等需求,五、价格体系,

    注意事项

    本文(文通THOCR资料数字化系统.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开