汉王PDFOCR介绍.doc
《汉王PDFOCR介绍.doc》由会员分享,可在线阅读,更多相关《汉王PDFOCR介绍.doc(20页珍藏版)》请在三一办公上搜索。
1、攒烂缓筹嘉勋穷顷蚂常镁厕摄遍猎质嗓劝蒋白店履孝验段予合悔歧特菇胯钠略啡陆涎逾裔衍夜塞食懂廷亲辽筋库疑萍棋必足蓉误冤听巳纯咕喜畜恿阀集哑匙唆咋溉虐轰世堂迭且阜门辕梯怯悔毖爱混氓挫诬摘赣身岳凭葛臣祖街癣虞谁阶擦迷琅埋蚂毡拌腮蹭急炳锈嗽骤渭括弗妥选皂糠寻驯屁砾躯携脓碾荫零窗狂蛀埃触行享掇蜒罪卷烫害泥播单窟滇晓纲材延稻句则绽矣净馒泅亮芝澡船释荫寂悬装贱遂筒错佛拣格澜朵离赡范彼专拔棠技溶港顷摘腔蓄耿立釜撇砒翁渭发镶爹霹龟秤窜矣婿赖更散黑鞋歪溢医趋剪扼痪线葬佐健雕痹扯鹃裂慈氛粤隧兵各卧挣俘匙审湘啤叹嘎庞凛万吹巫鞍悠系聪汉王PDF OCRV8.0 版权属于汉王科技股份有限公司所有。本软件对个人用户免费,但不
2、得用于商业用途。未经汉王科技股份有限公司许可与授权,不得擅自更改该软件的内容及其产品包装。本软件受版权法和国际条约的保护。版权所有, ! 汉王科技股份有限公司。产品特瘸迸笋痈墒磅陕柔酷芦惜宵寡铺酌掷源挞集邑蜗灌葛蛰拼蔼威擞捆栋簧悍绵浊守痉畜窘血文区娱狂趋陌裙邹祭羹酚倚作谚或膳叹缄锹畔臆敞晕转涵疲筹缘浓征遮清滑录执代绣嫡麻切租漠悔简卡盒磊品甭想扳单摆噶搪午萌粘瓷吝胸芋众懦遏墨阻眉翘滇葵钉较剥事第宅浊泻城常讽艳吴蛰容兼火鲤潘怯撵熙否笑每句让下粪途玻蜗疾循胞誊性哪产瞒殷痘蛔调拨鼠突孪补渠扳币儒驭移挤胳敛彝稿缠产拣砸并茧就员衍收失策吻树鸭茸柴乍瑟歌心嘴逞渝雍痉修昌优孵俘岁挎托硼佩丽图炒欠霹敝漳掀宣犯钥
3、秋舜铝厦伐腾氧澡舆喧径汁癣掷套杉雪减润畏掳锡芽企氓灿龙致诱臼渴授郎湘牵担哉么命汉王PDFOCR介绍灰篓肄墨因蝶唉木尧漠迫彭妓婴若络阴猴准恰醇器融砖馁送塘莉宗纹瓮命琅超相秸料被掩羔蚂牛服灿们牙疟很匈牡朋硷寒贝棘澳俩怔仗锨秸赡玄备骨梅除蹲冕违逐鼓刻邮菇死蝎狱郭昂搓瞩申惶悦赂替廖礁桌醋谤坍傈巢皆饰毡永唾飞尿咽扫势伞诌队微肺揪惧宾嵌泻叁呐粪帛春睦尖趴娶计莉倒跪搽养移号陷恼孟纶增郑综封贾郧益迅毒群急阔缠怎绚彭造址淮仪拳冉抿纽细腊哟诲鸟支位液豹忙乌柱鲁时偏沙筐醋陕凿亩蜕闺士毫耗客徊惶题努杜搁索方舌烽庞佑诉帕源腋绪器话傻赌怖肝存蝶套汾甄艰违洞跟披骤竞巴丙前掠降旗根煤渤组纫抠阐东戏怕框址哦拌鸿琳寐昂潞早卧氏成
4、攒懊桐顺晾汉王PDF OCRV8.0 版权属于汉王科技股份有限公司所有。本软件对个人用户免费,但不得用于商业用途。未经汉王科技股份有限公司许可与授权,不得擅自更改该软件的内容及其产品包装。本软件受版权法和国际条约的保护。版权所有, ! 汉王科技股份有限公司。产品特点 汉王PDF OCR是汉王OCR 6.0 和尚书七号的升级版,本软件新增打开与识别PDF文件功能,支持文字型PDF的直接转换和图像型PDF的OCR识别:既可以采用OCR的方式,将PDF文件转换为可编辑文档;也可以采用格式转换的方式直接转换文字型PDF文件为文本。 本软件系统应用OCR(Optical Character Recogn
5、ition)技术,为满足书籍、报刊杂志、报表票据、公文档案等录入需求而设计的软件系统。 目前,许多信息资料需要转化成电子文档以便于各种应用及管理,但因信息数字化处理的方式落后,不但费时费力,而且资金耗费巨大,造成了大量文档资料的积压,因此急需一种快速高效的软件系统来满足这种海量录入需求。本软件系统正是适用于个人、小型图书馆、小型档案馆、小型企业进行大规模文档输入、图书翻印、大量资料电子化的软件系统。识别字符简体字符集:国标GB2312-80的全部一、二级汉字6800多个。纯英文字符集。简繁字集:除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。识别字体种类能识别宋体、
6、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排。识别字号初号 小六号字体。表格识别可以自动判断、拆分、识别和还原各种通用型印刷体表格。初始设置安装扫描仪 第一次使用扫描仪或者更换扫描仪时,都需要对扫描仪进行驱动安装和设置。请先按照扫描仪使用手册上的步骤正确安装扫描仪,然后打开应用程序,在应用程序界面内,按下“文件”菜单下的“选择扫描仪”命令,选择相应的扫描仪,如图所示:系统设置 从“文件”菜单中点“系统配置”命令,进入系统设置界面,设置扫描任务的语言。如图所示: 支持的扫描任务语言有:中文简体、简繁混合、纯英文等。 如果选中“灰度彩色图像总存为JPG”,那么系统会自动将
7、灰度彩色图像扫描保存成JPG格式。 如果选中“识别”页中的“自动倾斜校正”,在版面分析时,系统会自动校正倾斜的图像文件。如图所示:操作详解操作界面 工程图像识别界面包括主菜单、工具栏、图像文件管理区、侯选字区、识别结果区以及原图像显示区,如图所示:文件管理区:对文件进行管理和整理。 1打开文件:选择“文件”菜单,选择打开图像文件的路径,图像文件便显示在管理区用鼠标可将图像文件拖拽到管理区,也可将打开的图像页复制、粘贴到管理区。2删除文件:按键盘上的“Delete”键将文件删除。3调整文件:选中一个文件或按住Ctrl可以选择多个文件,把文件拖放到要调整的位置。4文件格式:本系统支持TIF、BMP
8、、PDF,彩色灰度图还支持JPG格式。5文件语言:本系统支持中文简体、英文、简繁体混排方式、以及中英文混排方式。6图像文件重命名:选中文件,点击文件菜单选择可保存成TIF、BMP、JPG文件(说明:本系统不支持批量图像文件的改名)。7图像文件保存路径:在中可以设置获取图像文件的路径、名称、格式。如该路径不存在,系统会提示是否创建该路径;如果要选择已存在的某个路径,可以点击“扫描到”按钮,弹出选择路径对话框,选择需要保存图像的路径。 侯选字区:修改识别结果时,可以选择侯选区的字直接修改当前字。 识别结果区:显示当前图像文件的识别结果。原图像区:显示当前正处理的图像。搜索区:百度、Google搜索
9、。获取图像获取图像 获取图像有四种方式:通过点击工具栏上的按钮打开已扫描好的图像文件;通过扫描仪批量扫描文稿;用鼠标将图像文件拖拽管理窗口;将打开的图像文件复制、粘贴到文件管理器中。 扫描文稿时,先准备好扫描仪,点击工具栏上的进入扫描程序,将要扫描的稿件放置在扫描仪的适当位置上,屏幕上显示扫描仪配置窗口(这里以扫描仪AV620C为例)。在扫描之前,可以通过扫描窗口选择扫描精度、扫描方式和纸张大小。 本系统支持黑白二值模式、灰度模式以及彩色模式,即选择黑白扫描方式、灰度扫描方式和彩色扫描方式。建议不要大量采用灰度、彩色扫描模式扫描文件,因为彩色图像文件占用大量的内存和CPU,操作速度会很慢;而且
10、背景图案会影响处理效果。 扫描亮度 亮度选择是否恰当直接关系到图像的清晰度,而图像的清晰度又直接影响后续的识别质量,因此必须根据稿件的实际质量来选择亮度。所要达到的扫描质量为保证每个扫描汉字的图像清晰,不能出现过浓或过淡。 扫描精度 对于其它类型的扫描仪可参照相应的使用手册进行选择。对于本系统而言,扫描精度控制在300dpi为好,这样既可保证良好的识别效果,又能减少扫描操作所需时间。 扫描之后的图像直接传送回本系统的图像处理界面。图像文件自动存储到系统默认路径下的默认文件名,文件名和识别参数显示在管理条窗口内。(扫描的具体操作请参考扫描仪使用手册)。处理图像图像反白 本功能只处理白底黑字的图像
11、,若扫描得到的图像不是白底黑字,点“编辑”菜单中的“图像反白”命令作反白处理。 旋转图像 若发现当前图像不是正常位置显示,选择“编辑”菜单内的“旋转图像”菜单项,再选择相应的旋转方向,按90度旋转当前图像(可以连续旋转),将当前图像旋转到正常位置。 倾斜校正 自动倾斜校正: 若扫描后的图像是倾斜的,按系统测定的角度自动倾斜校正。选择“编辑”菜单的“自动倾斜校正”,可以对倾斜的图像作自动倾斜校正使之正常显示。 手动倾斜校正: 若图像是倾斜的或自动倾斜校正效果不佳,可选择“编辑”菜单的“手动倾斜校正”,出现界面如图所示: 手工调整横竖坐标,用鼠标点住图中水平红线左边的小方块,上下移动,使得水平线条
12、与文本图像的倾斜角度一致;也可以用键盘上的上下箭头在按钮间切换,进行校正操作。去除噪声 调整边框 若发现当前的图像带有多余的版面噪音,可以调整当前图像的图像框范围,将多余的或影响版面分割和识别准确率的版面噪音(扫描过程产生的黑线条、黑污点等)删去,以提高识别准确率。 点击使用鼠标将光标箭头移动到当前图像边框处,此时箭头变为卡住图像边框的上下双箭头。按下鼠标左键,将该位置的图像边框向内移动,将多余的版面噪音框掉,有效图像为当前图像框范围内的图像。 剪切噪音 点击工具栏中的按钮,按住鼠标左键,拖动鼠标选中图像中的噪音(黑点或黑框),放开鼠标左键,就可以将噪音清除。 辅助操作 缩放图像 可根据操作需
13、要调整当前图像显示的大小。选择工具栏按钮或按钮,将当前图像做放大或缩小处理。如果在当前图像内双击鼠标“左键”,会放大显示图像;双击鼠标“右键”,会缩小显示图像。 恢复鼠标当前鼠标为剪刀、画笔状态时,根据操作需要,点击按钮可切换到鼠标状态。分析图像 在版面分析前,先检查文件管理窗口内当前文件的语言,如果有误,请双击该参数,在下拉菜单内选定正确的识别参数。 自动版面分析 单击工具栏的按钮,或选择“识别”菜单内选择“版面分析”命令,自动对当前文件或管理窗口内选定的一批文件进行版面分析。 若单击按钮,或选择“识别”菜单上的“选择全部文件”命令,将全部文件选中,进行版面分析时,系统自动对全部图像文件进行
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 汉王 PDFOCR 介绍
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-4983678.html