档案数字化加工工作流程多篇.docx
档案数字化加工工作流程第一篇:档案数字化加工工作流程数字化加工工作流程1.LL项目策戈IJ在档案数字化加工项目中,项目策划阶段主要完成四个方面的工作:召开项目启动会、试扫前的准备工作、试扫工作和数字化加工前的准备工作。l.l.l.l.召开项目启动会在档案数字化加工项目中,在项目正式开始实施前,需要召开由用户方领导、用户方项目负责人、用户方其他相关人员、我公司领导、我公司项目经理、我公司数字化流程各个环节负责人参加的启动会,在启动会上要明确项目的目标、范围、组织机构、注意事项等内容,并形成项目启动会议纪要。1.Ll.2.试扫前的准备工作在档案数字化加工项目中,在进行项目试扫工作前,项目经理负责组织完成以下准备工作:加工场地环境的准备:包括监控设备、项目横幅、项目看板、试扫人员桌椅、饮水机、电话、试扫人员岗位流程牌、管理制度等;试扫网络环境的搭建:布线搭建数字化试扫加工现场的局域网,保证各台参与试扫的计算机都能相互访问和访问服务器;档案数字化管理系统的安装、调试和初始化:项目经理(或指定人员)负责将数字化管理系统安装到局域网(包括服务器端和各个试扫客户端的安装),并进行调试,保证每个试扫客户端都能访问数据库服务器,根据项目的实际情况(参照档案数字化项目用户需求调研报告)进行“数字化管理系统的初始化工作,包括建立档案库、系统配置、流程设置、试扫人员管理等工作;档案准备:打印输出标准格式的考勤表、值日表、外来人员登记表、提卷单、还卷单等。I .1.13.试扫工作在档案数字化加工项目中,依据合同中的档案数字化项目用户需求调研报告,项目经理和试扫人员(由数字化加工各环节负责人组成)抽取各年度档案资料进行为期5个工作日的扫描测试,形成扫描测试报告,并由项目管理组对扫描测试报告进行评审并签字确认,依据扫描测试报告和用户对项目实施周期的要求,我公司数字化项目评估小组与数字化制作部经理对项目成本、所需设备、人员等进行评估,形成项目规模评估报告并签字确认,如果需求存在变化,则形成新的档案数字化项目用户需求调研报告,并提交项目管理组进行评审并签字确认,依据项目规模评估报告,我公司数字化制作部经理负责提供相应的设备和工作人员,项目经理负责制定人员计划、设备计划、场地计划、进度计划,质量保证组负责制定质量保证计划,并提交给项目管理组进行审批,如果存在问题,则需要项目经理进行修改并再次提交项目管理组评审,直至评审通过。1.12提卷出库在档案数字化加工项目中,根据项目日产量,由提卷出库人员负责与档案管理人员一起从库房提取本次(可以为一个工作日或者多个工作日)需要加工的档案实体,对提卷出库的档案实体进行逐卷清点,保证案卷封面的档号与调卷单开具的档号应一一对应,在每次提卷的过程中:1、档案管理人员负责对出库的档案实体进行出库登记(包括出库日期、全宗号、年度、起止卷号、所调卷数等信息),并由档案管理人员和提卷出库人员共同签字确认;2、提卷出库人员负责填写提卷单相关信息,包括调卷时间、全宗号、年度、起止卷号、所调卷数等信息,对于调卷时所缺的卷,在提卷单上要明确进行说明,对短缺以及其他特殊情况的处理要进行详细记载,最后需要由提卷出库人员和档案管理人员一起进行签字确认;3、档案管理人员陪同、跟踪、监督提卷出库人员将档案实体从用户库房运送到加工现场的全过程;4、项目经理对进入加工现场的档案实体进行入场登记(包括入场日期、全宗号、年度、起止卷号、入场卷数等信息),并由项目经理和提卷出库人员共同签字确认;5、项目经理在调卷记录中签字确认。项目经理接收案卷后,提卷出库人员可以利用数字化管理系统中的提卷出库功能,将提卷相关信息录入到系统中。如下图所示:1.1.3.档案查卷在档案数字化加工项目中,档案查卷人员对所提案卷进行逐卷的检查核对,核对案卷中是否有卷内目录、备考表,并将检查结果记载到流程单,对拟扫描档案逐份进行鉴定,区分扫描件与非扫描件。档案严重破损、污染和字迹褪变等情况在流程单相应栏中标注清楚”此件不扫、此页不扫、原件破损、原件模糊、原件残缺等情况说明。最后,查卷人员将形成流程单加入到案卷首页,保证案卷与流程单的一一对应,查卷人员在处理完每一卷档案后,需要在流程单上填写查卷相关信息(如查卷人、查卷时间、发现问题等信息),同时利用“数字化管理系统中的档案查卷功能,将查卷相关信息记载到系统中。II .4.编写页号在档案数字化项目加工中,编写页号人员负责对每卷进行页号的编写(以案卷大流水为原则,即每卷一个流水号),在编写页号的过程中,编写页号人员要将文件中遇到原件有破损、水迹、墨迹、字迹扩散、复印件、传真件、破损、虫、霉、火烧痕迹(包括破损处被修复过的痕迹)的情况详细的记载在流程单中,编写页号人员在处理完每一卷档案后,需要在流程单上填写编写页号相关信息(如编写人、编写时间等信息),同时利用数字化管理系统中的编写页号功能,将编写页号相关信息记载到系统中。I .1.5.拆除装订物在档案数字化加工项目中,装订物拆除人员负责对每卷进行检查,如果发现装订物,如原金属装订物(如:金属夹条、回形针、订书订、大头针等)及一般线装物(如:后期装订线等),需要采用夹子、剪刀等相应拆除工具,将装订物进行拆除,但必须小心细致,不得损坏档案(档案中的精装书籍及成精装书籍状装订的档案不得拆散,可用零边距挂边扫描),当完成一卷的装订物拆除工作后,装订物拆除人员需要在流程单上填写装订物拆除相关信息(如拆除人、拆除时间、拆除内容等信息),同时利用''数字化管理系统中的装订物拆除功能,将装订物拆除相关信息记载到系统中。1.16数据录入在档案数字化加工项目中,数据录入人员依据档案数字化项目用户需求调研报告中著录项要求,利用数字化管理系统中的数据录入功能,参照档案实体以卷为单位逐卷、逐件进行档案目录信息的录入。数据录入人员在处理完每一卷档案后,需要在流程单上填写数据录入相关信息(如数据录入人、数据录入时间等信息),同时利用“数字化管理系统中的“数据录入功能,将数据录入相关信息记载到系统中。II 1.7.数据质检在档案数字化加工项目中,数据质检人员依据档案数字化项目用户需求调研报告中著录项要求,利用数字化管理系统中的数据质检功能,参照档案实体以卷为单位逐卷、逐件对已经录入的档案目录信息进行校对,如果发现错误就地进行修改,系统自动记载数据错误信息和改错过程信息。数据质检人员在处理完每一卷档案后,需要在流程单上填写数据录入相关信息(如数据质检人、数据质检时间等信息),同时利用“数字化管理系统中的"数据质检功能,将数据质检相关信息记载到系统中。III .8.纸面处理在档案数字化加工项目中,纸面处理是整个数字化加工工序中最难、最重要的一个环节,纸面处理的好坏,直接关系到整个数字化加工项目的质量。纸面处理工作包括:折角、皱折问题:可以采用厚书或其他较重的物体压平、烫平办法、蒸汽熏蒸等方法进行处理;霉变问题:首先可以采用清洗技术,对于清洗不掉的霉变纸张,可以采用先进行蒸汽熏蒸,然后采用擦洗技术,将纸张上的霉变物质进行清除;传真件或电报件所使用的热敏纸问题:进行加深复印(扫描时只需扫描复印件即可);原件破损缺字问题:先进行纸张修裱(扫描时需要对修裱后的纸张进行扫描),同时在对应目录信息备考字段中进行解释。在进行纸面处理的过程中,要以不损坏档案实体为原则。在完成每卷的纸面处理后,纸面处理人员需要在流程单上填写纸面处理相关信息(如处理人、处理时间、处理内容等信息),同时利用数字化管理系统中的纸面处理功能,将纸面处理的相关信息记载到系统中。IV .9.档案扫描在档案数字化加工项目中,档案扫描人员依据档案数字化项目用户需求调研报告技术要求,利用数字化管理系统中的档案扫描功能,以卷为单位逐件进行扫描,在扫描的过程中,根据档案原件的质量,需要选择不同的扫描方式(平板扫描方式、滚筒扫描方式)以及不同的扫描仪进行扫描,扫描获取的图像必须保持历史原貌,确保图像文件的色彩、亮度、对比度为最佳效果,接近原始文件色彩。档案扫描人员在处理完每一卷档案后,需要在流程单上填写档案扫描相关信息(如扫描人、扫描时间等信息),同时利用数字化管理系统,中的档案扫描功能,将档案扫描相关信息记载到系统中。1.1.10. 扫描抽检在档案数字化加工项目中,为了降低后期返工的风险,将图像处理、图像质检等工序的工作量降低到最少,需要对扫描文件进行抽检,扫描抽检人员可以利用文档数字化管理系统中的扫描抽检功能,以每卷档案实体为参考,对系统中的扫描数据进行检查等操作。扫描抽检人员在检查完每一卷档案后,需要在流程单上填写扫描抽检相关信息(如抽检人、抽检时间、发现问题等信息),同时利用数字化管理系统中的扫描抽检功能,将扫描抽检相关信息记载到系统中。1.1.11. 高清处理在档案数字化加工项目中,图像处理人员需要对扫描后生成的图像文件进行进一步处理,可以利用数字化管理系统中的图像处理功能,根据流程记录单,图像处理人员将记录的文件个数与实际图像个数进行核对,采用专业的图像处理软件将图像中不符合需求标准的地方进行处理,在处理过程中将不合格的页记录在流程单中并返回给扫描环节,并监督扫描人员将其修改,从而确保数字化加工的图像质量,图像处理软件功能主要包括:去黑边、去污点、去污渍。扫描后形成的文件可能会存在黑边、零散的小黑点、大块的污渍等情况,用户可以根据不同的情况自动去除黑边、污点、污渍,并且可以对处理的阀值(自动处理的强度)进行设置;拼接、拆分文档。可以选择将多个单页文件组合成一个文件,也可将组合成的文件再进行拆分成多个单页文件。比如在扫描时,将A3幅面的文件扫描成两张A4幅面的图像,再将A4的文件拼接成一张A3的图像;字迹加深、字迹变浅。扫描后形成的文件由于各种原因,有可能字迹较深、较浅,影响视觉效果,可以利用此功能将选择区域的字迹作加深、变浅处理;批量处理。系统支持对一批图像文件进行扫描、纠编、去污等操作的批量处理,从而提高处理效率。图像处理人员在处理完每一卷档案后,需要在流程单上填写图像处理相关信息(如图像处理人、图像处理时间等信息),同时利用数字化管理系统中的图像处理功能,将图像处理相关信息记载到系统中。1.1.12. 图像质检在档案数字化加工项目中,图像质检人员依据流程单,利用数字化管理系统中图像质检功能,对图像文件逐页进行检查,确保质检后的图像数据与档案实体资料一致,确保无缺页现象,确保图像文件中的页码清晰。如在质检的过程发现有错误现象,需将错误信息记录在成品数据验收记录单上,并将其错误问题与成品数据验收记录单一同反馈给纠错人员,并要求纠错人员在当天内提供复检数据,再进行2次数据复检,在图像质检过程中,对于个别与原件问题有关的不符合标准的图像必须查找档案原件进行核对。图像质检人员在处理完每一卷档案后,需要在流程单上填写图像质检相关信息(如图像质检人、图像质检时间等信息),同时利用数字化管理系统,中的,图像质检功能,将图像处理相关信息记载到系统中。1.1.13. 格式转换在档案数字化加工项目中,格式转换人员可以利用数字化管理系统中的“格式转换功能,将扫描形成的TIF格式的文件转换成PDF和"JPG两种格式的电子文件,转换后的电子文件存放路径与TIF格式存放路径一致,文件名称与原文件名称一致,只是扩展名不同而已,在转换的过程中,系统自动为转换后的电子文件生成MD5校验码,并保存到数据库。格式转换人员在处理完每一卷档案后,需要在流程单上填写格式转换相关信息(如格式转换人、转换时间等信息),同时利用数字化管理系统中的格式转换功能,将格式转换相关信息记载到系统中。1.1.14. 转换核查在档案数字化加工项目中,转换核查人员可以利用数字化管理系统,中的,转换核查功能,对格式转换的结果进行核查,核查方式包括两种:自动核查和手工核查,其中自动核查由系统自动完成,主要是核对转换后电子文件(包括PDF、JPG两种格式)的数量与源扫描文件(TIF格式)的数量是否一致,如果不一致,则自动出具不一致电子文件名称的清单;手工核查由转换核查人员手工完成,转换核查人员可以以源格式扫描文件(TIF格式)为参考,对转换后的电子文件(包括TIF和JPG格式)进行检查,发现内容是否一致,最终生成转换核查报告,转换核查人员在检查完每一卷档案后,需要在流程单上填写转换核查相关信息(如核查人、核查时间、发现问题等信息),同时利用数字化管理系统中的转换核查功能,将转换核查相关信息记载到系统中。1.1.15. 档案装订在档案数字化加工项目中,在对档案原件进行扫描、图像处理、图像质检后,档案装订人员需要对拆分的案卷进行逐卷的装订,所有装订的案卷要尽力按照原样进行恢复,要保证重新装订后的222页面为黑白两色,并且字迹清晰、不带插图的档案。可采用黑白二值模式进行扫描。223页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可以采用灰度模式扫描。224页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可视需要采用彩色模式进行扫描。2.3扫描分辨率2.3.1 扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。2.3.2 采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般均建议选择大于或等于100dPi。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。2.3.3需要进行OCR汉字识别的档案,扫描分辨率建议选择大于或等于200dpi。2.4扫描登记认真填写纸质档案数字化转换过程交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。2.5扫描中的文件保护251认真对好流程单,依照目录数据库中案卷的编号在扫描系统中建立同样的案卷编号,然后导入目录数据库中的著录的数据。252核对系统中的案卷信息是否与原件一致,如果发现差错,要在著录系统中更改。2.5.3核对实际扫描的页数和档案整理时填写的页数是否一致,不一致时应注明具体的原因2和处理的方法。2.6扫描仪常出的故障以及处理261扫描时图像有时会出现黑线,或图像不应该出现的污点,和大面积的黑边。说明扫描仪有污渍或纸屑粘在镜头上。262打开扫描仪镜头用干净的海绵,或者专业的镜头布,擦除镜头上的污渍即可。3、档案的录入3.1录入的规则3.1.1 根据客户的要求对整理好的档案进行录入,按照档案著录规则的要求,规范档案中的目录内容。3.1.2 录入档案案卷的基本信息(编号,题名,目录号等)。3.1.3 建成案卷目录后按照卷内的目录顺序对文件级数据进行录入,要祥细的录入每一份文件的题名,时间,文号等。3.1.4 建立档案目录数据库,录入时要先检查档案,看档案有没有破损的,查看档案的页码是否正确,同时根据客户的要求区分什么需要录入的,什么不需要录入。3.1.5 录入时要依照档案原件录入,不得私自更改档案的原件,录入完成后要进行检查,核对录入项目是否完整,内容是否规范准确,对于不合格的数据要进行修改或是重录。3.1.6录入可以采用OCR识别,可提高录入的工作效率。4、图像处理4.1图像核对4.1.1 扫描完的图像要进行图像的优化处理,首先应核对扫描的图像数量是否和导入的目录数据库中文件的页数一致。4.1.2 如出现不一致只有两种可能,一是录入原档案有错,可依照原档案更改,二是扫描出错可能出现漏扫,要进行补扫。4.2图像数据质量检查421对图像偏斜度、清晰度、失真度等进行检查。发现不符合图像质量要求时,应重新进行图像的处理。4.1.3 由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。4.2.3发现文件漏扫时,应及时补扫并正确插入图像。4.2.4 发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。4.2.5 4.1.5认真填写相关表单,记录质检结果和处理意见。4.3纠偏对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。4.4去污对图像页面中出现的影响图像质量的杂质,如黑点、黑线、黑框、黑边等应进行去污处理。处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。4.5图像拼接对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。4.6裁边处理采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。4.7图像的补扫4.7.1 补扫主要处理由优化操作不当,造成的图像不完整,误删的情况。4.7.2 高速扫描造成的漏扫,重张进纸。图像不清晰以及高速扫描仪不能处理的特别文件。5、图像存储5.1存储格式5.1.1 采用黑白二值模式扫描的图像文件,一般采用TIFF(G4)格式存储。采用灰度模式和彩色模式扫描的文件,一般采用JPEG格式存储。存储时的压缩率的选择,应以保证扫描的图像清晰可读的前提下,尽量减小存储容量为准则。5.1.2 提供网络查询的扫描图像,也可存储为CEB、PDF或其他格式。5.2图像文件的命名521纸质档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号,以该档号为这份文件扫描后的图像文件命名。5.2.2多页文件可采用该档号建立相应文件夹,按页码顺序对图像文件命名。6、图像的挂机与关联6.1图像质检合格后的图像数据要进行图像数据的压缩和转换格式,上传到总数据服务器,通过软件可以实现档案的目录数据库对相关数字图像的挂接。