档案整理及数字化服务项目实施方案.docx
《档案整理及数字化服务项目实施方案.docx》由会员分享,可在线阅读,更多相关《档案整理及数字化服务项目实施方案.docx(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章 项目实施方案第一节总体实施原则与流程XX单位本次扫描加工是馆藏约XX千卷档案,为了加快 档案信息化发展,促进馆藏档案信息的广泛利用,我司将从 技术工艺、过程监管、质量控制、进度保障、安全生产和信 息保密等多方面进行规划和资源配置,全方位保障各项实施 工作的良性发展以及整体项目的顺利完成。一、实施原则我方的总体实施原则如下:1详细规划、细致安排,将每项工作任务、每个工作环 节都想到、做好,无遗漏、无差错;2设立完善的项目管理体系和保障体系,为应对多方面 已知、未知的情况做好准备工作;3加强人员审查和员工管理工作,制订并执行高效的安 全管理制度和保密制度,杜绝各类问题事故的发生,确保项 目
2、的安全实施;4对纸质档案数字化的各个环节建立起完整、规范的记 录。并使用加工流水表单详细记录加工过程及相关问题。5增加管理人员的投入,增强现场的监管力度,明确监管措施落实到位;6集中优势资源,从资金、技术、人员、工艺、和管理 等多方面保障项目的顺利实施;7全力保障品质检查,以多层次、多级别的检查管理, 确保提交给用户的产品全部符合质量要求;8全力保障信息安全和保护档案实体安全。我公司拥有管理精细化、加工流程化、质量标准化的专 业档案数字化团队,可提供对各类文书、图纸、资料、业务 档案等纸质、影像档案进行整理分类和档案数字化加工服 务,通过建立图文数据库,对数据进行规范性校验,实现纸 质档案与电
3、子档案一 -对应关系,最终将成果档案数据与业 务系统挂接,形成一个有序结构的档案数据库,及时提供利 用,实现信息共享,为未来人工智能及大数据应用打下坚实基 础。(根据项目实际情况修改):、总体工作流程(-)档案分类整理:按照档案情况,年度、类别、长 短期等进行分类整理,将部门编制不统-的进行统一分类, 以便数字化后方便查找与管理。(二D档案交接:分类整理后的档案按年度、类别提出, 提卷时数字化加工方的提卷人员按照要求,编写档案的页号 和需要扫描录入的文件页号后及抽取不需扫描的页面,并按 实际页数填写详细的档案交接清单,并由双方主管人员签 字。(三)标引著录:标引著录是为了方便查阅与管理,对 文
4、字录入的准确性要求较高,实际项目中将会按照统-的标 准制作相应的文字录入工作说明书,供录入员和校对人 员参考。(四)档案拆分:档案拆分前要对档案进行统-的编号, 编制总页号后,要从中选中需要扫描的页面。再-次编制所 需扫描的页号,两个页号需要用铅笔的颜色或位置区分,以 确保档案还原时能够清楚区别和核实页数,档案拆分时要严 格按照要求对不需扫描的页面进行标注。(五)档案的扫描:原件的扫描与存储格式完全按照国 家档案管理的统-标准要求扫描。扫描使用金档科技自主研 发的图像扫描处理软件,扫描人员可根据原稿质量,对系统 进行定义,如自动倾斜校正、自动去污、自动分文件等批处 理功能。在由系统自动处理功能
5、的同时,扫描人员根据原件 的实际情况做相应的调整,如超大页面的处理、纸张颜色深浅及薄厚的处理、扫描时可根据不同原件的情况,调整图像 的分辨率、阀值、明亮度以及扫描方式和扫描速度,确保在 扫描图像质量清晰的情况下,使原件完好无损。(六)图像处理:采用自动化处理和人工处理相结合的 方式,确保图像质量的完美。通过校对系统对图像进行校对, 确保图像顺序正确、去斑点、污渍、黑边、偏斜处理、校验。 在校对时发现不合格图像及时返回前一工序进行改正。(七)质量检验:对扫描处理完成后的图像页面进行检 验,对档案拆分、扫描、修正、去污、图像的处理以及文本 和图像页的匹配等质量进行全面检验。对文本域录入与文本 录入
6、域的标引、文件的页号及页数进行对比,对扫描前的图 像页的标引与扫描后的图像页的编号与页数进行对比,发现 不合格的登记并退回上一流程重新处理。(A)图像与索引挂接:文本域录入和扫描处理检验后 的图像成品,按年度进行文字图像与系统的挂接,不需手工 挂接即可实现文本与图像页与系统的挂接。挂接到档案管理 系统中后,进行再次的成品验收,对各种使用习惯逐页进行 检验,验收合格后移交验收小组验收。(九)案卷整理还原:档案整理工作严格按照国家档案 局规定的相关标准进行有序的整理,公司安排专人负责案卷 整理与还原。第二节数字化加工流程及主要技术方案档案数字化加工主要流程包括:提卷一拆卷一档案著录 一扫描一图像处
7、理一OCR校对一版式还原一转双层PDF 终验一挂接。一、入库提卷、拆卷L从档案室移交档案,严格执行原始档案的交接手续, 使用双方项目负责人确认的档案交接清单(完成清点登记)。2档案整理:编写页码、核对纸质档案页码、对可拆钉 的文件做拆钉处理以适应扫描的要求、对需要修复的档案进 行归并整理(如果发现破损严重,无法直接进行扫描的档案, 应先进行技术修复、折皱不平影响扫描质量的原件应先进行 相应处理后再进行扫描,发现破损严重的档案须立即报知项 目相关负责人)制作卷内目录,扫描文件抽取3按照扫描处理量明确交接周期和档案交接量(双方项 目负责人签字,以保在施工过程中档案不损失、不丢失。)4装订案卷应保证
8、装订牢固,案卷整齐,卷内材料不松 动,脱落,保持与原案卷-致。:、标引著录按要求将文件所需信息录入到软件数据库里,标引著录 按照国家档案局有关标准结合用户档案著录的具体要求进 行。1录入方式采用手工录入的方式2校对方式校对以软件校对和打印输出、对比校对相结合,错误率 在万分之以下。案卷目录和卷内目录按照档案的原始数据录入。卷案目 录和卷内目录的样式经用户同意可做相应调整。对档案目录 数据修改和补充的数据,须填写更改资料、更改资料放入原 案卷内,卷内目录及其他不全的需补充完整。入档案扫描1扫描方式:根据档案幅面的大小选择相应规格的扫描 仪或专业扫描仪进行扫描。大幅面档案可采用加长式扫描或 者图像
9、拼接处理方式处理,同一页面有两个以上文件,需分 别扫描。2扫描色彩模式:以黑白二值扫描为主,附有灰度(彩 色)照片及原件分明度很低的档案,可视情况采取灰度和24 位真彩色扫描。然后以黑白二值保存。例:蓝底招生名册,此种档案长见为A3幅面、纸张很 薄,底色与文字的分明度很低。实物档案查看时都显吃力, 此种档案如果用黑白二值扫描,则会出现大幅暗面,文字显 现不清;如果使用彩色扫描,文字部分明度很低。只有使用 灰度扫描,效果相对好一些。扫描后的图像再辅以黑白值 保存,则最大限度的提高了图像质量。3分辨率:无全文检索需求的文档分辨率调整为200DPI 最为合适。需要全文检索而做OCr识别的文档,黑白二
10、值扫 描分辨率最佳为400dpi,此分辨率下识别成功率最高。24位 真彩色扫描分辨率标准为200dpio4图像文件的大小:黑白值扫描A3页面:20K-40K. 灰度或彩色扫描A3页面:IOo-150K。5如遇字间距和行间距过密、原件本身是复印件等字迹 不清楚的情况,可适当增加扫描的分辨率,但要保证图像清 晰的同时,又不影响远程查询和浏览的速度。6清晰度:扫描图像字迹清晰、颜色恰当,不宜过浅或 过深,并且不得出现字迹笔画残缺或字迹笔画叠合而影响阅 读的情况,即使原档案存在锈斑变质、颜色过浅或深浅不 致,也保证扫描图像可读,扫描留下的墨迹宽度不得超过05 厘米,并且指印和黑线不能覆盖或影响正文内容
11、。7根据档案实体情况,在档案电子文件中相对应目录设 置“复制件”、“原件不清”标志。目录以原有档案目录为 准,在实际处理过程中著有未归类的新目录。可根据情况修 改目录,增加或调整标准目录,对档案原目录数据修改或补 充的数据,需填写更改资料,更改资料放入原案卷内,能实 现-条目录对应多个图像和一个图像对应多条目录的编目。8图像内容:(1)实时在屏幕上监控扫描全过程,遇有漏扫、重张, 图像黑边、偏斜、折角、不清晰等情况,则进行重扫或补扫。(2)检查扫描件是否合乎要求,扫描图像必须与原图页面- - -对应,不得出现颠倒、缺页、重页或错页情况,不 能有遗漏、重复,扫错的现象(3)扫描的页面内容居中显示
12、,不可出现明显偏左或 偏右的现象,正文内容、页眉、页脚、反面印章、附件、手 写注释等信息完整;图像内容与书本面完全对应,不得出现 书页内容残缺或将旁边页面信息扫入本页的现象。(对图像 黑边、偏斜、折角、不清晰等情况进行处理,以达到用户需 求)(4)纸张较差档案扫描方案:由于进行数字化的档案 会有部分为历史档案,纸张质量比较差,对于这部分纸张质 量较差的历史档案扫描,我们本着以下原则:9扫描登记:认真填写纸质档案数字化转换过程交接登 记表单,登记扫描的页数,核对每份文件的实际扫描页数与 档案整理时填写的文件页数是否-致,不一致时应注明具体 原因和处理方法。四、图像处理1逐张检查图像质量(包括黑边
13、、折角、图像偏斜度、 清晰度、失真度等进行检查,发现不符合图像质量要求时, 应重新进行图像处理),档案顺序(页号)是否正确,有无 漏扫、重张等情况(发现文件漏扫时,应及时补扫并正确插 入图像。发现扫描图像的排列顺序与档案原件不-致时,应 及时进行调整。)2纠偏:图像整体倾斜不得超过1度,不得出现图像的-部分倾斜或扭曲而影响阅读的现象。如果档案页面存在部 分倾斜的,以页面中标题纠正为准。3去污:所有扫描留下的黑线、指印、阴影或污点都必 须清除干净(在放大50%的情况下)由于印刷质量或纸张质 量等造成的页面上有零星的污点和反面倒映文字污点比较 多,如果在页面视图下看不清楚,或该污点嵌在文本行中无
14、法清除,可以不清除,但应尽量保证图像可读。4全文页面及局部文字的加深和变浅的处理:原始档案 的清晰度较低时,可提高图像的清晰度,修正原资料中存在 的字间距和行间距过密,文字较深或较浅,字迹不清楚的缺 陷,确保文字及图像信息清晰可辨。5图像拼接:对大幅面档案进行分区扫描形式的多幅图 像,应进行拼接处理,合并为一个完整的图像,以保证档案 数字化图像的整体性和数字化档案的准确可读。6照片页处理:必要时采用专业的图像处理软件进行处 理,确保照片的清晰度。7图像存储:存储格式以G-4压缩TlFF格式保存。A4幅 面档案保存文件不得大于!oo.其他幅面档案扫描形成文件 在保证影像质量的前提下,尽量缩小文件
15、占用空间。扫描文 件存储命名必须与条目档案号一-对应。五、全文识别(OCR)及生成双层FDF、版式还原及格 式转换将扫描处理完成后的文档利用专业的识别软件进行全9文OCR,如甲方对识别成功率有严格要求的,还需另外进行 人工校对,校对结束后将版式还原及转换成双层PDF文件格 式。根据用户对识别率的要求,可选择性进行人工校对。进 行人工校对和不进行校对的优缺点对比:1不进行人工校对:其原理是在单层PDF的基础上利用 计算机软件进行全文OCR识别后生成双层PDF文件。从而激 活了图片中所反映的文字,而达到提取文字和利用原文所包 含的文字进行检索的目的。但是不进行人工校对和版式还 原,识别的准确率取决
16、于原始资源的情况及保存现状。(1)优点:效率高、成本低、能利用原文检索、浏览 速度快。(2)缺点:识别准确率取决于原件的质量,所以准确 率不稳定。(3)适应范围:1)原件版面干净及保存完好的资源。(准确率可达95% 以上)2)原文中只含部份核心检索内容的资源。(如学籍档 案,检索的重点只是围绕学生的身份信息)2进行人工校对:其原理是在OCR的基础上,为了确保 识别的准确率而增加了人工校对和版式还原的工序。可实现 无障碍的全文检索。(1)优点:全文检索无差错,准确率可达99%,且文本层和图像层- - -对应。(2)缺点:效率极低、成本极高、因为进行了版式还 原,所以原真率不到98%,而且存储空间
17、很大而致浏览速度 降低。(3)适应范围:D所载信息珍贵且使用频率很高的资源。2)数字化项目资金预算充裕且项目实施时间宽松的资 源。3)有很好的硬件环境支持的数字化项目。六、总质检1对扫描处理完成后的图像页进行检验,对档案拆分、 扫描、修正、去污、插图、照片的处理以及文本和图像页的 匹配等质量进行全面检验,对于质量达不到要求的进行重 扫、补扫等操作。2对文本域录入与文本录入域的标引、文件的页号和页 数进行对比,对扫描前图像页的标引与扫描后的图像页的编 号与页数进行对比,发现不合格的登记清单重新处理。3对图像质量的检查,确保图像版面清晰,干净,大小 -致,方向一致。4主要质检标准:(1)加工后的电
18、子影像在总数量、完整性、清晰度上 与源文件保持- -致。(2)案卷著录、按文件的属性著录数据库字段,检查 “文件路径”字段与文件实际存储位置-致,差错率控制在千分之五以内。(3)电子影像档案件信息定义数据差错率控制在百分 之:以内。(4)电子影像档案卷内页码差错率控制在千分之-以 内。(5)每页电子影像左右端正度控制在三:度以内。(6)电子影像漏扫,压边率控制在千分之一以内。(7)电子档案与条目数据的挂接-致,差错率小于千 分之一以内。七、批量挂接1扫描处理后的图像成品,按年度、机构上传至档案专 用服务器,利用档案管理软件中的对应挂接功能将扫描图像 信息与录入到档案管理软件系统中的目录进行对应
19、挂接,确 保目录与原文的- -对应。2挂接到档案管理系统中区,进行再次的成品验收。八、还卷及数据备份提交1原始档案还原工作严格按照国家档案局规定的相关标 准和实际情况进行有序的还原,将还原的档案资料逐卷精心 检查,确实没有落页、掉页、折页等问题后再归还档案管理 人员,经双方仔细核实无误后,在还卷交接单上签字确认。2在数据化加工过程中的各项工作记录,在数据转移完成后、提交给用户方。113为了有效地保护数据,因此建立数据备份制度,在数 字化加工项目工作结束,并经用户在终验报告上签字确认 后,将通过验收后的数据利用用户软件的光盘制作功能刻录 成光盘,刻录到DVD光盘中,刻录完成后再制作-个光盘备 份
20、,或用移动硬盘等存储介质,将所有成品数据备份,提交 给用户。4刻录光盘要求:(1)光盘制作两份,制作成档案数据格式为多页TIFF 的光盘单盘调阅。(2)同一份文件不跨越二片DVD片号(同一份文件页 数需在同-DVD内)(3)电子档案存在于符合标准的单片包装光盘(4)光盘标示光盘编号,单片包装盒上注明光盘内主 要信息(5)在光盘刻录完成后,与硬盘系统中电子档案进行 -次比对,确保档案资料无遗漏及正确性。(6)制作光盘人员对于所有光盘序号进行标记,并提 交相应表格。B第二节历史档案扫描的工作流程方案-、分组实施方案本项目加工使用小循环操作,共分XX个小组,其中: XX个整理、XX个扫描、XX个修图
21、、XX个质检与挂接,其他 如交接及还原工序将统一完成。我公司现场安排XX个项目 主管(负责整体管理、控制与沟通),XX个质量主管(负责 交接、培训与总检);和XX个安全主管(负责人员管理与 安全控制)。采购单位现场安排XX名管理人员,负责交接 与现场安全管理和质检、处理异常情况、实时验收等;验收 时,采购单位将另外安排人员组织验收。每小组实施流程如 下图所示:八总体流程我司数字化加工的标准流程可以分为档案交接、整理、目录数据检查纠错、扫描加工、图像处理、图像质检、数据 挂接、数据校验、分盘刻录和数据交付等工序。其中,本项 目条目著录已完成,我司负责对目录进行校验。整个加工流 程由我司库房保管员
22、将待加工档案分配给XX个加工小组, 完成后统-进行装订还原,并进行数据校验,实施流程如下 图所示:加工小组数据挂接闻房保TfM服务券领用交妆用户万座房、国里型, I殛曳主要工序简要说明如下:I领用交接:从档案库房提取需要进行数字化加工的档 案原件到加工现场(可以按工作日、班次或批次提取),根 据需要清点到盒(卷),记录每盒(卷)档案件数及页数, 不出现遗漏登记或重复登记。2档案整理:整理人员对领出的档案原件进行数量清点 和纸张检查,发现问题及时登记并提交用户审核处理,对没 有问题的档案才进行拆卷处理。然后进行拆卷、纠正、平整、 裱糊、鉴定、分页等处理工作。其中,整理人员需要进行目 录质检,即要
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 档案 整理 数字化 服务项目 实施方案
限制150内