《数字档案管理系统技术要求.pdf》由会员分享,可在线阅读,更多相关《数字档案管理系统技术要求.pdf(17页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 word 文档 可自由复制编辑 技术要求 一、项目背景及信息化现状(一)项目的建设背景 随着技术的发展、社会的进步,德清县国土资源局在工作过程中产生了大量各类介质的原始材料,主要以纸制档案为主,由于工作中需要经常查阅相关的档案,这种以纸张介质为载体的档案查阅耗时、费力,导致工作效率低下,因此,必须将这些不同介质的原始材料实现数字化转换和处理,适合于信息时代的数字化管理及信息的共享。目前德清县国土资源局不仅需要解决纸制材料的数字化转换和处理,还需要对数字化的电子档案资源进行有效管理,提供方便的档案查询和利用。因此,本项目所用的档案管理系统软件要求具有极强扩展性并能适应各种复杂需求的档案解决方案
2、,对档案扫描、档案管理、档案查询等功能,可以利用系统自由定义功能定制。档案管理系统需要建立在现代信息技术的普遍应用基础上,利用数字手段,以高度有序的综合档案管理信息资源为处理核心,以高速带宽通信网络为技术设施的大规模、分布式数字信息系统。其功能涵盖对档案的数字化加工、数字档案信息的采集、处理、海量存储、归档、组织、发布、利用、管理全过程。包括统一平台基础之上的多个分布式的、大规模的、具有可互操作的电子档案资源管理系统。(二)德清县国土资源局信息化现状 信息化建设采取总体规划、分步实施、网络平台建设结合基础应用开发的技术路线,经过几年的建设,德清县国土资源局已经建立了包括 6 台 IBM 服务器
3、、1 套 EMC 光纤磁盘阵列、1 套磁带库及由思科网络设备组成的高性能千兆局域网络。二、项目内容 德清县国土资源局本次档案信息化建设招标主要分为两大部分内容,进行统一招标:(一)德清县国土资源局数字档案管理系统定向开发(二)德清县国土资源局纸质档案的数字化加工:word 文档 可自由复制编辑 待加工档案总数为 9.5 万卷宗(300 万页)三、档案数字化项目技术要求(一)档案管理系统建设原则 1、先进性 在保证系统实用、稳定的前提下,适当采用先进成熟的主流技术,符合今后的发展方向,延长系统的生命周期,在软件开发思想上,严格按照软件工程的标准和面向对象的理论来设计、管理和开发。2、实用性 系统
4、应满足工作流程合理、直观、操作简单、易于使用,即实用性原则。本系统将实现档案扫描、数据管理、查询统计、数据交换应用等日常管理功能,优化的系统结构和完善的数据库系统,完善灵活的查询与统计功能,友好的用户界面等。3、可扩展性 系统采用在总体框架基础上挂接实现业务功能子系统的模式,实现数据的自动流转,并且这个模式本身具有高度的灵活性和可扩展性。在规定的业务规范范围内,能够机动、灵活地更改业务内容,增删业务处理程序,改变相关报表及统计信息,并能够为后续系统扩展和功能完善增加组件设置接口,使得数据更新简便和系统升级容易,保证系统的可持续发展和强大的生命力。由于国土资源管理工作的法律、法规和政策随着社会经
5、济建设发展会作相应的调整,要求系统应具有良好的动态性与可扩展性,能够依据实际工作情况作一定程度的动态修改、扩充和调整,并保证调整前后应用过渡的平稳性,能以零编码扩展实现相关表单、字段、报表等的变化。4、兼容性 选择符合国家和浙江省标准的软、硬件平台,基于组件式、模块化的设计思想和开发方法(部分功能采用底层开发),对现有各种异构数据源在进行数据有效性检验后通过适当的修改被系统接受,与当前业务人员使用的 MS Word、MS Excel 等通用软件兼容,实现数据交互。系统实施要在形成高度统一和集成的系统解决方案基础上,整合现有的网络资源和数据资源,对已经建成的基础设施和数据资源,在本系统建设中要充
6、分加以利用。在基础数据库和业务系统建设 word 文档 可自由复制编辑 中,要注重系统之间的衔接,切实保障系统之间的信息资源共享,避免重复建设,最大程度发挥现有各类资源的效益,保护已有的投资。5、安全性 系统应遵循安全性原则,可建立较为严密的访问分级、数据加密、电子身份验证等机制,并通过手工、定期自动等方式进行多途径数据备份,在保证系统用户权限合法性的同时,保证数据的准确、不易破坏和不易泄密。系统建设中应充分考虑分级联网及与外网衔接中的应用操作与信息访问安全问题。6、系统性 地籍、土地利用、OA、档案等相关数据要素之间关系错综复杂,综合分析业务内涵和数据要素之间的关联,充分考虑各系统之间的接口
7、、数据调用的问题,保证系统具有较好的关联性、整体性和一致性。7、规范性 一是技术上要符合国家和国土行业信息化建设的规范,要有能与采购方其他系统实现对接和数据相互调用的功能,同时能随关键技术的发展不断升级,始终保持先进性和适用性;二是外观上要符合采购方的相应要求,做到美观、大方、大气、庄重;三是作为综合档案管理工作的专业平台,反映业务工作内容上要符合档案工作规范,无论术语、符号、格式、数据关系,还是法律、法规、政策规定的其他内容,都要严格符合专业要求。(二)档案管理系统总体技术要求 1、系统架构要求 系统采用三层体系结构:整个系统的设计框架应该基于三层体系结构,将逻辑业务层、应用处理层和数据层分
8、开,提高系统的管理性能。应用查询模块必须采用 B/S 架构,应用程序除操作系统外不依赖任何第三方软件、中间件、硬件;管理模块和扫描加工模块可以采用 B/S 架构或 C/S 架构。2、数据库要求 本项目可采用 SQL Server 2005 或者 Oracle 数据库。3、应用服务器要求 应用服务器采用 IBM Websphere,但也支持选择 WebLogic,Tomcat 等其它 word 文档 可自由复制编辑 J2EE 应用服务器。4、操作系统要求 服务器操作系统采用 Windows Server 2008,兼容 Windows Server 2003;客户端适用 Windows XP、W
9、indows VISTA 等操作系统。(三)档案管理系统功能模块要求 档案管理软件必须具备以下功能 1、档案管理模块功能要求(1)档案分类管理功能 I、可根据国土资源管理工作实际情况,自行增设档案分类。II、灵活增加同级类目、增加下级类目、编辑当前级分类及修改当前分类,并能体现出隶属关系。III、根据各组织机构的信息资料类别进行分级管理,可编辑信息资料类别的属性;具有信息分类属性的继承功能,方便查找档案。按照档案分类大纲,德清县国土资源局档案卷宗主要分以下几个类别:业务类:地籍管理、国有、集体建设用地、土地估价、土地监察、土地利用规划、土地整理、土地出让、转让、土地详查、农村私人建房用地、矿产
10、管理等类别;文书档案类:含文秘、劳动人事、党群、纪检、行政、政策法规;会计档案:含报表、账簿、凭证等;特种载体档案:含照片、声像、磁介质档案、实物等;(2)密级管理功能 秘级可以根据国土局实际情况,根据用户业务情况,自行设置。档案的密级等级分别为公开、秘密、机密、绝密四个保密等级。(3)保管期限管理功能 保管期限可以根据国土局实际情况,根据用户业务情况,自行设置。保管期限分为永久、长期、定期(10 年、30 年)。(4)组织机构管理功能 可以根据国土资源局的实际情况,组织机构是可以自由增加、修改和删除的,结合需求建立自上而下的树状组织结构,可以创建子部门,在组织机构发生变化 word 文档 可
11、自由复制编辑 时也可以随需要进行修改。(5)角色管理功能 角色是从现存的各组织机构中选择具有相同权限的人员的一个组,以方便授权(例如系统管理员、扫描人员、质检人员、查询人员等)。在系统中,角色也是可以根据需要可以自由增加、修改和删除的。(6)人员管理功能 在系统中,可灵活定义人员属性,增加、修改和删除人员,并且根据需要可以更换部门,方便处理人员调动部门的情况,人员的相关权限具有同步变更性,人员可以单独分配权限,也可以属于某个角色,满足机构重组的需要。(7)字段管理功能 无须再进行程序开发,可以灵活自由定义字段名称、字段类型(如日期型、字符型、数字型等)、字段长度等属性,通过一定的字段组合,满足
12、不同的国土档案业务类型。(8)属性录入界面管理功能 兼容扫描加工模块中的属性录入(详细内容见描加工模块功能要求),支持属性字段的自定义。按照需要,提供人性化的表单输入界面设置功能:设置哪些字段需要录入,哪些排在前面,哪些排在后面,录入框的长度和高度,哪些需要多行显示等。(9)权限管理功能 完善严密的授权机制,针对不同的档案分类,为不同的用户赋予相应的权限;只有经过授权的用户才能使用本系统;必须提供用户分层权限管理,角色授权,人员授权,权限申请和审批,条件授权,临时授权,字段隐藏,代理管理员等各种权限管理功能,满足灵活授权的功能。所有涉及到用户密码的信息全部采用加密方式存储。(10)日志管理功能
13、 提供系统日志、业务日志、数据库日志、操作员日志、管理员日志等详尽的信息。对涉密数据的查询需要有查询记录日志,从该日志中可以获取查询人、查询内容、查询计算机基本信息等情况。(11)其他功能要求 word 文档 可自由复制编辑 包括数据导入导出、一文一件管理、未归档文件管理、卷内文件管理、归档文件管理、案卷管理、复制、粘贴、修改(单个/批量)、智能检索、排序、报表、统计、组卷、拆卷、调整文件顺序、档号自动生成等功能。1)、提供灵活的报表、统计表设计功能,可以对档案业务进行不同角度的统计,如根据统计类别、案卷年度、保管期限和案卷类别等来统计。也可以根据需要自行设计报表。如可以设计档案列表、案卷目录
14、表、卷内文件列表等。设计好的报表格式可以保存,以便重复使用,报表设计方法能兼容 MS Excel 的操作方式。2)、同时实现电子影像文件原件的出入库管理和存放,统计原始档案借阅情况。主要包括:借阅管理、档案存放管理。借阅管理是对档案原件的借阅/归还、销毁等情况进行记录和管理的过程。档案存放管理是记录档案在档案库房的实际存放位置(库房号、架号、排号、盒号)的管理,用来快速找到相对应的纸质档案原件。2、应用查询模块功能要求 查询浏览应提供 BS 查询浏览方式,BS 查询使用 IE 浏览器即可使用查询功能,适合于一般用户的查询使用。用户通过网络连接档案管理系统,可以不受地理位置和时间的限制,按照分配
15、权限方便快捷地进行查询。各类检索功能让每个用户能轻松找到想要的文档,各种排序功能让信息显示更有序化,分组功能对数据进行分组显示,让用户一目了然。能根据各种检索项提供多条件组合查询,并能对常用检索途径进行优化,满足用户对查全率、查准率、快速查询的要求;能根据用户需要设置检索条件;能对查询结果进行显示、排序、保存、打印输出等技术处理。(1)单项查询功能 对条目属性(如:归档编号,土地使用者,土地坐落,宗地号,证书号,发证日期,权属性质,申请编号,使用权类型面积等)进行检索,并且提供精确查询、模糊查询、匹配前面、匹配后面等查询选项。比如:需要检索“档案号”为“C41-3-1-1”的地籍个人资料,则在
16、“档案号”录入框中输入“C41-3-1-1”即可。一般情况下,单项查询只用于“归档编号”等具有唯一值的查询,如果对“土地使用 word 文档 可自由复制编辑 者”等进行单项查询,有可能会出现多个具有相同“土地使用者”的档案,像这种情况可以使用“复合查询”。(2)复合查询功能 组合多个单项检索,提供两种复合查询,一种是精确复合查询,另一种是多条件复合查询。比如:需要检索“土地使用者”为“刘刚”并且“土地坐落”位于“上柏村”的地籍个人资料,则在“土地使用者”录入框中输入“刘刚”两个字,在“土地坐落”录入框中输入“上柏村”即可。经过复合查询得到的结果相对于单项查询会更加准确。(3)二次查询功能 在单
17、项查询和复合查询的基础上,必须支持二次查询的功能。即在第一次查询后,在查询结果中通过二次查询,以快速找到用户需要的信息,以提高条目查询的效率。而无须再重复查询,影响查询效率。(4)档案原件查询功能 在各种国土档案业务类型中,系统必须支持根据档案原件的子类型(如封面、卷内目录、合同、登记证、封底等)来进行查询,以提供多样化的查询方式。电子档案原件的上传和管理必须支持单页TIF 格式,可以根据档案原件的子类型(如封面、卷内目录、合同、登记证、封底等)进行精确的档案原件的定位查看。须支持某种档案类型的全部图像的浏览,支持上下页的翻页功能,支持按页码定位的功能。(5)模糊查询功能 对有些如文书类档案的
18、查询,可能不记得文件的全名,可输入某几个关键字,以获得查询的结果。(6)按正文内容查询(全文检索)功能 对经过 OCR 处理的文书类等档案,可通过输入正文中的词组或短语查询,以获得查询结果,根据查询情况定位到某一文档和具体某一页。(7)单项排序功能 对单个条目属性进行排序,让查询结果现有顺序,看起来更加方便,也更容易找到想要的档案。比如:按照“土地使用者”进行排序,则可以将不同时期的相 word 文档 可自由复制编辑 同名称的“土地使用者”的档案排列在一起,也就更加容易找到想要的档案。(8)多维排序功能 组合多个条目属性进行排序,让查询结果现有顺序,看起来更加方便,也更容易找到想要的档案。比如
19、:按照“土地使用者”,“盒号”进行排序,则可以将不同时期的相同名称的“土地使用者”和相同库房“盒号”的档案排列在一起,也就更加容易找到想要的档案。(9)档案原件打印功能 对查询到的档案图像进行打印,必须支持某种档案类型的全部图像的打印,支持指定页码的打印功能。(10)档案原件下载功能 对查询到的档案图像进行下载到本地,必须支持某种档案类型的全部图像的下载,支持指定页码的下载功能。下载输出时,既可以按照单页 TIF 一页一页输出,同时也支持 PDF 和多页 TIF 两种格式的输出。(11)OCR 提取对比功能 可选定查询到的档案原件部分内容,对该内容进行 OCR 提取获得电子文挡,并支持对电子文
20、挡的编辑加工和另存。(本功能针对有条件 OCR 的档案原件,如打印文稿)3、扫描加工模块功能要求(1)属性著录功能 记录案卷的属性数据,如土地登记档案的字段为:土地使用者、代理人、法人有关信息、权属性质、使用权类型、土地用途、使用者性质、登记类别、通讯地址、身份证号码、家庭人口、宗地号、土地证号、归户卡号、宗地面积、使用权面积、独自使用面积、共有分摊面积、土地等级、建筑面积、建筑占地面积、建筑密度、建筑容积率、建筑物类型、四至、土地坐落、楼层、发证日期、使用期限、登记卡备注内容等 并在批量录入时考虑有些重复字段录入时,需要能够保留这些字段的值,其它不重复录入的字段则需要清空。(2)扫描录入功能
21、 通过扫描录入组件驱动高速扫描仪进行档案资料的批量扫描,保存在录入机 word 文档 可自由复制编辑 硬盘上。扫描软件必须具有良好的可扩展性、与平台无关、能支持所有的扫描输入设备。一个物理案卷为一个扫描批次。(3)文件命名功能 对扫描的图像进行文件名称指定(如地籍类有:地籍调查界址确认表、委托书、其它证明文件、申请表、身份证明、土地登记审批表、合同、土地证、宗地图等文件名称),方便以后查询。(4)文件补扫功能 对漏扫,或纸张质量较差的文件进行补扫。(5)电子文档挂接功能 可对有电子文档的影像档案进行电子文档挂接,通过链接的方式显示挂接。(6)质检功能 质检包括图像质量检查和条目属性检查,图像质
22、量检查就是检查每一副影像的图像质量,手工调整影像质量,将不符合要求的影像打回重新扫描。首先检查影像质量,若发现有影像不清晰、倾斜、重叠、漏扫等情况,可以通知影像录入人员进行重扫或补扫。(7)入库归档功能 在影像和影像索引经过总检符合归档要求后,将案卷影像上传到服务器,即可实现逻辑上的归档,可被用户进行查询。(8)设备支持 本扫描加工模块必须兼容高扫、平板、大幅面等多种扫描仪及数码相机设备,以便根据不同情况方便得选择不同设备使用。4、系统接口和数据提取要求 档案管理系统开发完成后,根据用户实际需要,提供地籍管理系统、用地审批系统、办公自动化系统等软件接口,方便业务系统调用档案影像数据。档案管理是
23、各个业务管理资料的最终归属,地籍档案占整个国土档案的大部分,提供与地籍管理信息系统之间的接口尤为重要,因此系统数据可以按照档案管理的业务需要从各业务系统中抽取,在档案管理系统中扫描旧案卷时录入的属性可被地籍管理系统提取,在地籍管理系统中受理新业务时录入的属性可被档案管理系统提取,这样避免了数据的重复录入,减少了工作量,同时严格保证了数 word 文档 可自由复制编辑 据的一致性,减少了由于人工录入造成的数据错误。在实际操作中,该功能支持流程管理,可查询各工作环节的状态,在重要环节有检错、纠错功能,能查出无业务数据档案及无档案业务数据。5、其它功能和技术要求(1)图像处理功能 扫描系统必须提供边
24、扫描图像边处理功能,还需要提供手动处理的功能,以最简单的方式获得高品质的档案质量。图像处理功能包括:彩色和黑白去黑边和纠正、页面纠偏、去杂点,另外必须有背景阴影去除、去线条、字底反色、去白页(必须通过分析图像中白色所点的百分比来判断)、去折纹、线条增强、字符修复、去装订孔等影像优化技术。需提供窗口显示、全屏显示、选择放大等影像浏览功能,方便图像浏览。必须提供影像导入导出功能。支持 TIF(压缩/非压缩)(单页/多页),JPG(自由调整压缩比),GIF,BMP,PDF(单页/多页)影像格式的扫描;支持双面/单面扫描、删除页、删除整卷、缩略图、剪切、插扫(单页/多页)、替换影像(单页/多页)、追加
25、影像等功能。(2)报表功能 系统能提供案内目录,案卷封面等报表功能,并可以根据需要调整报表样式。系统能提供灵活的报表设计功能,可以根据需要自行设计报表,设计好的报表格式可以保存,以便重复使用,报表设计方法兼容 MS Excel 的操作方式,会用 Excel 就很容易学会系统中的报表功能。报表中数据源取自于档案管理系统中的字段属性;在报表设计中可以创建单表头、多表头、多行报表等多种复杂类型的报表。(3)分类统计功能 可对所有档案进行分类统计,支持统计类别的自由选择,如按年度统计、类别统计等。(4)数字虚拟案卷的完整性 一份档案除了在软件的界面上是一份完整的案卷外,在图像存储文件服务器上的文件夹的
26、表现上,案卷和卷内文件的结构必须清晰,也必须是一份完整的案卷。不论任何时候插扫、追加新的扫描文件,在图像存储文件服务器上的文件夹的表现上都必须是一份完整的案卷。在存储时分存储页号和显示页号。word 文档 可自由复制编辑(5)图像传输要求 扫描加工系统提供的高性能的数据传送,扫描工作站和质检、插扫、总检各环节的影像传送必须是工作站之间采用 UDP 协议进行 P2P 点对点互相传递。不能因为档案的大批量的扫描加工而导致服务器的承受压力过大和大数据流量而影响其它业务系统的使用。日常的影像调阅时,系统也必须充分考虑网络承受力,考虑减少网络带宽的占用。(四)国土纸质档案的数字化加工 1、数字化加工内容
27、 根据部门职能结合问题的分类方法,按档案分类大纲规定,全宗内档案分为九个大类:A 综合、B 计划财务、C 地籍管理、D 土地利用规划、E 建设用地、F 国土监察、G 宣教科技、H 声像材料、I 地质矿产。目前德清县国土资源局档案管理方法采用案卷级管理方式。(1)档案数量 待加工档案总数为 9.5 万卷(300 万页),具体分类如下表。名 称 卷 页 地籍业务类 74598 1870000 用地业务类 12214 545000 用地综合文件类 114 7600 监察类 546 17600 规划类 503 24700 宣教类 30 800 储备中心综合文件类 16 1700 矿产综合文件类 71
28、2800 集体土地所有权 469 9200 统一征地台帐 52 800 文秘综合文件类 570 36700 财务综合文件类 182 5000 word 文档 可自由复制编辑 土地估价专项材料 1245 30800 土地祥查专项材料 1291 46800 地籍综合文件类 336 6000 财务类(台帐)652 50600 财务类(凭证)2048 307000 短期类 234 49100 合计 95171 3012200 2、工期要求 本项目 9.5 万卷(300 万页)的纸质档案要求在 2009 年 6 月 30 日前完成,并同时提供完善的档案管理系统。3、数据格式与存储要求 根据国土资源档案的
29、特点,档案数据分三种形式管理。第一种是扫描加工完成后将图像直接传到档案系统中,可以在档案中进行查询浏览。第二种是以文件为单位,每个文件的数字化成果包括四个方面:(1)多页 TIFF 文件,用于长期保存;多页 TIFF 以件为单位,一个文件生成一个多页 TIFF 文件。(2)多页 DJVU 文件,用于网络浏览;多页 DJVU 与多页 TIFF 文件一一对应。(3)EXCEL 文件,用于保存条目信息。(4)OCR 文本文件,需要 OCR 的文件,每个文件应包括一个 OCR 文本文件。第三种是以案卷为单位,每个案卷的数字化成果包括三个方面:(1)TIFF 文件,用于长期保存;案卷中每页生成一个单页
30、TIFF 文件。(2)DJVU 文件,用于网络浏览;单页 DJVU 与单页 TIFF 文件一一对应。(3)EXCEL 文件,用于保存卷内条目信息。条目录入信息存储在数据库中,与上述目录建立对应关系。4、数字化流程要求 数字化流程至少应包括:拆卷、扫描、图像处理、格式封装、条目著录、识 word 文档 可自由复制编辑 别(OCR)、质检、装订、数据备份、提交。5、档案版权要求 档案扫描中加入版权水印,水印不能影响档案内容,在打印时一并打印到纸张。6、扫描工作环节与质量要求(1)拆卷、装订 拆卷和装订不能损害档案原件。拆卷时不允许裁切档案纸张,装订时应按原有顺序装订,案卷不掉页、左边和底边整齐,保
31、持拆卷前的原貌;装订后由德清县国土局档案室负责检查,不符合要求的退回重新装订,要求一次性完成装订。并认真做好档案页码、页数的登记。对于未加盖页码的厚卷,须加盖页码。今年未入库档案扫描加工后须打印案卷封面、卷内目录、卷内备考表。(2)扫描 扫描时应根据纸质档案的材质选择相应的扫描设备,保证档案不受损。扫描时应认真登记扫描的页码和页数,并核对实际扫描页码、页数与前处理时填写的页码、页数是否一致,不一致时应注明具体原因和处理方法。对案卷中漏编的页面进行合页处理,确保扫描好的影像页数与原案卷页数一致。同页有两个以上文件,需分别扫描或图像分割处理,并进行合页处理。扫描原则上采用黑白二值,以扫描后的图像清
32、晰、完整,档案内容信息与档案原件一致为准。对于年代久远、字迹模糊、纸张颜色和文本反差不大、斑迹较大等情况的档案采用灰度或 24 位彩色二种方式扫描。图纸、照片根据情况分别进行黑白、灰度或彩色扫描。扫描参数如下:黑白、灰度扫描分辨率采用 300dpi 或以上;彩色扫描分辨率采用 200dpi 或以上。扫描时保证放纸端正、不压边、不漏扫、错扫、严格确保图像质量。扫描中漏扫、压边的要即时补全、补正。(3)图像处理 word 文档 可自由复制编辑 图像处理后保证图像信息与原档案内容完全一致,不删除页面任何有用信息,包括正文内容、页眉、页脚、手写注释和印鉴等。扫描的页面内容基本居中显示,不出现明显偏左或
33、偏右现象。不准出现页面内容残缺或将其它页面信息扫入本页的现象。每页影像左右端正度控制在 3 度以内,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像进行旋转还原,以符合阅读习惯。不出现图像的一部分出现倾斜或扭曲而影响阅读的现象。厚的案卷装订线较近边角的档案内容会产生扭曲现象,需保证正文能看清楚。去污:在保证文件内容完整的前提下,影像页无扫描过程中带来的污斑,无黑边,外观达到清晰、平直、干净。对图像页面中出现的影响图像质量的杂质如黑点、黑线、黑框、黑边等进行去污处理。处理过程中应遵循在不影响可读性和可理解性的前提下展现档案原貌的原则,由于档案本身因陈旧、破损或不洁等造成页面上有污点的,如果在页
34、面视图下无法看清,或该污点嵌在文本行中无法清除,可不予清除。保证扫描图像字迹清晰、颜色恰当,不宜过浅或过深,不出现字迹笔画残缺或字迹笔画叠合而影响阅读的情况,档案原件存在斑迹变质、颜色过浅、过深或深浅不一致,保证档案原件能辨认的扫描图像也必须可以辨认。纸张太薄或字体颜色过浓,扫描时倒映反面文字,文字上的污点无法去污时,保证正文文字可以看清楚。(4)识别(OCR)环节 对需要作 OCR 识别的档案,在 OCR 处理中要求对题名、文号、发文日期、发文单位进行人工校对,其他文字做抽样校对。(5)格式封装 图像处理后的图像文件应根据要求封装为多页 TIFF 和多页 DJVU 文件或者为双层 FDP 文
35、件,并将封装好的文件存储到相应文件夹中。(6)著录 著录字段包括条目字段和图像信息字段二种。字段著录应严格按照规范进行,关键性字段在著录中应确保 100%正确,其余字段的录入错误率应控制在千分之五以内。word 文档 可自由复制编辑 字段著录应存放在数据库中统一管理。每个图像的信息字段包括文件日期、责任者、题名、页号等内容。为减少档案在加工中的流转,要求能根据扫描图像进行字段著录。(7)质检 为保证项目的总体实施质量,要求加工方对数字化各环节进行全面检查,具体质检目标如下:档案装订:全检,检查所有档案的装订还原情况,差错率控制在千分之一以内。扫描图像检查:全检,漏扫率控制在万分之二以内。图像质
36、量检查:全检,检查所有图像的质量情况,优质率达到 99.9%以上。格式封装检查:全检,图像文件的命名差错率控制在万分之一以内。著录检查:关键字段要求 100%正确,其余字段的录入错误率控制在万分之二以内。OCR 文本检查:全检,对于题名、文号、发文日期、发文单位等关键字段,必须做到 100%正确。OCR 自动识别的正确率原则上应达到 95以上。条目与图像挂接检查:全检,挂接正确率达到 100%。(8)数据备份与提交 在数字化加工过程中,加工方应做好半成品数据(特别是原始扫描影像文件)和成品数据的存储备份工作。加工方自备不超过 1T 容量的备份空间,等项目验收数据提交完成后,中标单位收到数据提交
37、明细验收清单后,方可将数据从备份载体中删除。成品数据经验收合格后,可通过光盘及硬盘向德清县国土局提交数据,并按照规定的存储格式进行存储。采取 DVD 光盘提交数据,则 DVD 应刻录两套(一套用于保存,一套用于利用),对 DVD 光盘表面进行标记制作,并制作数据提交明细清单一式两份。7、安全与管理要求 严格遵守有关保密、档案法律法规和德清县国土资源局的有关规定。数字化加工工作必须在指定的场所内进行,确保场所正常秩序和安全。不得遗失、损坏档案,如有违反有关法律法规的,将追究相关责任人责任。word 文档 可自由复制编辑 加工单位在签订合同时成立项目组,由加工单位和委托单位人员组成。双方指定专人负
38、责该项目,加工单位项目负责人必须为加工单位公司级负责人,并列出具体的项目操作标准及流程、项目实施计划、人员及保证措施。项目工作人员必须具备一定的档案业务知识和档案整理操作能力及档案数字化加工的实际操作经验。签订保密协议,加强对工作人员的保密教育。建立严格的保密制度,加强管理,杜绝工作人员对档案及档案信息的私自复制行为。不同的工序之间采取不同的措施,杜绝泄密事故发生。扫描加工场地要做好安全及保密,具备保密设施,保证档案原件的安全和保密。在工作平台上建立监管系统,实时监控工作人员的操作过程,统一记录保存。项目完成经验收后,加工操作终端上的数据必须在委托方项目负责人的现场监督下销毁,同时移交该数字化
39、加工的监管系统监控记录。8、项目阶段性和最终成果要求 加工单位在加工期间和项目最终完成后须向德清县国土资源局提交如下项目成果:项目验收后全部加工数据及详细技术说明。需求分析报告、项目技术设计、项目施工组织设计、项目操作标准及流程、项目实施计划、人员及保证措施、阶段性工作报告、项目工作报告。如软件为加工单位提供,还应提交软件使用说明书。9、其它要求 德清县国土资源局提供档案所需的工作场所,不收取水、电费和场地费,不提供档案扫描所需的任何相应设备和数字化加工软件。双方各指定专人做好档案的清点交接工作,纸质档案扫描工作流程表随同档案一起交接。(五)项目的工作成果 内容及成果文档的提交应覆盖以下内容,电子文档是成果不可分割的部分:软件的源程序及可执行代码。源程序要求具有良好的编程风格,可执行代码以二进制文件或可安装文件的形式提供;word 文档 可自由复制编辑 数据库的设计以及数据实体模型、相互关系的描述;网络系统的拓扑结构以及相关设备的配置;系统的体系架构及描述;提供的其它技术手册,包括:需求分析报告(含软件功能需求与数据要求)系统概要设计说明书 系统详细设计方案及系统测试方案设计 软件培训资料(含系统演示光盘)数据库设计方案 程序安装维护手册 软件使用操作手册 软件功能技术手册 软件体系架构手册 系统的测试分析报告 ISO 或 CMM 标准的其他与本系统开发相关的各类文档。
限制150内