欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    古籍数字化实践与分析.docx

    • 资源ID:17872536       资源大小:24.58KB        全文页数:15页
    • 资源格式: DOCX        下载积分:9.18金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要9.18金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    古籍数字化实践与分析.docx

    古籍数字化实践与分析摘要:古籍数字化是古籍保存、整理和利用的必然趋势。文章结合(国家珍贵古籍名录)数字化工作,从古籍数字化设备甄选、元数据著录、图像采集、图像处理以及数据库建设等方面对古籍数字化实践进行讨论,指出实践中存在的问题与缺乏,并提出古籍数字化工作的合理化建议。关键词:古籍数字化;古籍保护;古籍数据库平台;国家珍贵古籍2017年2月28日,国家图书馆国家古籍保护中心与上海图书馆、天津图书馆、浙江图书馆、云南省图书馆等4家单位在国家图书馆初次联合在线古籍数字资源,本次的古籍资源均为各馆所藏特色资源,加上此前已资源,总量到达2.4万部,读者实名注册后便可免费查阅使用。本文在前人研究讨论的基础上,结合(国家珍贵古籍名录)数字化实践中的体会,对数字化经过中出现的问题作出分析、总结。1云南省古籍入选(国家珍贵古籍名录)大概情况从2008年3月1日第一批(国家珍贵古籍名录)开场公布,到2016年3月27日公布的第五批,我国已公布(国家珍贵古籍名录)12,274部。国家珍贵古籍包括甲骨文、简帛古籍、敦煌遗书、宋至清汉文古籍、少数民族文字古籍、碑帖拓本、舆图和外国文字古籍等,是最珍贵、最具代表性的中华民族典籍文化遗产。云南省内共14家古籍存藏单位及个人共235部珍贵古籍入选(国家珍贵古籍名录),包括汉文珍贵古籍174部,少数民族珍贵古籍61部。在汉文珍贵古籍里,有现存云南最早的写本大理保安八年1052大理国写经(护国司南抄);有存世不多的、装祯形式为旋风装的大理保天八年1136写本(诸fopu萨金刚等启请);有云南大理國刻本(fo說長壽命經),元延佑五年1318中庆路清凉山报国禅寺刻(大华严方广普贤灭罪称赞fo名宝忏);约在元代至顺三年到至元二年1332-1336前后,徽政院主持,在大都弘法寺刻(官刻大藏经)和明万历十七年至清康熙十五年刻的一万二千六百余卷(嘉兴藏)等大藏经典;有北宋哲宗二年绍圣二年1095刻本(春秋经传集解);有宋刻递修本(南齐书)(北齐书)(周书);有元至正二十三年1363朱元佑刻(鄂国金佗粹编);有代表性的稿本(东塾着稿);有顾炎武纂辑的钞本(肇域志)。2012年8月国家古籍保护中心开场国家珍贵古籍数字化试点工作,启动“中华珍贵典籍资源库项目的同时,编制了(古籍数字化工作手册)试用本作为本次试点工作的标准规范。(古籍数字化工作手册)试用本规定了珍贵古籍数字化的范围、规范性引用文件、术语定义、工作流程、加工准备、元数据著录、图像数字化、数据命名、数据提交、数据验收、数据利用等,作为古籍数字化根据。由于入选古籍的珍贵性,在数字化加工中,从设备的选择、元数据的著录、图像的扫描采集、图像处理到资源,每一个环节都必须做好充分的调查研究。2(国家珍贵古籍名录)数字化的实践与讨论2.1古籍数字化加工准备古籍数字化工作大致分为七个步骤施行,依序为古籍数字化加工准备,元数据著录,图像数字化,数据命名,数据提交,数据验收,数据利用。2.1.1古籍数字化的工作流程古籍数字化的总原则是:严格管理,明确责任,落实安全保密管理机制、质量管理机制,确保古籍文献原件和数字化信息的安全,确保各环节工作符合质量要求,建立完好、规范的工作记录。详细包括下面几个方面。1书目确实定。为最大限度地避免数字化的重复建设,在书目的选定上,一定要坚持珍贵性、地方性、系统性的选择标准。如国家古籍保护中心开展的珍贵古籍数字化试点工作,从已入选(国家珍贵古籍名录)的古籍中进行遴选,选定了云南省图书馆珍贵古籍44种,这其中包括国内罕有的大理国时期的写本11部、存世不多的元官藏23部、稿本5部、刻本5部。2场地的选定。为确保古籍的安全,数字化经过中古籍不得被擅自带离保管单位,因而加工场所应选定在古籍存藏机构的内部,便于古籍的监管。云南省图书馆古籍由历史文献部负责管理,部门有两个阅览室,面积都较大,因而将加工场地设在不接待读者的善本阅览室。3古籍的交接。核查书目中古籍的保存状况,制作古籍文献交接清单,由加工人员从古籍库房管理人员处领取待加工古籍,需要根据加工工作进度安排按规定领取,领取时需要对古籍数量进行盘点,并填写交接登记表,当日出库的古籍当日入库。在扫描前,加工人员根据索书号、册次及卷次进行整理登记,并统计每册书的页数及制作卷端目录。对于虫蛀、破损、残缺、褶皱等书品比拟差的书籍进行相应的记录并及时通知古籍管理人员协调处理。2.1.2古籍数字化扫描设备古籍数字化扫描设备的配置是进行古籍数字化的关键环节,是古籍数字化的主要硬件。珍贵古籍数字化,首先考虑的是古籍在无损害或最大限度减少损害的情况下进行。如今市场上有很多古籍数字化扫描的设备,经过考察比拟,云南省图书馆选择使用法国i2s公司生产的专业古籍数字化扫描设备,该公司提供了CopibookA2、SuprascanQuartzA1及SuprascanQuartzA0三种类型古籍数字化扫描仪,扫描的古籍书影均能到达或者超过(古籍数字化工作手册)试用本的要求。这三种类型扫描设备,首先解决了不同尺寸、不同装帧形式对设备的要求。在幅面上由A2到A0,且能够根据古籍尺寸大小做出调整,能够知足不同幅面古籍的数字化扫描需求,避免了较大幅面古籍分段扫描后拼接效果不理想和费时费力的问题。其次解决了翻页中不同厚度对设备的要求。扫描设备的操作平台具备作业独立升降功能,解决了古籍扫描经过中因古籍左右厚度不一而需要垫板的问题,也利于对古籍实体的保护。再次,解决了古籍扫描经过中对光源的特殊要求。扫描时的照明系统均使用冷光光源,无紫外线和红外线。照明光线由上方漫射至整个操作台,并通过软件调整整个操作台的亮度,保证了数字化经过中古籍受光的均匀,最大限度地降低对古籍的影响,保证了采集图像的精度和色彩复原度,实现所见即所得的效果。选择古籍数字化的软件,首先,要能对各种古籍扫描参数设置进行保存,可根据不同大小、类型的古籍选择最佳的扫描参数。其次,要根据古籍页边距的尺寸,设置准确尺寸,在扫描成像经过中自动裁切。再次,软件要支持多幅面图像的同时采集、多种格式输出保存。云南省图书馆使用的古籍数字化软件有i2sCopibook系列设备自带软件和i2sSuprascanQuartz系列的yooscan软件,能够知足以上的要求。2.2古籍元数据的著录古籍元数据的著录是古籍数据库建设的基础,必须是统一的标准才能使数字化成果到达合作共建、资源分享的目的。2012年国家古籍保护中心编制(古籍数字化工作手册),2014年做了修订。建议古籍数字化经过中的元数据著录,以此做为标准。(古籍数字化工作手册)元数据的著录包括文献整理登记、描绘元数据、管理元数据三部分,需要制作6张库表,包括文献整理登记表全书、文献整理登记表各卷、书目数据表、卷目数据表、外字表、管理信息表。1各表对数字化珍贵古籍整体、卷次、题名、卷名、责任者、版本、存卷、册数、页码、批跋、板式、透字、夹字、皱折、馆藏号、馆藏单位、制作单位等信息进行客观准确的著录。对古籍题名、卷次、责任者、版本、页码、批校题跋等具体记录是建立数据库的基础,也是读者快速查阅所需文献的重要根据。对古籍的夹字、透字、虫蛀、褶皱、破损、霉变、残页等进行著录,反映珍贵古籍损坏状况,便于及时发现破损情况,为下一步的修复提供根据。2.3古籍数字化图像的扫描采集古籍书页图像扫描采集时参数的选择与设置对采集图像、后期图像的处理速度、制作电子图书的质量以及后续制作仿真本有直接的影响,2且在古籍书页扫描操作经过中可能出现页面修整、古籍放置、透字衬纸、拆卷装订等方面的问题,若处理不当,会对古籍造成二次损坏。1扫描参数设置。(古籍数字化工作手册)中规定,数字扫描参数应设置为彩色扫描色深24、光学分辨率600dpi、半页型页面、输出无压缩的TIFF格式、冷光光源扫描,亮度、曝光度、白平衡等需根据环境的变化时时做出调整。2古籍放置。在古籍书页扫描时,书籍放置在承书操作平台上书页应与扫描仪确实成为垂直角度,并固定好使之不可移动。由于古籍年代长远,存在纸质脆化、老化、破损等状况,扫描放置古籍时工作人员须轻拿轻放,同时须避免古籍因过分挤压拖动、反复放置,造成人为的古籍实体损坏。3古籍页面修整。馆藏古籍存在纸张卷曲,页面褶皱、折角的现象,在图像扫描采集前如不对古籍页面进行修整,玻璃压板挤压便会造成古籍损坏加重,可以能因书面文字遭到遮挡进而影响古籍文字内容的识别阅读,甚至还会影响古籍图像的美观,因此,云南省图书馆在古籍图像扫描采集时对书页卷曲、褶皱、折角进行稍微的抚平,确保页面的平整。4古籍透字处理。古籍数字化中出现透字情况,是每一个负责扫描的工作人员最不愿意遇见的,不是怕费事,而是方法使用不当容易对古籍造成二次损坏。3云南省图书馆部分古籍纸质薄,页面文字可透过纸张,古籍图像扫描采集时构成重影,不便于阅读使用。目前云南省图书馆处理古籍透字的情况主要采取衬纸的方法,在书页间参加衬纸,并选择柔软的宣纸进行托衬。然而参加衬纸很容易划破书口,因而在扫描时碰到透字古籍时需要工作人员慎重细心对待。5古籍拆卷处理。原则上古籍一般不进行拆卷处理,若因特殊情况需要拆卷,必须经过专家核定,由专业人员进行操作。4云南省图书馆古籍数字化中拆卷主要是由于部分古籍书脊距文字太近,扫描时出现夹字现象,图像页面文字内容不完好。还有部分透字古籍,纸质老化、脆化、破损严重,衬纸的方法会对古籍造成二次损坏,这时,需要对古籍进行拆卷处理。这项工作必须慎之又慎,如碰到非拆不可的,必须由修复专业人员对古籍进行拆卷、修整。2.4古籍数字化图像处理完好明晰再现古籍原貌,是整个数字化工作成功的关键。在古籍数字化经过中,大部分图像需要后期进行处理,所有后期处理工作都仅在未改变原扫描或拍照图像的色彩、分辨率、格式、压缩的情况下进行,包括纠偏、拼接、去污、裁切及水印等。1纠偏处理。古籍扫描图像需要纠偏处理,主要有两个原因:一是扫描工作人员在扫描时未能将古籍左右放置平行整洁;二是部分线装古籍在装订时装订线没有与书口平行出现倾斜,古籍扫描时展开书籍页面很难到达四边垂直平整。以上情况导致古籍成像偏斜,需要后期进行纠偏处理,使版心居中、页面端正明晰。2图像拼接。图像的拼接在字画、碑帖及地图等数字化时较为常见,古籍图像能否需要拼接主要由古籍的装帧形式而定,一般线装古籍页面图像多在A2幅面内,较少需要拼接,而旋风装、经折装、卷轴等装帧形式的古籍图像均需拼接。古籍图像的拼接是将分段扫描的图像整合以复原古籍原貌和内容,便于阅读和使用。3去污处理。古籍图像采集后一般不做任何页面内容修改,以保留古籍的原汁原味。去污处理是针对古籍原件边缘背景页面的干净处理。扫描时不管使用什么底色作为背景,古籍数字化图像使用高分辨率、高精度的成像采集,空气中较大颗粒的灰尘、古籍脱落的纸屑等掉落在操作平台上都将会呈如今图像里,当图像需要放大时很多的脏点便会出现,严重影响了古籍的美观和阅读效果。因此在保存古籍原生性图像条件下,需要做背景的洁面处理。4裁切与水印处理。古籍采集图像所占内存较大,除了保证古籍原件的完好性需要留存少量的页边距外,不能保存太大无关幅面,因此在古籍页面进行拼接、纠偏处理后将多余的页面背景进行裁切。再者,古籍数字化的成果不断地对读者开放,读者可通过网络阅读和下载数字化的珍贵古籍。为防止恶意下载或进行商业牟利,在古籍资源提交前将古籍图像页面添加馆藏水印。古籍水印的添加必须能与古籍文字颜色进行融合,进而不影响古籍的阅读。2.5古籍数字化资源的古籍数字化是古籍保存、整理和利用的必然趋势,也是数字图书馆建设的重要组成部分。目的是使所有的古籍数字化成果能够在最大范围内给读者提供服务,真正实现古籍资源的共建分享。5古籍数字化的成果只要建立相应的数据库平台才能实现分享的目的。古籍数据库平台技术的运用,能够使文献数据库最大限度地发挥其检索、存储功能,进而使得文献数据库到达存储信息量大,信息密度高,涉及信息范围广,数据连续性、积累性强的效果,使用户能在短时间内查询到最有效的信息。6古籍数据库根据如今的技术处理情况,能够将其分为图像版、文字版、图文版。云南省图书馆根据馆藏古籍现有条件的实际情况进行以数字图像为主的数据库建设,即通过扫描古籍全文,建立图像数据库,同时著录相应的元数据,构成基于元数据的古籍全文数据库。71采用形式。古籍数据库采用的形式包括C/S形式、APP形式和B/S形式。8C/S客户机/服务器形式的产品需要客户下载一个数十MB的客户端,然后进行安装配置。APP形式,用户也需下载客户端。B/S阅读器/服务器形式,用户只需要在阅读器中打开该网站网页进行检索和阅读,不需要下载任何客户端。我馆与中国古籍保护网的数据库均采用B/S形式。2开放方式。古籍数据库可采用不同的开放方式。如中华古籍资源库、哈fo大学哈fo燕京图书馆善本特藏资源、东京大学东洋文化研究所汉籍全文影像数据库、天津图书馆古籍数字资源都需要注册该馆的账户才能阅览;云南省图书馆古籍数字资源数据库只需进行实名注册即可查询和阅览,上海图书馆家谱全文数据库、古籍善本刻本库,浙江图书馆馆藏珍贵古籍数据资源都是进入数据库网页便可查询和阅览。3检索设置。查询检索是数据库的基本功能,能使读者在瀚如烟海的数据中快速地查询阅览所需古籍资源。但在中国古籍保护网资源数据库的检索设置有着较大的差异。首先,检索字段设置不同。如中华古籍资源库通过题名、善本号、责任者进行检索,哈fo大学哈fo燕京图书馆善本特藏资源通过题名、责任者、出版年代、出版地、出版者、附注项进行检索;上海图书馆藏家谱数字资源通过题名、姓氏、居地、堂号、著者、名人、丛书、索取号进行检索可以以通过全部索引进行合并检索;其次,检索方式有准确检索、模糊检索、高级检索、二次检索、分类检索的差异;再次,检索结果的阅读方式不尽一样。中华古籍资源库、哈fo大学哈fo燕京图书馆善本特藏资源、东京大学东洋文化研究所汉籍全文影像数据库可对检索古籍进行题名、责任者的升序或降序排序,可以以选择图文结合或者列表方式阅览古籍的著录信息。4阅览设置。古籍阅览是古籍数字化的最终目的,目前在古籍资源数据库时,在古籍阅览界面及功能的设置上各具风格。共同的是每个数据库阅览古籍图片时都能够对图像进行缩放、上/下翻页、目录设置、古籍册次选择及当前页显示。不同的是部分数据库的古籍图像阅览还能够进行指定页面跳转、附件查找、添加随笔、全屏阅读、缩略图、首末页跳转等,并且数据的目录仅限于册次选择,而不能到达卷次内容的点击进入。古籍数据库平台除了上述异同外,还具有其他一些特色功能设计,如云南省图书馆数字资源库设置了云南古籍分布的动态图,并以中国朝代为时间轴线显示各历史时期的古籍上线状况,使馆藏古籍在空间和时间上更具直观立体。哈fo大学哈fo燕京图书馆善本特藏资源可将阅读古籍资源共享至QQ、微博、豆瓣网等。但是由于目前全国古籍平台数据库并没有统一规划和功能标准,所以还存在开放方式、检索字段不统一,显示古籍描绘信息不一致、阅览界面功能差异大等一些问题,读者换一个数据库必须重新学习才能更好的使用,千差万别的数据库形式容易让人混淆,给读者带来了不便。3将来古籍数字化的瞻望随着古籍数字化理论研究的深化与实践的阅读推动,我们应不断加强对古籍数字化工作的创新与完善。3.1促进全国古籍普查与古籍数字化的结合我国古籍数量诸多,馆藏分散,需要进行全面的普查。从2007年开场施行“中华古籍保护工程,启动了全国古籍普查工作。目前,中国古籍保护网已陆续将古籍普查的数据在“全国古籍普查登记基本数据库,便于读者了解古籍、利用古籍。但是古籍数字化工作却是各单位独立进行,容易造成选目重复及人力、物力资源的浪费。在古籍数字化资源共建分享的原则下,应加强古籍数字化与古籍普查的严密结合,避免资源重复建建设。3.2实现古籍数字化的标准化古籍数字化是一项系统的工作,必须在统一的基本原则的指导下才能有效健康地运行。国家古籍保护中心编制(古籍数字化工作手册)作为全国古籍数字化参考原则,对古籍数字化基本流程、元数据的著录、图像的采集、图像处理等做了规范,但缺乏的是(古籍数字化工作手册)的指导原则还未能涉及到古籍数字化数据库平台的建设,导致了独立研发的数据库互不兼容、只能在各自的平台上运行。因此,古籍数字化的工作指导原则还需进一步的完善,到达统一的标准,便于所有数字资源的整合与读者的查询利用。3.3加强古籍数字化设备与技术的完善先进的科学技术在文化产业发展中的比重逐步提升,因而,古籍数字化也应该在实践的基础上加强对设备与技术的创新。一方面要求图书馆及图书馆员要及时关注和了解国内外最新的古籍扫描设备发展的科技动态;另一方面,要实现对现有应用软件程序及时的更新升级。加强硬件设备与软件技术的完善,实现古籍数字化工作与国际顶尖科技的接轨。参考文献1国家古籍保护中心古籍数字化工作手册v.1修订版,2014:18.2盛玉玲.国家农业图书馆农业古籍数据化的讨论与实现J.农业图书情报学刊,200512:1113,16.3潘星耀浅谈古籍数字化扫描工作需注意的问题J.新世纪图书馆,201612:6062.4梁爱民,陈荔京古籍数字化与共建分享J国家图书馆学刊,20125:108112.5张旭古籍文献数据化的趋势与存在的问题J.安徽文学,20102:295296.6刘聪明古籍全文数据的建设J图书馆学刊,20117:7880.7邓仲华,等古籍数据库的交互界面设计研究J.20148:3135.8史丽香当前几种代表性中文古籍数字化产品评析以用户需要和反应为根据J.图书馆工作与研究,20111:101103.

    注意事项

    本文(古籍数字化实践与分析.docx)为本站会员(安***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开