基于bibframe的科技报告语义服务研究-夏立新.pdf
《基于bibframe的科技报告语义服务研究-夏立新.pdf》由会员分享,可在线阅读,更多相关《基于bibframe的科技报告语义服务研究-夏立新.pdf(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、情报学报 2017年7月 第36卷 第7期 Journal of the China Society for Scientific and Technical Information, July 2017, 36(7): 695-705 收稿日期: 2017-01-20; 修回日期: 2017-03-05 基金项目: 国家社会科学基金重大项目“基于多维度聚合的网络资源知识发现研究” ( 13&ZD183) 。 作者简介: 夏立新,男, 1968 年生,教授,主要研究方向为信息组织与检索、数字图书馆;白阳,男, 1990 年生,博士研究生,主要研究方向为信息组织与检索, E-mail: ;康雨培
2、,女, 1992 年生,硕士研究生,主要研究方向为数字图书馆;李重阳,女, 1991 年生,硕士研究生,主要研究方向为信息组织与检索;李成龙,男, 1988 年生,博士研究生,主要研究方向为信息组织与检索。 基于BIBFRAME的科技报告语义服务研究 夏立新,白 阳,康雨培,李重阳,李成龙 (华中师范大学信息管理学院,武汉 430079) 摘 要 科技报告是国家科技创新战略的重要支撑资源,但目前存在开放程度不高、数据管理冗余和关联不深入的问题。由此,本文提出应用 BIBFRAME 书目框架构建科技报告的关联数据化服务的方案。该方案构建了基于BIBFRAME 的科技报告语义关联与服务框架,通过语
3、义描述、语义组织和语义服务来实现科技报告的关联数据化并支持其展开丰富的语义服务。最后,本文对该方案的实证研究表明,该方案对于解决科技报告建设现存问题具有一定的可行性和有效性。 关键词 科技报告; BIBFRAME;关联数据;语义服务 Research on the Semantic Services of the Scientific and Technical Report Based on BIBFRAME Xia Lixin, Bai Yang, Kang Yupei, Li Chongyang and Li Chenglong (School of Information Manage
4、ment, Central China Normal University, Wuhan 430079) Abstract: A scientific and technical report is a kind of crucial resource that supports the technical innovation strategy of the country. However, there exist some issues such as low open degree, redundant data management, and non-deep association
5、 in its development. Thus, this paper proposes a program that uses BIBFRAME (bibliography framework) to build the linked data services of scientific and technical reports. Through the processes of semantic description, organization, and service, the program constructs the semantic association and se
6、rvice framework of the scientific and technical report based on BIBFRAME, in order to realize the data linked state of the scientific and technical report and support the ample semantic service on the Internet. Finally, the empirical study shows that the program has fea-sibility and validity for sol
7、ving the existing problems in the construction of scientific and technical reports. Key words: scientific and technical report; BIBFRAME; linked data; semantic services 1 引 言 科技报告是科技人员在科研活动中撰写的能够完整而真实地反映其所从事活动的过程、方法、技术、经验和结果的特种文献1,也是驱动和支撑科技创新发展的重要组成部分。所以,很多国家非常重视科技报告工作,美国、日本、欧盟等很早就建立了相对完善的收藏和管理制度2-3
8、,希望通过科技报告制度体系来累积科技知识,支撑科技的发展和创新。而我国科技报告制度在近几年的建设中也取得重要进展,形成了较为完善的管理模式。 2014 年, 4 个科技报告国家标准规范公开发布,同年,国家科技报告服务系统上线。截至 2017 年 1 月,国家科技报告服务系统已累积和公开 8 万余份科技报告数据4。 科万方数据696 情 报 学 报 第 36 卷 技报告的体制发展目的是对科技报告进行有效的管理,更是通过累积的科技报告文献来支持科技创新的发展需要。 2016 年 5 月,国务院发布了国家创新驱动发展战略纲要 ,指出科技创新必须摆在国家战略发展层面,使创新成为引领发展的第一动力5。因
9、此,科技报告作为科技工作的产出成果,蕴含丰富的科技知识,有必要对其进展再组织和再利用,以支持国家科技创新战略。 然而,科技报告制度的建立目前只能在一定程度上解决科技报告的呈缴和收藏的问题,并在保密机制下允许部分科技报告公开,但其中存在很多问题。一方面,虽然目前各科技报告管理系统都在保密机制下对描述数据进行了公开,但却只局限于封闭的系统中,外部网络尚未能对这些数据引用和检索利用,削弱了已开放科技报告数据的应用价值的实现;另一方面,除了国家科技报告管理系统外,还有一些机构和地方也存在科技报告管理系统,它们之间存在诸多冗余数据,不利于科技报告的高效管理;此外,对科技报告管理的目的主要对其进行有效利用
10、,但科技报告管理系统中孤立的文献单元只能展现有限的科技知识,科技报告数据集也仅是对不同科技知识碎片的聚集,所以无法向使用者提供紧密关联的科技报告及科技知识。对科技报告的呈缴不仅仅是为国家和社会存储科技知识财富,还要从科技报告量的累积中探索更有益于科技报告价值发挥的服务模式,促使科技报告成为科技创新的新动力。所以,对科技报告的开发利用迫切需要一种方式来同时解决其目前开放、管理及关联的问题,而实现数据的语义关联能较好地解决这类问题。2016 年国际灰色文献会议也指出,在号召科学信息开放的同时, 也要密切关注通过语义分析进行灰色文献数据的收集和整理工作6。科技报告作为灰色文献之一,也面临着这样的发展
11、需要。因此,本研究选取应用语义关联构建思想的 BIBFRAME( Bibliographic Framework,简称 BIBFRAME)书目框架,对科技报告进行关联数据化以尝试解决上述问题,并且通过语义服务来支持科技创新。 2 研究现状 从科技报告的诞生至今,学术界一直在跟踪其发展变化,国内外研究人员对其管理和应用进行了广泛的探讨。 国外文献对科技报告的研究主要集中在两个方面,一是对科技报告的规范制定,如对科技报告的编写和组织进行统一规定,二是在科技报告的获取和服务上进行研究。 在标准规范方面, 早在 1982 年,国际标准文献工作:科技报告的介绍 ( ISO 5966- 1982)就对科技
12、报告的格式做出了详细的规定7。1987 年,美国国家信息标准协会( NISO)及美国国家标准协会( ANSI)联合推出 ANSI Z39.18-1987,经过 2005 年的更新和修订,该标准主要对科技报告元素、组织及设计进行了统一描述8。科技报告的编号有助于科技报告的统一管理,美国在 1974 年制定了科技报告编号标准,此后又经过 5 次修订及完善,形成 ANSI/NISO Z39.23-1997(R2015)9。 科技报告的获取研究主要集中在科技报告服务系统的设计与建设层面,例如,对美国 NASA 科技报告网络服务及OAI 协议的描述10,对科技报告及图像数据库TRAIL 的功能介绍11,
13、关于韩国科学技术信息研究院的国家科学领袖发现系统 NDSL 的讨论12等。2009 年美国建成国家技术报告图书馆 NTRL,收录了 200 多万篇科技报告,其中通过 OSTI 资源获取DOE 研发成果的交易量迅速增加, 2014 年达到 3.8亿次13。 国内关于科技报告的研究,除了对国外科技报告发展进行介绍外,主要集中在科技报告的体制建设和科技报告的质量监控两个方面。科技报告的体制建设主要是探讨科技报告的标准体系建设和运行机制。邹大挺等14研究了中国科技报告体系的发展策略、管理体系、法规制度体系和标准体系;周杰15研究了科技报告资源的形成机制,从 5 个维度诠释了科技报告资源的价值构成;贺德
14、方等16提出了我国科技报告制度建设的政策依据,设计了我国科技报告体系和共享服务模式,并制定了我国科技报告工作的实践指南;刘西怀等17分析了科技报告制度中国家、项目承担单位及主要负责人三方权利义务及知识产权权属问题,对科技报告的质量监控主要是依据科技报告特征和要素来评价其质量,并提出一些对策与建议。裴雷等18提出了科技报告质量评价指标体系的设计原则、方法、描述框架、参考体系和发展完善的对策建议。朱丽波等19综合运用头脑风暴等多种方法分析了科技报告的质量影响因素,构建了基于加权的科技报告评价指标递阶层级结构。乔振等20从科技报告质量控制与评价标准、评价指标体系、控制与评价方法 3 个方面对山东省科
15、技计划科技报告进行了评价和问题分析。此外,在科技报告的使用方面,夏立新等21提出基于关联数据的科技报告语义组织与共享框架以解决科技报告服万方数据第 7 期 夏立新等:基于 BIBFRAME 的科技报告语义服务研究 697 务系统不能提供关联服务的问题,但此类研究极少。 纵观国内外对科技报告的研究和实践,整体上都一致认为科技报告是科技创新的财富和基石,相关研究和应用多集中在科技报告的编制、组织、存储、管理、共享和评价等方面,但如何让累积的科技报告通过语义关联进行组织和服务却仍是一个崭新的命题。而 BIBFRAME 书目框架能够对书目数据进行规范描述和关联数据化,有助于书目信息在互联网中进行更广泛
16、的交流共享并实现其价值。所以,本文从构建科技报告语义关联的角度出发,在BIBFRAME 框架的规范下构建科技报告关联数据,希望在科技报告的语义关联基础上探讨科技报告的价值实现和服务应用。 3 利用 BIBFRAME 实现科技报告的开放互联 孤立的科技报告在封闭的系统中只能提供碎片化的科技知识,难以支持科技创新的发展需要,只有基于大量科技报告的关联甚至与其他数据的开放关联,才能够为科技创新提供多维度的知识服务。为此,本文将在分析科技报告核心内涵及目前科技报告服务系统存在问题的基础上来阐述科技报告的开放互联的发展需要,并结合 BIBFRAME 的特点探讨如何通过 BIBFRAME 框架实现科技报告
17、的开放互联。 3.1 科技报告的开放互联发展需要 科技报告是以积累、传播和交流为目的,并且按照规定格式编写而成,着重反映了科技项目的研制、设计、实验和生产过程中的进展,以及研究的主要内容和结果,对后续科研活动具有较高的参考价值22。因此,科技报告反映了科技知识的多样性,在科技创新中具有独特的地位。而常见的科技报告管理和服务系统主要向用户提供导航和检索服务,但这两类服务存在一些问题。以国家科技报告服务系统网站为例,该网站导航部分主要采用树状结构组织科技报告,为用户提供项目来源、学科、地域和科技报告类型几类导航形式。但这种方式不能突出报告主题,数据之间缺乏关联,用户很难在简单的列表结构中快速定位目
18、标资源。而在检索上采用半开放式,需要登陆账号后才能进行关于题名、作者和项目名称等选项的组合检索,而检索结果仅列出科技报告描述数据中出现该词的报告,无法反映与之关联的内容。 但是,单一的科技报告所能反映的知识很有限,所以,有必要对科技报告数据进行关联,以实现各类科技报告以及科技报告内元数据的关联和合理组织,支持其更好地开放利用。 因此,有必要对科技报告数据进行关联,以实现各类科技报告及科技报告内元数据的关联和合理组织,支持其更好地开放利用。对科技报告的组织不应该是孤立数据的汇集或者简单的罗列,也不是以项目类型、报告类型和不同地域而分割的数据集合,而应该从广度和深度上通过语义关联解决其描述和组织的
19、问题。从深度上,通过规范化的语义形式描述科技报告的内容特征;从广度上,联结所有存在相关关系的科技报告个体。最后形成科技报告的语义关联网络,并在此基础上构建科技报告的开放应用服务,帮助用户更深入地获取相关联的科技报告及科技知识。 3.2 BIBFRAME实现科技报告开放互联的优势 BIBFRAME 书目框架计划是由美国国会图书馆于 2011 年提出的面向网络书目数据交换与共享的框架23。 BIBFRAME 继承了 FRBR 的概念思想,通过抽象概念层级和关联数据模型构建书目数据的描述关系,用以解决书目信息在网络环境中的交流和共享问题,其数据格式比 MARC 等元数据标准适应开放的网络环境,同时比
20、 RDA 简单实用24。上海图书馆曾将家谱数据库发布为 BIBFRAME 形式的关联数据,并在该基础上创建了家谱关联数据服务平台25,帮 助用户从家谱的历史关联中发现有趣的新知。所以,从BIBFRAME 的设计理念和实践应用中可以看出,BIBFRAME 书目框架对书目数据的组织管理及开放共享有一定优势,有助于实现对科技报告这一特殊馆藏的高效组织和利用。 首先, BIBFRAME 帮助科技报告实现在全网中的开放。 BIBFRAME 通过为科技报告数据的实体赋予唯一 URI( Uniform Resource Identifier) ,来实现科技报告描述信息在全球范围内的定位和公开访问,突破了封闭
21、馆藏的局限,使科技报告数据能够与其他网络资源信息交互,实现数据和服务的开放共享,促进科技报告的价值发挥。 其次, BIBFRAME 简化对科技报告的统一管理。一方面, BIBFRAME 对科技报告数据各类实体的 URI 描述,使得数据录入的共享程度上升到细粒度级别,在呈缴阶段录入的信息可以通过共享而允许不同管理和收藏机构进行参引。另一方面,BIBFRAME 对作品 ( Work) 实例 ( Instance) 万方数据698 情 报 学 报 第 36 卷 单件( Item)的抽象概念设计,是一种从抽象到具体的层级关系,有助于构建不同类型和不同机构收藏下科技报告的相互关系及统一管理。 最后, B
22、IBFRAME 帮助科技报告实现语义关联。在互联网中,事物间的关联能够有效解决信息孤岛问题,同时还能对原有信息进行拓展延伸,触发新知。 BIBFRAME 框架面向未来的语义互联网,以关联数据为基础,能够将科技报告数据拆分为 RDF 三元组并通过 URI 标识,使之成为相互关联的细粒度语义单元,使科技报告数据具有语义表达、自关联及与其他网络资源关联的能力。 因此,鉴于科技报告自身需要向开放互联发展,以及 BIBFRAME 在资源的组织和管理、开放和关联方面的优势,本研究尝试通过借助 BIBFRAME 书目框架对科技报告进行语义关联构建和语义服务探究,以弥补当前科技报告服务中存在的问题。 4 基于
23、 BIBFRAME 的科技报告语义关联与服务方案 通过 BIBFRAME 书目框架对科技报告数据进行组织,可以从底层帮助解决科技报告目前存在的开放、管理及关联方面的不足,帮助科技报告在顶层实现单一封闭系统的突破和开放,从冗余管理走向多层级的共享管理模式,以及以文献单元为中心的列表服务转向以知识主题为中心的多元关联服务。基于这些优势,本文将给出基于 BIBFRAME 的科技报告语义关联与服务框架,并详细描述科技报告的语义关联化实现过程及其语义服务内容。 4.1 基于BIBFRAME的科技报告语义关联与服务框架 基于 BIBFRAME 的科技报告语义关联与服务框架,旨在从实践设计角度规划和探究科技
24、报告的关联构建与服务形式。如图 1 所示,主要由两大部分构成,一是通过 BIBFRAME 实现科技报告的关联数据化,通过 BIBFRAME 中关于数目数据描述的类、属性和类型等规则与科技报告元数据进行映射,以实现对科技报告的语义描述,然后通过关联数据创建方法和工具形成科技报告关联数据项实现科技报告的语义组织;二是在科技报告关联数据的基础上进行语义服务,借鉴 BIBFRAME 框架对书目数据组织和管理的先天优势上,实现科技报告的多源聚合、可视化浏览、语义检索和数据管理与共享等服务。 图 1 基于 BIBFRAME 的科技报告语义关联与服务框架 4.2 应用BIBFRAME框架实现科技报告的关联数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 bibframe 科技 报告 语义 服务 研究 立新
限制150内