基于本体网络概念化单元信息研究-付苓.pdf
《基于本体网络概念化单元信息研究-付苓.pdf》由会员分享,可在线阅读,更多相关《基于本体网络概念化单元信息研究-付苓.pdf(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、收稿日期:2017-10-18 修回日期:2017-12-18基金项目:国家社会科学基金重大项目“面向大数据的单元信息组织体系研究”(编号:14ATQ003)研究成果之一。作者简介:付 苓(ORCID:0000-0001-5999-4167),女,1985年生,博士,馆员,研究方向:知识组织、大数据、语义检索等。基于本体网络概念化单元信息研究*付 苓(首都图书馆 北京 100021)摘 要 目的/意义为实现单元信息的表示、组织、保存和显示,提出了一种基于本体的单元信息语义模型。 方法/过程调研现有单元信息表示模型,提出单元信息本体网络概念化单元信息表示模型,介绍了YSUINet本体网络的结构及
2、其中存在的语义关系。 结果/结论单元信息本体网络以模块化和增量方式开发概念模型,揭示了单元信息的语义,更利于标注和访问单元信息。关键词 单元信息 本体 本体网络 单元信息本体网络中图分类号 G250 文献标识码 A 文章编号 1002-1965(2018)01-0122-04引用格式 付 苓.基于本体网络概念化单元信息研究J.情报杂志,2018,37(1):122-125.DOI 10.3969/ j. issn.1002-1965.201710194Research of Conceptualizing Unit Information using an Ontology NetworkFu
3、 Ling(Capital Library of China,Beijing 100021)Abstract Purpose/SignificanceIn order to accomplish the representation, organization, preservation and display of unit informationthis paper proposes the semantic model of unit information. Method/ProcessBased on the research on description model of unit
4、 informa-tion, it puts forward the ontology network that conceptualizes unit information. This paper presents the structure of YSUINet ontology net-work and the semantic relationships that exist in it. Results/ConclusionUnit information ontology network has the possibility of develo-ping a conceptua
5、l model with a modular and incremental approach,reveals the semantics of unit information, which facilitates the annota-tion and access to the unit information.Key words unit information ontology ontology network unit information ontology network0 引 言大数据的主要挑战是从海量的结构化、半结构化和非结构化的数据中提取有价值的信息。单元信息的实质是文献
6、中的“知识单元”,即文献中隐含的有价值的表征概念、观点、原理、方法、数据、论述、结论等的原文片段信息。单元信息知识组织体系建设,为单元信息的组织和利用提供了支撑,实现了图书馆资源有效组织和深度关联,满足了用户从海量异源异构数据中快速有效地获取有价值的信息的需求1。单元信息知识表示模型是对文献和单元信息等的规范描述和语义化组织,通过对各种资源中的单元信息进行知识揭示、知识有序组织和知识关联,实现资源有效组织和深度关联,提供满足用户需求的知识服务。通过使用单元信息的语义模型替代传统文献线性结构的知识表示模型,可以使读者更容易通过单元信息的语义模型表示进行高效的搜索和浏览。读者可以只检索自己感兴趣的
7、原文片段部分进行阅读,而避免海量其他信息的干扰。更为重要的是,在大数据环境下,越来越难以仅依靠人工的方式添加元数据进而提高检索文献的效率和准确率,结构化和语义化单元信息知识表示,能够帮助机器实现自动分类、聚类、数据挖掘及语义检索等。本文通过对单元信息表示模型和形式化方法的现状分析,论述基于本体的单元信息语义模型研究。1 单元信息表示模型许多学者对单元信息表示模型进行了研究,周宁第37卷 第1期2018年1月 情 报 杂 志JOURNAL OF INTELLIGENCE Vol.37 No.1Jan. 2018万方数据等2提出了二元组表示方法;高国伟3等提出了概念、关系、问题三元组表示方法;姜永
8、常、马倩倩和高劲松4-6都提出了名称(或称为概念)、属性、操作(或称为方法)和关联四元组表示方法;边文越7等提出了名称、物质组成、性能和来源四元组数值型科技前沿问题单元信息;肖洪8等提出了时间、指标、谓词、数值、单位五元组表示数值型单元信息;谢庆球9等提出了一种三层次六元组(编号、来源、特征词、内容、内导航、外导航)的表示方法;刘淼等10提出了编号、导航、来源、类型、特征词、内容六元组表示期刊文献单元信息的方法;李珊珊11提出了来源、导航、名称、内容、主题和主题领域六元组表示期刊文献单元信息的方法;WEN等12提出了名称、表示方式、法则信息、操作信息、导航信息、上属信息和相关信息七元组表示方法
9、。毕崇武13等从标识、描述、关系3个层面分别表示方法型、概念型、事实型和数值型知识元。蒋玲14提出了标号、名称、描述、属性、主题词、来源、类型、上下文、上下文关系表示方法。上述研究文献中知识元、知识单元与本文中单元信息的概念一致,所以在引用其他文献和下文阐述时统一用单元信息表示。以上研究为单元信息表示模型研究提供了指导,但仍存在以下问题: 二元组、三元组表示方法局限于单元信息的属性和内容表示,仅侧重于对文献资源的客观描述,忽略了对单元信息之间语义关系的表达;四元组、六元组、七元组等多元组表示方法,使得单元信息的数据结构维度日益增高,描述项增多,表达冗长,不易实现推理完备性;也增加了计算机对语义
10、内容识别的难度。 单一面向某类型的单元信息,难以推广于普适的单元信息的描述。本文在层次表示方法的基础上,归并具有相同意义的单元信息表示元素,重用文献资源的已有表示,建立了本文的单元信息表示模型,如图1所示。图1 单元信息表示模型单元信息表示模型包括单元信息标识符、单元信息来源和单元信息内容3个方面。其中,单元信息内容定义了单元信息的内在知识内容、知识特征和属性。第一,单元信息标识符用来唯一标识单元信息,为了方便单元信息的存储,会将提取出的单元信息存储到单元信息库。单元信息标识符是单元信息库中标识单元信息的一个重要字段,也是对单元信息进行索引和查找的重要字段。第二,来源是单元信息具体来自的文献信
11、息。来源是单元信息所存在的图书、期刊等文献的标题等,可以实现单元信息与文献之间的互逆导航,可以通过单元信息的来源获取所在文献的其他元数据或查找相关的有价值的文献,可以通过文献的元数据查看文献内的单元信息。第三,单元信息内容包括描述、主题和类型,描述是单元信息本身,主题是单元信息所描述的内容的归属主题,类型是单元信息所属的类型。描述是单元信息在文献中本身所包含的信息,即文献中的原文片段信息,可以直接体现知识的类型。主题是针对单元信息所描述的内容而提取的描述单元信息能力的主题概念。主题词是提取单元信息的重要特征信息,描述单元信息的主题词的准确性和有效性直接影响到单元信息检索的准确性和有效性。不同学
12、者提出了不同的单元信息类型划分方法,本文将单元信息类型分为概念型、方法型、数值型、事实型和陈述型。单元信息的类型有利于对单元信息进行分类和聚类。2 基于本体的单元信息语义模型单元信息表示模型的形式化表示主要是基于XML2和基于本体15-16的方法,本体是概念化的明确的规范说明,提供明确的和机器可理解的领域的概念化。本体的主要目的是获取有关特定领域的知识,并提供共同接受的表示以供重用和共享。建立基于本体的单元信息语义模型是实现知识语义表示、关联的关键。本体网络是通过各种不同关系(如映射、模块化、版本和依赖)相关联的一组本体。这个集合的元素称为网络本体17。本体网络与本体关系中一组相互关联的个体本
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 本体 网络 概念化 单元 信息 研究
限制150内