专业出版领域知识服务系统设计.docx
《专业出版领域知识服务系统设计.docx》由会员分享,可在线阅读,更多相关《专业出版领域知识服务系统设计.docx(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、专业出版领域知识服务系统设计专业出版领域知识服务系统设计摘要:基于开放域的知识服务系统已较为成熟,但是对于传统出版领域,尤其是专业出版领域而言,它还是一个非常新鲜的技术。在分析行业现状及需求的基础上,设计专业出版领域知识服务系统,构建专业领域知识体系,对专业出版领域的资源进行知识化加工及标引,构成知识库,并基于知识库提供面向不同用户的个性化定制服务。关键词:专业出版;知识服务;知识标引;知识库构建;语义检索DOIDOI:10.11907/rjdk.161078中图分类号:TP319文献标识码:A文章编号:1672-78002016005-0062-040引言20世纪80年代,信息服务产生并在世
2、界范围内广泛普及,成为社会信息化的重要标志之一。随着信息技术打破摩尔定律继续以超高速迅猛发展,信息给人们的科研和决策也带来了众多费事。信息元作为信息传播的最小单位,能够不断地连接、组合构成新的构造。信息元的这种无穷组合能力促使新信息不断产生,导致信息爆炸,构成信息烟雾。在诸多信息和数据库面前,科研工作者和决策者却感到获取有用信息变得愈加困难。为了让人们从“信息超载和“知识饥渴的窘境中走出来,在知识密集型服务行业中出现了一个新的服务领域知识服务。知识服务从各种显性和隐性知识资源中根据人们的需要有针对性地提炼知识,是一种用来解决用户问题的高级阶段的信息服务经过,它是一种面向知识内容和解决方案的服务
3、。区别于传统的信息服务,知识服务是用户目的驱动的服务,面向知识内容的服务,它非常重视用户需求分析,根据问题和问题环境确定用户需求,通过信息的析取和重组来构成符合需要的知识产品,并能够对知识产品的质量进行评价。此外,知识服务是面向解决方案的服务,它关心并致力于帮助用户找到或构成解决方案。同时,知识服务是为用户解决问题工程的经过性服务,帮助用户进行知识的捕获、分析、重组及应用,根据用户需求来动态和连续地组织服务。1行业现状与需求在当前语境下,专业知识服务1工作的开展,无论是对出版企业还是技术提供方都提出了较高要求,尤其是在专业知识领域2,详细要求主要体如今如下几个方面:一是对资源的要求,区别于无体
4、系、无规范及无专业保证的互联网资源,出版社具备专业的编辑团队及知识来源,是开展知识服务的最佳基础;二是对技术的要求,只要依托于先进的技术手段及产品设计理念,才能实现合理的知识呈现、提供良好的解决方案;三是对知识服务的理解程度,在知识服务开展经过中,知识服务提供方要结合本身的资源优势及用户特点,基于对知识服务内涵及外延的了解,建立行业及专业的知识谱系及服务模型3。近年来,国外学界对知识服务概念及范围的研究甚嚣尘上,与知识服务概念研究热潮构成鲜明比照的是知识服务实践开展却相对滞后,能真正系统开展知识服务的机构很少。但是,诸多数字出版企业并没有停下前进的脚步,国内外诸多出版机构都开展了在该领域的探索
5、,并在探索的基础之上依托多元化的产品形态及运营形式,为用户提供基于知识的服务,为我国出版界开展知识服务建设提供了珍贵经历2。本课题的主要研究目的是提供一套可行的解决方案,知足专业出版领域的知识体系构建、知识加工及标引、知识库构建以及对外提供知识服务的需求。2系统架构设计2.1系统总体架构系统总体架构如图1所示。2.2资源收集及管理专业出版领域的资源是专业出版社最核心的资产,将这些资源进行数字化、构造化及知识化,结合构建的知识体系构成知识库,再对外提供知识服务3,这是本解决方案要实现的目的,也是整体框架设计的根据。存量资源以图书、期刊等出版物为主,这些资源由于出版时期不同,其存储介质也不尽一样。
6、早期出版物以纸质为主,到了20世纪8090年代,出现了排版软件,例如方正书版、InDesign等,这时资源存储的介质已经数字化,基本上以方正书版文件、PDF、WORD等形式出现。对于存量的纸质图书,能够通过扫描、OCR识别构成PDF文件实现其数字化。但是数字化只是第一步,想要获取到知识,还必须将资源进行构造化,本方案中构造化的数据采用XML来描绘,XML的标准以国际通用标准配以国内标准的扩展。例如,国际通用的DOCBOOK5.0标准,并扩展中文图书特有的一些属性,进而构成本方案的图书构造化标准。WORD构造化加工工具是基于微软Office提供的API接口开发的基于WORD的插件,安装后直接在W
7、ORD面板中出现一个新的面板,其提供的功能能够对WORD文本进行自动化及人工加工。对于方正书版文件,采用方正经典能够直接导出DOCBOOK标准的构造化资源包;对于PDF,能够通过集成业内成熟的数字加工技术来实现构造化。构造化的数据需要存储管理起来,对外提供阅读、下载、导出等服务,可以以介入重新加工的业务流程,这也是目前专业出版社内资源管理系统的常见功能。2.3知识体系构建专业领域知识体系是知识的框架,它有效揭示了知识的内在关联和组织方式。领域知识体系是知识资源构建的基础,是知识组织的核心框架,它将知识和资源通过各种方式关联在一起,构成庞大的知识网络,通过知识体系的作用实现领域内容基于知识主体的
8、内在连接、关联和关系推理,进而为使用对象提供精准的知识服务及知识延伸服务。知识体系构建4是一项基础性工作,对资源进行知识提取之前,知识体系就必须先建立起来。本系统中知识体系包含3种,包括多维度主题分类、领域主题词表以及领域本体。多维度主题分类目前已得到广泛应用,多个领域内也都有了比拟成熟的分类体系。领域主题词表是目前知识服务应用的主要知识体系,也是目前出版单位正在或者准备构建的知识体系,由于词表中的词数量诸多庞大,因此需要花费相当的人力物力来进行此项构建工作。领域本体在目前国内出版单位涉及得非常少,它是最复杂的一种知识体系,相比主题词表,它需要构建者对领域内的知识有更充分的理解,并且所需要构建
9、的内容也更为多样。从分类体系到主题词表再到领域本体,能够采取循序渐进的方式进行构建,主题词表能够基于资源管理系统的分类体系、关键词、概念等内容进行构建,而领域本体则能够基于主题词表,将其关系扩展后得到。领域本体通过提取领域内的抽象实体以及实体之间的关系而构成,能够构建丰富的概念间的语义关系,其构成的知识图谱4是计算机智能技术最主要分支之一,这也是提供语义检索、智能问答的基础3。本系统提供的领域本体构建界面如图2所示。2.4知识加工对于知识服务而言,构造化的内容资源一般不能算作是可靠的知识点。例如拆分图书得到的章节片断,其内容一般与前后章节存在上下文关联,因此不能直接作为一个独立的知识点存在,需
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 专业 出版 领域 知识 服务 系统 设计
限制150内