基于关联数据的数字图书馆移动视觉搜索框架研究-刘木林.pdf
《基于关联数据的数字图书馆移动视觉搜索框架研究-刘木林.pdf》由会员分享,可在线阅读,更多相关《基于关联数据的数字图书馆移动视觉搜索框架研究-刘木林.pdf(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、情报资料工作 2016年第4期基于关联数据的数字图书馆移动视觉搜索框架研究*刘木林朱庆华 (南京大学信息管理学院江苏 210023)赵宇翔 (南京理工大学经济管理学院 江苏 210094)摘要 文章根据软件开发领域流行的MVC架构模式, 提出了一个基于关联数据的数字图书馆移动视觉搜索框架(以下简称MVSMVC),该框架由3个模块构成:模型模块(Model)、控制器模块(Controller)和视图模块(View)。 同时指出,在数字图书馆环境下,图书情报研究者最擅长也是最关键的工作应该集中在模型模块,因此应当充分发挥其在资源建设方面的优势,建立起互联的视觉资源库,从而为用户提供更优质的搜索服务
2、。关键词 关联数据 数字图书馆 移动视觉搜索ResearchonLinkedData-basedDigitalLibraryMobileVisualSearchFrameworkLiuMulin ZhuQinghua (SchoolofInformationManagement,NanjingUniversity,Jiangsu,210023)ZhaoYuxiang (SchoolofEconomicsandManagement,NanjingUniversityofScienceandTechnology,Jiangsu,210094)Abstract InspiredbytheMVCarc
3、hitectureinsoftwaredevelopment,thispaperproposedadigitallibrarymobilevisualsearchframework(MVSMVC)basedonlinkeddata,whichconsistsofthreemodules:modelmodule(Model),controllermodule(Controller)andviewmodule(View).Inaddition,thispaperpointedoutthatLISresearchersshouldfocusonthemodelmodule,whichmeansthe
4、yshouldgivefullattentiontoitsadvantagesinresourcesconstructionandestablishalinkedvisualresourcerepositoryinordertoprovideuserswithabettersearchexperience.Keywords linkeddata,digitallibrary,mobilevisualsearch1 引言近年来, 随着移动互联网的蓬勃发展以及移动智能终端的普及,移动视觉搜索(MobileVisualSearch)这种新一代信息搜索技术快速兴起并引起了学界和业界的广泛关注。MVS的
5、兴起为解决数字图书馆资源建设、组织以及服务模式等问题提供了新的思路和契机,在数字图书馆中具有重要的潜在应用价值。尽管MVS涉及一系列关键的技术问题(见图1)1,但是本文认为,无论是描述符提取,还是对象特征的匹配、检索和排序,在商业领域已经有了相对成熟的解决方案, 同时这些技术也并不是图书情报领域学者所研究的重点。 在数字图书馆环境下, 图书情报研究者应充分发挥其在资源组织和建设方面的优势, 集中力量构建起视觉资源库,并实现资源之间的有效互联,为视觉搜索建立起高质量的视觉资源库。关联数据是语义网的关键之一, 是一种通过可链接的URI方式来发布、分享、连接互联网中各类资源的方法2,它不是一种具体的
6、技术,而是一种模式,一种数据组织和共享的框架结构3。关联数据使用资源描述框架(RDF)作为数据的模型,运用统一的资源标识符(URI)作为数据的标识,通过HTTP协议协调规范“数据”,从而实现在网络上的发布。 关联数据能够揭示数据间的相互联系, 并且提供了计算机可以理解的词义信息4。本文研究的目的正是基于关联数据构建一个数字图书馆移动视觉搜索框架MVSMVC(移动视觉搜索的*本文系国家社会科学基金重大项目“面向大数据的数字图书馆移动视觉搜索机制及应用”(编号:15ZDB126)的研究成果之一。专题研究6情报资料工作 2016年第4期MVC框架),该框架的核心是通过关联数据实现视觉资源的语义化描述
7、及全方位的数据关联, 框架包括三个模块,具有以下主要特点:(1)充分发挥数字图书馆在资源组织方面的优势, 在移动视觉搜索不断发展的大形势下实现服务模式的升级;(2)实现数字图书馆移动视觉资源(图片、视频等)的语义化描述;(3)实现不同数字图书馆之间视觉资源库的有效互联;(4)实现数字图书馆视觉资源库与外部视觉资源库 (外部互联网的资源)的有效互联;(5)通过关联数据的发布提供查询和搜索接口, 并通过视图模块帮助用户更方便地获取搜索结果的相关信息。2 相关研究综述2.1 数字图书馆移动视觉搜索本文研究涉及的第一个主题是目前数字图书馆领域的新兴主题“数字图书馆移动视觉搜索”。 Girod等5指出:
8、所谓移动视觉搜索,是指利用移动终端将真实世界中实体对象的图像或视频作为检索项, 通过移动互联网搜索视觉对象关联信息的一种交互式信息检索方式。近几年来,移动互联网的迅速发展也催生出了对移动视觉搜索的大量技术性研究工作。 Franchi等6提出 MVS是指通过移动设备的摄像头来获取物理世界物体的图像, 从而将其与数字信息产生联系的一种新技术。 Tous&Delgado7指出MVS是指通过移动手持装置所制造的图片或视频来获取信息 (视觉信息或非视觉信息)的过程。钟志鹏等8认为,MVS是通过手机拍照的方式来搜寻感兴趣物品资讯的技术, 该技术采用计算机视觉的方法对物体进行识别, 并将待识别的物体与相关的
9、虚拟数字信息关联起来, 使用户不需要输入任何关键字便能检索与之相关的信息。 林杰9 将 MVS概括为使用移动设备实现现实世界的用户与虚拟世界的图像数据之间的连接, 通过快读并有效的视觉搜索技术帮助用户从海量的数据中查询需要的信息。 移动视觉搜索已经催生出较多的商业应用案例, 主要包括两种类型的市场产品: 一种属于可穿戴设备, 比如GoogleGlass10、百度眼镜11等;另一种则是支持Android或IOS的移动应用。但是在数字图书馆领域,对于移动视觉搜索的探讨还远远不够,目前无论国内外,鲜有针对数字图书馆的移动视觉搜索研究。张兴旺、黄晓斌12提出了五点 MVS在数字图书馆中的应用展望。 此
10、外,张兴旺、李晨晖13还探讨了数字图书馆移动视觉搜索机制建设的若干关键问题,提出应从移动环境软硬件资源局限性、用户需求多样性、移动用户体验质量、互操作性、协同管理5个方面着手建设数字图书馆移动视觉搜索机制。2.2 关联数据本文研究涉及的第二个主题是语义网领域的热门话题“关联数据”。 关联数据的概念在2006年被TimBerners-Lee首次提出,随后受到了广泛的关注。而随着开放关联数据 (OpenLinkedData) 项目的不断研发,关联的开放数据越来越多,关联数据的应用领域不断扩大。一些大型机构,比如Google、路透社、美国国会图书馆、纽约时报等都参与其中。美国和英国等国家开展了政府信
11、息语义网的研究工作, 这些国家的政府都把自身的一些信息发布成关联数据。在短短几年中,不仅LOD云图中的数据集合不断增加,而且范围逐渐扩大,数据涉及的主题领域从早期的生命科学、地理数据为主发展为多媒体、文献出版物、政府信息等。由于图书馆行业信息数据的优势和知识服务的需要,2010年5月,W3C(万维网协会)宣布专门成立图书馆关联数据孵化小组, 目的是帮助图书馆构建关联数据, 从而使图书馆将各种数据 (主题标目、MARC数据等)以关联数据的形式加以发布。目前,许多国家具有影响力的图书馆已经把主题标目、规范记录、MARC数据发布为关联数据, 比如瑞典国家图书馆率先将瑞典联合目录(LIBRIS)以关联
12、数据的形式发布14。从2010年开始,国内对于关联数据的研究开始增多,这些研究工作可以归结为以下几种:关于关联数据概念和内涵阐述的研究15、关联数据研究与应用现状的介绍和综述4,16-17、关联数据相关技术研究18-20。 此外,国内的研究者也开始尝试将关联数据应用到不同领域中,并由此产生了一些实践和理论成果21-24,但是目前并没有将关联数据应用到数字图书馆移动视觉搜索中的成果。3 基于关联数据的数字图书馆移动视觉搜索框架MVSMVC本文受软件开发领域中流行的MVC架构模式的启发, 提出了一个基于关联数据的数字图书馆移动视觉搜索框架MVSMVC(见下页图2),这个框架包含三个模块:模型模块(
13、Model)是整个框架的核心和基石, 这是由数字图书馆视觉资源在经过语义化描述和关联处理后所构成的全面互联的数据集。 视图模块(View)主要负责提供用户检索的入口和检索结果的展示功能。 控制器模块(Controller)实现视图和模型的交图1 移动视觉搜索的基本流程与技术点视觉对象查询描述符提取局部对象特征匹配高匹配对象选择配对、检索、排序几何一致性检验 结果列表视觉对象知识库专题研究7情报资料工作 2016年第4期互,负责搜索特征提取、查询条件构建等工作。 与传统软件开发中的MVC框架不同,MVSMVC框架中最核心、也是最复杂的工作集中在模型模块,这是与数字图书馆的技术现状与关联数据的运用
14、紧密相关的。 在数字图书馆环境下, 图书情报领域的研究者并不擅长图像识别、特征提取等工作,其最大的优势在于资源描述和组织,而运用关联数据,数字图书馆可以做到在数据层的全面互联, 不仅能够更有效地为用户提供关联信息,还可以解放控制层的工作,让其专注于查询特征提取等工作,而这些工作在商业领域已经有了相对成熟的方案。 更为重要的是,模型层的构建和互联是商业领域已有的方案所不能代替的, 这正是图情工作者擅长的,同时也是数字图书馆在移动视觉搜索体系中所拥有的核心优势。3.1 模型模块从图2中可以看出, 模型模块在整个框架中是最基础、最复杂的模块。 在模型模块中,每一个数字图书馆都应当将其内部的视觉资源围
15、绕元数据本体进行描述,并将其转换为视觉资源关联数据,进一步实现数据之间的互联。同时,不仅单个数字图书馆内部的视觉资源形成互联, 不同数字图书馆之间的视觉资源也必须形成关联。而为了真正达到关联数据的标准,还应当逐步和互联网上的外部资源实现互联, 这样才能真正形成一个全方位的数据集。视觉资源元数据本体的构建是模型模块的基础:元数据在网络信息资源组织中发挥着重要的作用25,它最基本的功能就在于对信息对象的内容和位置进行描述,从而为信息对象的存取与利用奠定必要的基础。 视觉资源总体上来讲包括两大类:静态视觉资源即普通静态图像,动态视觉资源即视频或者动图,视觉资源元数据的特点归根结底在于其与普通文本资源
16、相比所具有的独特的内容特征。 图书馆联盟(DigitalLibraryFeder-ation, DLF) 使用面向对象的方法对数字对象进行分析, 并且将数字图像的元数据分为三类:描述性元数据(DescriptiveMetadata)、结构性元数据(StructuralMetadata)、管理性元数据(AdministrativeMetadata)26。 其中描述性元数据用于发现、识别和定位数字图像,结构性元数据定义对象的内部组织以及如何链接和显示该对象。管理性元数据包括数字图像的产生信息(如扫描日期)、识别信息(文件名、存储和传递格式、压缩方案等)、版权信息等。对于数字图书馆而言,构建一个视觉
17、资源关联数据集可以分为以下几个步骤(见图3):图3 数字图书馆构建视觉资源关联数据集流程(1)资源发现。每一个数字图书馆中都有一定量的视觉资源, 但是移动视觉搜索对于数字图书馆而言也是一个新兴的领域, 因此数字图书馆仍然需要根据自身的资源情况,对内部的资源进行再发现,除了已经符合视觉资源格式要求的资源之外, 还有必要通过再处理(拍照、扫描等技术)技术丰富和扩展自身的视觉资源库。(2)确定URI标识方案。关联数据要求使用通用资源标志符(UniversalResourceIdentifier,URI)作为 Web上任何事物或资源的标识名称, 因此确定好URI表示方案是进行RDF描述和关联的第一步。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 关联 数据 数字图书馆 移动 视觉 搜索 框架 研究 刘木林
限制150内