基于保守扩充理论的模块化本体重用-李璞.pdf





《基于保守扩充理论的模块化本体重用-李璞.pdf》由会员分享,可在线阅读,更多相关《基于保守扩充理论的模块化本体重用-李璞.pdf(19页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、软件学报ISSN 10009825,CODEN RUXUEWJournalofSoftware,2016,27(11):2777-2795【doi:10133280cnkijos004920】中国科学院软件研究所版权所有基于保守扩充理论的模块化本体重用幸李璞1,2蒋运承1,王驹3(华南师范大学计算机学院,广东广州510631)2f郑州轻工业学院软件学院,河南郑州450000)3(广西师范大学计算机科学与信息工程学院,广西桂林541004)通讯作者:李璞,Email:superlipu163com,http:wwwSCInUeducnE-mail:josiscasaccahttp:wwwjoso
2、rgcnTel:+86-10-62562563摘要:分析了本体重用的研究现状和目前重用方法只适用于单个独立本体的不足,pXe-Connections语言构建的模块化本体库为研究对象,基于保守扩充理论提出了本体模块知识完整性概念,并证明了知识完整性的相关性质在此基础上,给出了一种针对模块化本体库的保守扩充重用算法ERMMO(extracting reused modules from modularontologies)耐论了该算法的两种子算法EMMO和EMO的特点及适用条件分析并验证了ERMMO算法的可行性扫正确性ERMMO算法是当前保守扩充重用算法的一般化扩充,对模块化思想应用于本体重用问题
3、有所启示关键词: 本体重用:保守扩充;模块4匕;e-Connections理论中图法分类号:TPl82中文引用格式:李璞,蒋运承,王驹基于保守扩充理论的模块化本体重用软件学报201627(11):27772795http:wwwjosorgearl 000-982514920htm英文引用格式:Li P,Jiang YC,Wang JModular ontology reuse based on conservative extension theoryRuan Jian Xue BaoJournal of Software,2016,27(1 1):2777-2795(in Chinese)
4、http:wwwjosorgen1000-98254920htmModular Ontology Reuse Based on Conservative Extension TheoryLI Pul,一,JIANG YtmChen91,WANG Ju31(School ofComputer Science,South ChinaNormal University,Gunngzhou 510631。China)2(Software Engineering College,Zhengzhou University of Light Industry,Zhengzhou 450000,China)3
5、(College of Computer Science and Information Engineering,Guangxi Normal University,Guilin 541004,China)Abstract:In this paper,the current research progresses of ontology reuse is reviewed and the issue that current ontology reusealgorithms can merely be applied to a single independent ontology is ad
6、dressedFocusing on the modular ontologies with e-Connectionslanguage,the IKMo(integrity of knowledge about the module in an ontology)is presented based on the theory of conservative extensionThe related properties of IKMo are provedFurther,all algorithm for the ontology reuse with the conservative e
7、xtension ERMMO(extracting reused modules from modular ontologies)is providedThe features and conditions of two sub-algorithms of ERMMO arediscussedLastly,the feasibility and soun血ess of ERMMO are analyzed and verifiedERMMO is a generalization of the current reusealgorithms based on conservative exte
8、nsion theory,and can be served 8s the guidelines for reuse ofmodular ontologiesKey words:ontology reuse;conservative extension;moduladzation;g-Connections theory本体模块化构建和本体重用的研究工作借鉴了当前软件工程中的成功经验【11本体模块化是解决本体异基金项目:国家自然科学基金(61272066);教育部新世纪优秀人才支持计划(NCET-120644);广州市科技计划(2014J4100031,201604010098);广西可信软件
9、重点实验室(桂林电子科技大学)研究课题(KX201419)Foundation item:National Natural Science Foundation of China(61272066);program for New Century Excellent Talents inUniversity of Ministry of Education of China(NCET-120644);Program for Science and Technology of Guangzhou(2014J4100031,201604010098);Project for Guangxi Key
10、 Laboratory ofTrusted Software(Guilin University ofElectronic Technology)(KX201419)收稿时间:2015-0429;修改时间:20150824;采用时间:2015-09-15万方数据2778 Journal of Software软件学报V0127,No11,November 2016构问题的一个重要方法【2】当前,大部分对本体的研究和构建工作都是针对特定的项目需求或研究目的而展开的在构建过程中,本体中的知识往往涉及到多个领域,从而可能将多个领域中的概念和关系引入到待开发的本体中,形成一个规模很大的混合本体但这种大
11、而全的本体不利于维护、推理和重用,不能很好地发挥本体自身的共享优势为了解决上述问题,人们将软件工程中的模块化思想应用到本体构建当中,提出了模块化本体f也称为模块化本体库)的概念1】6-Connections3,4】理论是本体模块化构建的一种方法,其主要思想是通过连接关系(1inkproperty)将多个互不相交的逻辑解释域相连,是由传统描述逻辑的并集再加上与连接关系相关的构造因子构成的【引,能够使用Tableaux算法对本体库进行推理本体重用是软件工程思想在本体工程中的又一种体现,其目的是为了满足本体共享的需要【51根据当前本体构建的需求,应用本体重用技术,可将已有本体中的部分或全部知识引入到
12、当前正在构建的本体当中重用技术避免了开发人员自身的知识局限性和重复开发带来的额外开销,减少了本体中知识推理的错误和资源浪费,是目前本体研究的热点之一【5】针对本体重用,近些年人们做了大量的研究,大致上可以分为结构化和逻辑化两种思想结构化方法并没有考虑知识间的语义关系,不能保证重用知识的安全性【51为此,人们从知识间语义的逻辑关系出发,提出了一些新的思路其中最有代表性的就是保守扩充(conservative extension)理论【6,71,该理论是为了保证安全地重用其他本体中的知识而提出的,使得在引入新的知识后,本体中不会产生不可预期的语义【61随后,保守扩充理论又被引入到XML等更为广泛的
13、领域【s,9】然而,对本体模块化构建和本体重用的研究还是相对独立的目前,本体重用的理论和方法都是以一个独立本体为重用对象,没有与本体的模块化构建相结合,从而无法很好地体现出软件工程理论中模块化和共享的特点和优势因此,从一个模块化的本体库中抽取重用模块是一个亟待解决的问题基于上述问题,本文根据保守扩充理论,以应用6-Connections方法构建的模块化本体库为研究对象,对如何从一个模块化本体库中抽取重用模块进行了研究,提出了本体模块知识完整性的概念,并对相关的性质进行了证明在此基础上,给出了一种更加一般化的本体重用算法-ERMMO(extractingreused modules from m
14、odularontologies)该算法根据重用符号集墨将存在于本体库多个模块中的相关知识抽取出来,并按照保守扩充理论对这些知识进行筛选和重组,从而得到一个关于S的重用模块此外,还对ERMMO算法的两种子算法(EMMO限和EMOIK)的特点及适用条件进行了分析最后对算法的可行性和正确性进行了验证1模块化本体库和本体重用11模块化本体库目前,对本体模块化的研究虽然已经有了一定的进展,提出了几种模块化思想和语言,但由于各中方法具有不同的特点和优势,所以并没有形成一种统一规范的理论框架表1列举了目前几种模块化语言和各自的特点对于各种语言的具体思想和理论,可参见相关文献Table 1 Comparis
15、on of modular ontology languages表1本体模块化语言的比较模块化语言 特点 不足分布式描述逻辑DDLs 实现了不同模块间概念的直接引用,要求本体 仅允许一种类型的域关系,不支持模(distributed description logics)【10】 模块互不相交 块间角色的通信,表达能力十分有限定义了描述本体间关系的桥规则和描述这些COWL“】 没有推理支持桥规则的语法,具有较强的语义表达能力是一种框架逻辑,通过连接关系相互关联,每6-ConnectionS3,41 不允许模块间的概念进行直接引用个连接的逻辑解释域互不相交PDL 既允许模块间概念直接引用,又提供
16、模块间的 仍处于在理论研究阶段,没有成熟的(packagebased description logics)【12】 关系联接,放开了对模块间的严格不相交性 工具实现分布式动态描述逻辑D3L 是DDL的扩展,引入了“动态”的概念,可以为 仍处于在理论研究阶段,没有成熟的(distributed dynamic description logic)1如 语义Web提供更为合理的逻辑基础 工具实现万方数据李璞等:基于保守扩充理论的模块化本体重用 2779从表l不难看出,目前的本体模块化研究还不十分成熟为了满足研究的需要,我们选择c-Connections作为模块化语言首先,e-Connection
17、s有一个相对成熟的开发平台Swoop【141,且支持表达能力较强的描述逻辑的Tableaux推理;此外,虽然6-Connections要求本体模块互不相交,且不允许模块间的概念进行直接引用,但是模块间的概念可以通过连接关系进行引用【4】这种限制更加符合模块化本体强内聚、松耦合的特点6-Connections的最大特点就是定义了连接关系该连接是定义在其定义域所在的本体模块中,并由定义域模块指向值域模块的二元关系定义域模块中的概念可以通过连接关系引用值域模块中的概念,如图l所示有关c-Connections的相关理论和内容可以参见文献3,4连接关系且由模块D指向D2模块D,中的概念C通过连接关系R
18、引用D2中的概念DFig1 Structure of e-Connections图l e-Connections的结构由图l可以看出,应用e-Connections构建的模块化本体库中的各个本体模块都具有相对的独立性,每个模块可以看作是一个规模较小的领域本体但是它与当前普遍应用的独立本体又有本质不同,各个模块并非绝对独立于其他模块,而是通过少数连接关系相互关联因此从重用的角度来看,当前应用于独立本体的重用算法显然不适用于这样的模块化本体库这也正是本文研究的出发点在之前的工作中,已经对e-Connections构建模块化本体库的方法以及推理规则进行了研究在实验中,针对具体的旅游领域,应用e-Co
19、nnections理论构建了一个模块化本体库,并对构建和推理的复杂度与传统方法进行了比较和分析具体研究内容可参见文献15】12本体重用最早的重用思想是比较简单的直接导入,即OWL提供的import功制51其思路是将一个本体爿完全导入到另一个本体B中但这种方法存在很多缺陷:一方面会造成冗余信息的增加,因为B可能只需要彳中的部分而不是全部的知识;另一方面,这种简单的导入可能会产生一些新的语义,导致重用后本体中的知识推理结果与原来本体不一致,从而造成推理错误【6】为弥补上面的两个缺陷,人们提出了一些更加科学的重用方法目前,对本体重用的研究主要分为两种思路:(11结构化方法a) Noy等人在2003年
20、提出一种本体重用的算测16】,该算法只是从知识的结构上考虑与符号集s的关系,实际上不一定所有包含重用符号的知识都与重用有关所以,这种方法虽然简单易行,但不能保证重用模块中只包含相关的知识(即可能含有冗余知识)b) Seidenberg等人在2006年提出了一种应用于医学本体GALEN的重用算法【1 71由于该算法是针对具体本体设计的,所以并不是一种通用的方法此外,该方法只考虑TBox中的概念和关系,并没有对ABox中的断言进行判断(2)基于逻辑的方法a) Grau等人在2008年提出了一种基于保守扩充理论的重用算法【18-201,该算法虽然可以保证重用模块的封闭性(即重用模块中包含了所有需要重
21、用的知识)及安全性(即重用后的本体不会由于导入了重万方数据2780 Journal of Software软件学报V0127,No11,November 2016用模块而产生新的语义),解决了结构化方法只考虑不同知识语法间的关系而不考虑知识内部语义间关系的缺点,但是它针对的重用对象只是一个独立本体(即从一个单个本体中抽取重用模块)b) Kontehakov,Lutz和Shen等人分别在2009年、2010年和2014年针对保守扩充理论的不可分离性(inseparability)和复杂性(complexity)进行了研究,并提出了一些新的重用模块抽取算法【21_241这些算法其实是对上面保守扩充
22、算法的一种改进,在保证重用模块安全性的基础上能够得到最小的重用模块(即模块中包含的相关概念和公式最少)但这几种算法只是基于复杂度较低的描述逻辑所构建的本体,并不支持表达能力更强的描述逻辑13保守扩充理论基础保守扩充理论最早由Ghilardi等人在2006年提出【6】由Grau等人于2008年应用于从单个本体中抽取重用模块的算法中【201。限于篇幅,这里只介绍该算法涉及的相关概念和整体思路,具体的算法可以参见文献20】,本体重用的目的是,将已有本体的部分或是全部知识引入到待开发的本体中【5】保守扩充思想就是要在引入新知识的同时,保证引入后得到的新本体并没有因为引入重用模块而使得被重用知识产生不可
23、预期的新结论和不一致性【6】下面给出一个简单的例子例1:设有本体01=印l-B1几C142E_B117c2寥l-D rq(3R1句),D2=c2=-Cl,ifl-3R2蹦2=-VR3G)01为了重用02中的概念41和彳2,将伤导入,得到0=0lu02于是,在D中有下面的推理:因为爿1m_Bl几C12E占1I-1 C2,c2ECl,所以有D一2E彳1但在初始情况下,0l乒彳2E_Al,且021A2m_A1从上面例子中的推理不难看出42E爿l并不是开发人员所预期到的结论,而是在当OI重用D2后自动产生的这种不可预期的结论会给原有本体带来新的语义,甚至会产生矛盾保守扩充理论的提出很好地解决了这类问题
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 保守 扩充 理论 模块化 本体 重用 李璞

限制150内