试析基于关键词集合的知识关联网络构建.docx
试析基于关键词集合的知识关联网络构建试析基于关键词集合的知识关联网络构建论文关键词:知识关联知识地图关键词集合知识管理系统(KMS)论文摘要:建立符合逻辑的知识关联体系是知识地图理论的重要内容之一本文对知识管理系统中知识关联的有向性进行分析,叙述了单向知识关联和双向知识关联的概念与特点;对关键词集合进行定义,阐述了单关键词集合、全关键词集合和不定关键词集合三种划分策略,介绍了以关键词集合为迭代单元构建关联网络和针对单个知识点构建关联网络的两种算法,并指出了算法在实际应用中需注意的问题.当前,知识地图的理论研究有很大进展,但在知识管理系统(KMS)领域的实际应用成果却比拟有限.尽管有KMS产品应用了知识地图理念,但多数产品仅在页面上显示了知识库的分类体系与链接,缺乏对知识间逻辑关系的进一步刻画与展示。.建立符合逻辑的知识关联体系是知识地图的重要理论之一知识分类体系是施行知识管理的基础性工作,现实世界中的事物间联络并不是仅用树型分类体系就能够表述的一个事物有可能同时附属于多个分类,不同类别的事物也有可能发生联络,仅仅依靠分类很难准确、全面地表达知识间的逻辑关系.知识关联则提供了更灵敏、更广义的知识关系表示方法,采用跨分类、跨区域的知识关联能够较好地表达信息之间的逻辑联络本文根据集合论与图论的基本原理,对知识关联的有向性和关键词集合进行了讨论,并阐述了根据关键词集合在KMS中建立知识关联网络的原理与算法.1知识关联的有向性1.1单向知识关联现实世界中的各类事物存在着纷繁复杂的关系,这种关联关系是有方向的.如图1所示,水和分子关联的语义能够描绘为水由分子组成.相应地,由分子到水关联的语义能够描绘为分子构成了水.这两种关联关系是不同的,是两个单方向的知识关联.在知识关联网络中,我们可假设各知识点分别为k,、k2、k3、k4对于知识点k1,假如有知识点k2、k3、凡与其内容有较高相关度,此时可通过KMS的功能将k2、k3、k;与k,关联,将关联链接插人在k,的知识内容之后.这个关联征进行自动关联.采用单向知识关联的KMS的特点是:假如知识点k,有到知识点k:的关联链接,但知识点k:未必有到知识点k,的关联链接,则系统须对每一个关联关系的含义作出必要的表述.1.2双向知识关联根据常识,若知识点k,与k:有关系,则k2也与k,有关系.双向知识关联是在不考虑关联语义的情况下发生的,例如知识点k,与知识点k2关联,则知识点k:也必然与知识点k,关联.设R,RZ为定义在知识集合上的二元关系,则双向知识关联用符号可描绘为:k,R,k2,kZRZk,.在很多情况下,由于语义不同,R,RZ.当R:二R:时,则k:和k:的关联关系是对称的.采用双向知识关联的KMS的特点是:只要知识点k,有知识点k:的关联链接,知识点k:也必然具有与知识点k,的关联链接.系统在设置关联链接时不考虑关联的语义.语义分析是计算机研究的难点,目前还没有KMS能够自动准确地识别知识的关联语义.因而,在知识关联络统中适宜采用忽略关联语义的双向关联方式.2基于关键词集合的知识关联网络绘制算法2.1算法原理在目前的技术条件下,基于语义分析构建知识关联网络较为困难.利用知识点关键词集合建立关联网络的准确度不如语义关联网络,但技术上现实可行,能够较好地表达知识间的关系.基于关键词集合构建关联网络所遵循的原理是:设n个知识点具有共同的关键词集合S,则这n个知识点均是相互关联的;将各知识点作为点,关联关系作为有向边,能够绘制基于关键词集合S的有向完全图G;将KMS中的关键词按特定策略划分为集合,并综合各关键词集合,根据算法画出有向完全图,能够得到该关键词集合划分策略下的完好知识关联网络.2.2健词集合及其划分策略关键词是用户在编辑知识时为每个知识点设置的,一般用于知识检索,本文则关注应用关键词集合构建知识关联网络的思想与算法.关键词集合指包含了1个或多个关键词的集合.关键词集合所包含的关键词内容与数量怎样设置,取决于知识关联所遵循的关键词集合划分策略.本文涉及的三种划分策略分别是单关键词集合策略、全关健词集合策略和不定关键词集合策略.在单关键词集合策略下,每个关键词集合S只拥有一个关键词w;,该集合S对应知识点集合戊k,k2,-.,k,,这些知识点均含有关键词,、.设知识点k,具有关键词、,二r,基于此策略设置知识关联时,k,会把与关键词集合S,SZ,.,5:匹配的知识点集合K,K中的全部知识点链接进来,并剔除其中的重复部分.如图2所示,6个含有关键词学生的知识点以单关键词集合学生为制图策略构成了有向完全图,也就是这6个知识点基于学生关键词的知识关联网络.在全关键词集合策略下,全关键词集合s;包含了知识点k:所具有的所有关键词,k:只把与全关键词集合S;wl,叨2,r匹配的知识点集合K;中的知识链接进来.使用该策略获取的知识结果的相关度比使用单关键词策略要高.在不定关键词集合策略下,需人工确定关键词集合中所包含的关键词,此方式无法实现全自动知识关联,不合适在大型知识库系统中采用.由全关键词策略或不定关键词策略获得的结果集是单关键词集合策略结果集的子集,获得的知识关联网络图是基于单关键词集合策略获得的知识网络图的子图.在实际应用中,宜采用全关键词集合策略与单关键词集合策略相结合的方式,在知识点关联展示的时候分两组按不同的优先级展示.首先展示优先级最高的按全关键词集合策略得出的关联知识点集合,该集合中的知识与当前知识点的相关度最高;其次才展示单关键词集合策略得出的结果集.本文讨论的算法均基于这两种策略相结合的方式.2.3以关键词集合为迭代单元的关联网络算法计算知识关联网络能够用关键词集合作为迭代单元循环进行或者仅针对单个知识点进行.这两种方式在KMS中各有优势,分别合适不同的场景在为数量较多的知识点构建关联网络时,首选以关键词集合为迭代单元进行计算,算法描绘如下.1设需要计算关联网络的知识范围中有P个知识点k,k2,kP,任意知识点气均对应一个点v;,把所有的点绘制在图V,E与k逐一对应.2)分拣出KMS中所有种类的关键词ww2.wn,记录KMS中所有关键词集合的信息获得关键词集合S,52,.Sn.S9(包含所有的单关键词集合与全关键词集合),同时获得与任意关键词集合S.相匹配的知识点集合K;.3)逐个扫描关键词集合S,52,59,优先扫描其中的全关键词集合(这样能够确保每条知识后的关联信息优先展示关键字相关度最高的链接),记录当前关键词集合S,所对应的知识点集合Kl,记录知识点集合K中所包含的每个知识点元素k;,在图中与K对应的点集合的所有元素间作有向完全子图,在画边e;、eji时,在系统内知识点k、后加人知识点匆的链接,在知识点k;后加人k的链接假如边已存在,则跳过,每画一条边,计数器c累加1.扫描完K9后,循环结束.4)程序绘制的图V,E就是P个知识点根据关键词集合SS2,S。构建的知识关联网络图,。是知识关联网络所具有的知识关联数量.该算法的复杂度是。(n2).如图3所示,在一个具有7个知识点的示例系统中,算法先根据单关键字集合S,经济学进行绘图,其次根据单关键字集合管理学进行绘图.管理经济学知识点由于同时具有管理学、经济学两个关键词,因而同时处于左、右两个有向完全子图中.图3就是这7个知识点根据2个单关键字集合所绘制的知识关联网络.2.4针对单个知识点的关联网络算法对于任意一个知识点k;设该矢识点拥有个关键词,首先扫描全关键词集合Sr十,w,w2,、:,再逐个扫描关键词二:所对应的关键词集合S,在每一轮扫描中将当前集合所对应的知识点集合凡,内所有的知识点元素记录在缓存中,扫描到任意知识点乓时,程序绘制两条有向边人知识点的关联,在知识点气后参加的关联假如边ei、ei;已存在或i=J,则跳过,每画一条边,计数器。累加,直到有向完全图绘制完成.程序绘制的图就是知识点的相关知识点关联图。是与该知识点相关的所有知识关联数量.该算法的复杂度是口(矿).该算法循环应用在所有知识点上同样可以以得到算法2.3绘制的整体知识地图,但算法复杂度到达0(矿),因而在为多个知识点建立关联或绘制地图时宜采用2.3节的算法.2.4节的算法则适宜针对个别知识点绘制关联网络并建立知识链接时采用.3实际应用中需注意的问题企业级KMS中知识点数量可能到达1万以上,在应用关键词集合绘制知识关联网络时必须设置范围与条件,一般只分层次、分区域根据相应使用人员群体的权限选择部分知识点进行关联网络绘制.其次,必须严格准确地设定关键词,管理维护关键词,建立系统关键词管理维护机制,同时应制定关键词编辑规范并开发检验程序,限制每个知识点的关键词字数、关键词个数,并提供系统级视图监控系统关键词的使用与分布状况.在KMS中,应采用关联网络、分类体系、搜索引擎共同协作的方式构建完善的知识地图,这样有助于建立真正意义上的实用知识地图,使知识查阅检索愈加方便、快速、准确.