2022年知网学习阶段总结--高梦娇资料 .pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《2022年知网学习阶段总结--高梦娇资料 .pdf》由会员分享,可在线阅读,更多相关《2022年知网学习阶段总结--高梦娇资料 .pdf(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、这段时间主要做的是对知网(Hownet )的全面了解,以及对本体建设工具prot g的简单应用。通过对知网和WordNet 的了解,我发现知网和WordNet 的建设方式是截然不同的。知网对每个概念的定义是通过这个概念使用时的具体的语义环境来加以限制的。通过限制概念使用时所需要的其他语义来定义每个概念。而WordNet 则是通过对词语的解释,以及概念的上下位关系,同义反义关系等关系来定义每个词语。学会使用prot g,可以用他来建设自己的词汇本体的时候,我觉得可以结合知网和WordNet ,对每个概念的定义中,既要体现它的各种关系词, 同时还要用每个概念使用时的具体的语义环境对概念加以限定。下
2、一步的任务就是进一步学习prot g,掌握它的具体功能,争取尽快建立一种新的结合了知网思想和 WordNet 思想的词汇本体。主要参考资料是知网中文版官方网站http:/ 知网简介, 知网的理论发现 , KDML-知网知识系统描述语言, 建设中文词汇语义资源中的一些问题和我们的对策, 一个基于概念的中文文本分类模型,基于知网的词汇语义相似度计算, WordNet 与 hownet 之关系比较等。下面是我对知网和prot g应用的具体总结。一对知网的全面了解的总结1.关于知网的基本介绍知网是一种词汇本体。知网(英文名称为Hownet )是一个以汉语和英语的词语所代表的概念为描述对象, 以揭示概念
3、与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库。义原是知网的最基本的构成单位,同时也是知网中不能分割的最小单位。知网知识描述语言(KDML)是用来描述知网系统中所有概念的特定语言。知网中每一个概念都是通过KDML,利用义原进行逐一的、孤立的定义的。例如:以概念“打”的定义为例:W_C=打/ 中文词语G_C=V / 中文词语词性E_C= 酱油, 张票, 饭,去 瓶酒,醋 来了/ 中文词语例子W_E=buy / 英文词语G_E=V / 英文词语词性E_E= / 英文词语例子DEF=buy|买/ 概念定义2.知网义原的选取首先,知网中义原的选择和取舍是基于主观选择的。义原是从4000
4、 个汉字的义项(一个词往往具有几个意义,每一个意义就是一个义项)中抽取,经过人工的观察,挑选,合并同类项最终得到的。知网中的义原一共有2199 个。选取出来的义原又被分为实体类(如“human| 人” ) ,事件类(如“ lose|失去” ) ,属性类(如“form| 形状” ) ,属性值类(如“fragrant| 香” ) 。这部分知识可以通过知网简介和知网的理论发现进行进一步了解。3.知网知识描述语言(KDML)KDML 语言规则中详细规定了事件类、实体类、属性类、属性值类概念的描述方法,同时还规定了几种特定的标识符(如“,” “; ” “=” ) 、几种特殊的指示符号(如“ ” “?”
5、“$” )和各种动态角色(如“agent” “host of” )的使用方法。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 7 页 - - - - - - - - - 以概念“被告人”的定义为例:W_C=被告人G_C=N W_E=accused G_E=N DEF=human| 人:accuse|控告 :patient=,domain=police|警 在这个概念的定义中,human| 人、 accuse|控告和police| 警都是知网系统中的义原。 Patient、
6、 domain 则是知网系统中的语义关系。第一个“:”后面的内容是对human| 人的具体解释。被告人是被控告的人,即 accuse|控告的 patient (被动者)。 同时被告人是由警察押送的,因此他的 domain(施动者)是police| 警。具体参见 KDML-知网知识系统描述语言。4.知网的最新进展知网从 2000 年开始创立到现在,经过了两次大的改版,现在已经作为中文信息处理搭建和研发的基础平台。现在最显著的就是基于知网研发的概念相似度计算软件和概念相关场计算软件。5.知网的应用方法举例(1)概念相似度的计算。(2)中文文本的分类在 基于知网的词汇语义相似度计算,一个基于概念的中
7、文文本分类模型这两篇文章中详细的讲述了这两种应用算法。6.知网的接口知网发行 2000 版的时候,接口是开放的。但是现在发展到2008 版,知网的接 口 应 用 部 分 需 要 购 买 才 能 使 用 了 , 大 约 要 花 费 几 万 块 。 具 体 参 见http:/ WordNet 的关系总的来说, WordNet 在一开始对概念定义的时候就采用了网状结构,对每个概念的定义中都同时标注了他的上下位关系词,同义词,反义词等。而hownet对概念的定义则是完全孤立的,单纯的从概念的应用方法角度进行定义。例如知网中对“Singer| 歌手”的定义是:DEF=human|人: domain=en
8、tertainment|艺, sing|唱: agent= 即歌手是属于艺术界的,唱的施事者。而 WordNet 中对“ Singer”的定义为:(1) singer, vocalist, vocalizer, vocaliser - (a person who sings) 在对 Singer的定义中同时说明了他的同义词有vocalist, vocalizer 和 vocaliser。另外, WordNet 中还可以通过选择查看他的上下位关系词,而hownet 则不提供这个功能。WordNet 可以被认为是一种现象,这种现象表现了各个词汇所表达的概念之间的语义关系, 而这种语义关系可以通过H
9、owNet 中有关义原的关系得到解释。换一种说法, WordNet 中所描写的各种语义关系能够通过HowNet 中的义原得到验证、推导。二对 Prot g的初步熟悉和简单使用1.Prot g的基本介绍名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 7 页 - - - - - - - - - Prot g 是由斯坦福大学的Stanford Medical Informatics 开发的一个开放源码的本体编辑器 , 它是用 Java 编写的。 Prot g 界面风格与普通Wi
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年知网学习阶段总结-高梦娇资料 2022 知网 学习 阶段 总结 高梦娇 资料
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内