知识图谱的数据来源、挖掘及更新维护,搜索引擎论文.docx
《知识图谱的数据来源、挖掘及更新维护,搜索引擎论文.docx》由会员分享,可在线阅读,更多相关《知识图谱的数据来源、挖掘及更新维护,搜索引擎论文.docx(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、知识图谱的数据来源、挖掘及更新维护,搜索引擎论文2001 年维基媒体基金开创建立了维基百科,访问量排名世界第六,2020 年 12 月到 2020 年 12 月期间,它损伤了近 10%即20 亿的页面访问量,华而不实英文版、德语版和日语版的阅读量分别下降了 12%、17%和 9%.固然维基百科的管理员以为这华而不实可能存在统计错误,但是其他专家以为是去年 Google推出的知识图谱功能导致了维基百科访问量下降。假如问题能在搜索页解决,那么就没必要去维基百科查找了。随着近两年,Linking Open Data 等项目的全面展开,数量激增的语义 Web 数据源,大量 RDF 数据发布,互联网从仅
2、包含网页和网页之间超链接的文档万维网转变成包含大量描绘叙述各种实体和实体之间丰富关系的数据万维网。谷歌、百度、搜狗搜索引擎公司以此为基础构建知识图谱,改良搜索质量,语义搜索的序幕就此拉开。什么是知识图谱? 知识图谱的表示在搜索中的展现形式,知识图谱怎样构建,怎样在搜索中应用?知识图谱是谷歌在 2018 年收购的开放式数据库公司Metaweb 率先提出来的。知识图谱也被称为科学知识图谱,它是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方式方法与计量学引文分析、共现分析等方式方法结合,并利用可视化的图谱形象地展示学科的核心构造、发展历史、前沿领域以及整体知识架构到达多学科融合目的
3、的当代理论。知识图谱把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制展示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。搜索引擎中的知识图谱技术是以知识卡片 KnowledgeCard 的形式展现出来的。在搜索本文本文关键词语语时,知识卡片会为用户提供更多与本文本文关键词语语相关的构造化内容信息,也就是讲能够将搜索结果进行知识系统化,任何一个本文本文关键词语语都能获得完好的知识体系。比方搜索 帕金森综合症 是一种什么病,传统的搜索结果里面会有一些诸如 XX 近期得了帕金森综合症 的新闻,或者是网友发帖提问 帕金森综合症到底是什么 帖子,又或者是一些治疗帕金森医院
4、的信息或广告,其实你逐一阅读这些网站对了解这个疾病帮助不大,这就大大降低了你获得知识的效率。知识图谱技术应用到搜索引擎中后,当搜索 帕金森综合症 后,点击下方出现的知识图谱,图谱上面会呈现有关 帕金森综合症 的权威信息,例如 帕金森综合症 的异常感觉和状态、易感人群、治疗方式方法,这就保证了获得知识的效率。固然各大搜索引擎在知识卡片的排版和内容展现上略有不同,但都能罗列出 帕金森综合症 的定义、疾病介绍、诊断重点、异常感觉和状态表现等。除此之外,各大搜索引擎还将搜索关键字其他用户还搜索了什么或其他与搜索关键字相关的信息展现出来,这样用户就能够方便快速的查询到自个想要了解的信息。各搜索引擎在其知
5、识卡片中展示相关图片,还展示了搜索本文本文关键词语语特有的专题搜索,百科、新闻、图片、贴吧、视频等,基本包容了用户基本需求。有的搜索引擎还会罗列出其他可能相关的查询目的对象。一、知识图谱的构建韩剧(来自星星的你日前火遍整个网络,该剧相关本文本文关键词语语一度雄霸各大搜索榜、话题榜。用百度搜索 都教授 ,在搜索结果页面的右侧会出现金秀贤、都敏俊、全智贤,甚至李敏镐等相关度极高的搜索对象。这就是知识图谱技术应用到搜索引擎预知判定用户最有可能的信息需求。简单来讲,知识图谱技术就是一个不断完善计算机知识库的经过,进而帮助计算机能够理解人类的语言沟通形式。当下,知识图谱技术主要在百度搜索页面的右侧有所具
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文化交流
限制150内