2023年信息检索知识点归纳总结.pdf
《2023年信息检索知识点归纳总结.pdf》由会员分享,可在线阅读,更多相关《2023年信息检索知识点归纳总结.pdf(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、信息检索考点整理 1.信息检索的概念 广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。2.信息检索的原理 就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。3.为什么说信息存储和检索是两个不可分割的有机体?检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。存储过程主要是利用检索语言对文献进
2、行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。检索过程是存储过程的逆过程。因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。4.信息检索的方法(1)顺查法(2)倒查法(3)抽查法(4)追溯法(5)循环法 5.信息检索的途径(1)内部特征途径 a)分类途径 b)主题途径(2)外部特征途径 a)题名途径 b)著者途径 c)文献编号途径 d)目录检索途径 e)机构检索法 f)引文检索途径
3、 6.布尔模型的优缺点 优点:(1)简单,形式简洁,易于理解;(2)可操作性强,应用广泛;(3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4)能处理结构化提问。缺点:(1)表达用户复杂需求效果欠佳 (2)准确匹配无法提供定量比较 (3)匹配标准不尽合理 (4)检索结果不易控制 7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。8.什么是计算机信息检索?所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动
4、输出用户所需的那部分信息的过程。实质上计算机信息系检索是利用计算机信息检索系统存储和查找信息的技术,是计算机硬件资源、系统软件、检索软件和数据库的综合。9.计算机信息检索的类型:(1)根据检索系统的工作方式,可分为:a).脱机信息检索 脱机信息检索是利用单台计算机的输入装置进行检索的系统,用磁带作为存储介质,并且为连续的顺序检索方式,适合大批量的定题信息检索。b).联机信息检索 联机信息检索是利用计算机终端设备,通过通信线路或网络,与世界上的信息检索系统相连,从信息检索系统的数据库中进行检索并获取信息的过程。联机检索模式是主从式,即为所有的工作都在主机上进行,主机负担重,一旦主机瘫痪,整个系统
5、都将处于瘫痪状态,因此对主机的性能要求极高。c).光盘信息检索 d).网络信息检索(2)根据信息的服务方式,可分为:a).定题检索 定题检索是用户根据课题的要求,事先编写出逻辑检索提问式,并将存储在计算机的存储器中,每次系统加入新的信息,系统便会按检索要求,找出用户所需的资料,并把结果分给用户,用户能及时得到最新的文献信息。具有定期性、新颖性和批处理性的特点。b).回溯检索 回溯检索是追溯查找过去的信息,让用户一次检索一段时间内与某一课题有关的信息。也可以查找最新的信息,可以适应多数用户的查询需要。c).日常检索 10.计算机信息检索技术初级检索 6 个 1)布尔逻辑检索 2)位置限制检索 3
6、)短语检索 4)截词检索 5)字段限制检索 6)区分大小写检索 11.计算机信息检索技术高级检索 6 个 1)加权检索 2)自然语言检索 3)相关信息反馈(相似检索)4)概念检索 5)模糊检索 6)聚类检索 布尔逻辑检索(1)逻辑与 用 AND 或*表示 检索式写作 A AND B 或 A*B(2)逻辑或 用“OR”或“+”表示(3)逻辑非 用 NOT 或 表示 A NOT B(A 当中除去 B 所剩下的)字段名称及缩写 AB abstract TI title AU author JN journal name LA language PY publication year SP sourc
7、e publication 分类和聚类的异同 相同点:基于“类”的思想进行检索。不同点:(1)分类基于分类法,其类目体系主要是先组式,有系统性的。类目与文献之间具有相对独立性。而聚类则先有文献后聚类,类的性质及整体类目体系完全由系统中的文献决定。(2)从类目形成过程看,分类是总到分,聚类由分到总。会构建检索式(主要是积木型)12.计算机信息检索策略含义 狭义的计算机信息检索策略是指检索提问式的构建,即运用系统特定的检索技术,确定检索词之间的逻辑关系,形成表达用户信息需求的检索提问式。广义的计算机信息检索策略是指在分析检索课题的实质内容和明确检索目标的基础上,选择检索工具,确定检索途径与检索用词
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 信息 检索 知识点 归纳 总结
限制150内