《信息检索知识》PPT课件.ppt
《《信息检索知识》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《信息检索知识》PPT课件.ppt(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、一、信息检索一、信息检索(Information Retrieval)包括两个部分:一是信息存储,即把大量分散的无序的信息集中起来,经过加工,使之有序化、系统化,成为有功能的检索工具或检索系统。二是信息检索,利用已组织好的检索工具或检索系统,按照课题的要求将所需信息查找出来。1信息检索类型,分为:数据检索(Data Retrieval)-特定的数据事实检索(Fact Retrieval)-特定的事实文献检索(Document Retrieval)-特定的文献是根据课题的要求,采用科学的方法,利用专门的检索工具,如书刊或数据库,从大量的文献资料中找到所需文献的过程。包括,书目检索、题录或索引检索
2、、文摘检索、全文检索。2二、检索原理与检索语言二、检索原理与检索语言1、检索原理、检索原理 是指通过一定的方法和手段,使信息存储与检索两个过程所采用的特征和标识达到一致,以便有效地获取和利用文献。存储过程-对文献进行标引检索过程-根据需求,确定提问式32、检索语言(、检索语言(检索标识,检索标识,Retrieval Language)检索语言是一种在文献存储和检索过程中共同使用的语言。它的用途是描述文献特征,表达情报提问,并使两者能相互沟通。可分为规范化语言(受控语言)和非规范化语言(自然语言)。4规范化语言:规范化语言:是指对文献检索用语的概念加以人工控制和规范,把检索语言中各种同义词、多义
3、词、近义词、同形异义词等进行规范化处理,使每个检索词只能表达一个概念。例:IM的Subject Index;CA的CS、GS;中目的分类目次非规范化语言:非规范化语言:它对检索用语中的各种同义词、多义词、近义词、同形异义词等不加处理,所以也叫自然语言,如关键词。例:CAKeyword Index5 文献特征文献标识 目录或索引 -检检 外部特征文献名称文献名称索引(Title Index)引用期刊一览表等 著者名称 著者索引(Author Index)著者、专利权人索引 文献序号 序号索引(Number Index)专利号、报告号等索索 引用文献 引文索引(Citation Index)SCI
4、 内部特征分类号 分类索引(Classified Index)主题词 主题索引(Subject Index)语语 关键词 关键词索引(Keyword Index)分类主题 分类主题索引(Classified and Subject Index)言言 其它专用索引 分子式索引,环系索引等 (Formula Index),(Index of Ring system)6三、常用文献检索算符逻辑“与”and/*检索式“A and B”表示文献中同时包含检索词A和检索词B的文献才是命中文献。如:查找“胰岛素治疗糖尿病”的检索式为 insulin(胰岛素)andand diabetes(糖尿病)。A AN
5、D B7逻辑逻辑“或或”OR/+”OR/+检索式“A or B”表示包含检索词A的文献或者包含检索词B的文献或者同时包含检索词A和B的文献为命中文献。如:查找“肿瘤”的检索式为cancer(癌)oror tumor(瘤)oror carcinoma(癌)oror neoplasm(新生物)。A OR B8逻辑“非”NOT/-检索式“A not B”表示包含检索词A同时不包含检索词B的文献为命中文献。如:查“动物的乙肝病毒(不要人的)”的文献的检索式为hepatitis B virus(乙肝病毒)notnot human(人类)。A NOT B9邻近度算符 With 检索式“A with B”表
6、示检索词A和检索词B不仅要同时出现在一条记录中,还要同时出现在一个字段里的文献才是命中文献.如:“drug withwith abuse”检索出的是同一个字段中同时出现这两个词的记录。10邻近度算符邻近度算符NearNear 检索式“A near B”表示检索词A和检索词B不仅要同时出现在一条记录的同一字段里,还必须在同一个子字段(一句话)里的文献才是命中文献。如:drug nearnear abuse检索出的是同一句话中同时出现这两个词的记录。(也可说成是两个词之间没有句号的文献)。11邻近度算符邻近度算符Near#Near#其中“#”代表一个常数,检索式“A near#B”表示检索词A和检
7、索词B之间有0#个单词的文献(A和B在同一记录、同一字段里)。在near后加一个数字,指定两个词的邻近程度,且不论语序 。如:information near2 retrieval表示检索词 information和retrieval同时出现在一个句子中,且这两个检索词之间的单词数不超过两个的那些文献为命中文献。12四、文献检索工具的含义和类型四、文献检索工具的含义和类型 1、检索工具的定义与特点、检索工具的定义与特点定义定义:检索工具(Retrieval Device)是指用于报道、存储和查找文献的工具。它具有存储(编制过程)和检索(查找过程)两大职能。特点特点:(1)收摘一次文献、(2)著
8、录文献特征、(3)提供多种检索手段 132 检索工具的类型检索工具的类型 *按按摘录方式摘录方式划分如下:划分如下:目录目录 题录或索引题录或索引 文摘文摘 全文全文14目录目录(Catalogue)含义含义:目录是对文献的外表特征的著录。它通常以完整出版物(如一本书或一种刊或一个会议录的名称)作为著录的基本单位来报道和记录文献。著录内容著录内容:文献名称、著者、出版项与馆藏信息等内容。15按职能划分目录种类:按职能划分目录种类:出版发行目录 馆藏目录:按按检索标目检索标目划分为划分为 书名目录(Title Catalogue)著者目录(Author Catalogue)分类目录(Classi
9、fied Catalogue)主题目录(Subject Catalogue)联合目录 资料来源目录,如IM、CA、BA16题录(题录(Title)或索引)或索引(Index)概念概念:其一,是指检索工具,它揭示文献的外表特征和内容特征,即著录文献是以一个完整出版物的某一部分(如书的章节或刊中一篇论文题目)为著录单位。其二,是指检索途径(附录式索引),如,分类索引、主题索引、生物体索引、著者索引等。著录内容著录内容:论文题目、著者、文献出处(刊名、发表年月、卷、期、页码)及文种等。如,中目、IM、CNKI免费题录等。17文摘文摘(Abstract,Excerpta,Digest)含义含义:文摘是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息检索知识 信息 检索 知识 PPT 课件
限制150内