文献检索课二计算机检索的基础知识.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《文献检索课二计算机检索的基础知识.ppt》由会员分享,可在线阅读,更多相关《文献检索课二计算机检索的基础知识.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、文献检索课文献检索课二二计算机检索的基础知识计算机检索的基础知识林林林林 英英英英图书馆信息咨询部图书馆信息咨询部图书馆信息咨询部图书馆信息咨询部课程安排电子信息资源检索电子信息资源检索电子信息资源的概念电子信息资源的概念:以数字化的形式,把文字、图形、图像、声音、以数字化的形式,把文字、图形、图像、声音、动画等多种形式的信息存放在光、电、磁等非动画等多种形式的信息存放在光、电、磁等非印刷型介质上,以电信号、光信息号的形式传印刷型介质上,以电信号、光信息号的形式传输,并通过网络通信、计算机或终端等方式再输,并通过网络通信、计算机或终端等方式再现出来的一种信息资源。现出来的一种信息资源。电子信息
2、资源的特点电子信息资源的特点:1、组织形式发生变化:由传统的文本、线性,发展成超文组织形式发生变化:由传统的文本、线性,发展成超文本、超媒体等多种形式,并组成相互联系、非线性的网本、超媒体等多种形式,并组成相互联系、非线性的网状结构。状结构。2、数字化:存储密度高,容量大。、数字化:存储密度高,容量大。3、内容丰富多样:从文字、图表到多媒体信息,文献类型、内容丰富多样:从文字、图表到多媒体信息,文献类型多样,涉及领域宽广。多样,涉及领域宽广。4、数据具有通用性、开放性、动态性、数据具有通用性、开放性、动态性5、信息资源体积小、数量大、信息资源体积小、数量大6、传播方式的无限性,不受时间、空间限
3、制、传播方式的无限性,不受时间、空间限制7、检索功能强大,使用方便、快捷。、检索功能强大,使用方便、快捷。信息检索系统信息检索系统概念概念:按某种方式建立起来的供读者查找信息的一种有层按某种方式建立起来的供读者查找信息的一种有层次的体系,是表征有序信息特征的集合体。分为两大类次的体系,是表征有序信息特征的集合体。分为两大类型:印刷型检索系统和计算机检索系统。型:印刷型检索系统和计算机检索系统。印刷型检索系统印刷型检索系统1、文献型检索工具、文献型检索工具(1)目录)目录以报道文献出版或收藏信息为主要功能的工具。如全国总书以报道文献出版或收藏信息为主要功能的工具。如全国总书目。目。(2)题录)题
4、录是将图书、报刊等文献中论文的篇目按照一定的排检方法编排是将图书、报刊等文献中论文的篇目按照一定的排检方法编排而成,供人们查找篇目出版的工具。如全国报刊索引而成,供人们查找篇目出版的工具。如全国报刊索引(3)文摘)文摘以精练的语言把文献信息的重要内容、观点、数据等摘录下来,以精练的语言把文献信息的重要内容、观点、数据等摘录下来,并按一定的著录规则与排列方式编排起来,供读者检索使用的一并按一定的著录规则与排列方式编排起来,供读者检索使用的一种检索工具。种检索工具。2、非文献型检索工具、非文献型检索工具主要指参考工具书。如词典、百科全书、年鉴、年表、名录等。主要指参考工具书。如词典、百科全书、年鉴
5、、年表、名录等。计算机检索系统的类型计算机检索系统的类型1.1.文献型数据库文献型数据库 文献型数据库是指能直接提供文献线索和文献原文的数文献型数据库是指能直接提供文献线索和文献原文的数据库据库,即数据库记录的对象为文献信息时。包括目录型即数据库记录的对象为文献信息时。包括目录型数据库、题录型、文摘型和全文型数据库。数据库、题录型、文摘型和全文型数据库。(1)目录型数据库目录型数据库 是对信息外表特征予以揭示和报道,以整个出版单位或是对信息外表特征予以揭示和报道,以整个出版单位或收藏单位为基本著录单元,如收藏单位为基本著录单元,如“本本”、“种种”、“件件”等。著录内容包括书(刊)名、作者、出
6、版年月、出版等。著录内容包括书(刊)名、作者、出版年月、出版地及收藏情况等。可分馆藏目录(如各图书馆的馆藏机地及收藏情况等。可分馆藏目录(如各图书馆的馆藏机读目录数据库读目录数据库OPACOPAC)、联合目录、出版发行目录等。)、联合目录、出版发行目录等。(2)题录、文摘型数据库题录、文摘型数据库题录型:是将单篇文献的题录型:是将单篇文献的“篇篇”、“章章”等为著等为著录单元,如一篇论文、一份报告、一件专利等。录单元,如一篇论文、一份报告、一件专利等。如全国报刊索引。如全国报刊索引。文摘型:在题录的基础上每个著录单元再加上文文摘型:在题录的基础上每个著录单元再加上文摘。如美国工程索引、科学文摘
7、等。摘。如美国工程索引、科学文摘等。(3)全文数据库全文数据库指存储文献全文或其中主要部分内容的源数据库。指存储文献全文或其中主要部分内容的源数据库。存储内容主要有各种图书、期刊论文、法律条文存储内容主要有各种图书、期刊论文、法律条文及案例、新闻报道等。它将二次文献的检索同原及案例、新闻报道等。它将二次文献的检索同原文献的获取融为一体。文献的获取融为一体。2.2.非文献型数据库非文献型数据库 指一种能够直接提供具体的术语、事实和数值等信息的指一种能够直接提供具体的术语、事实和数值等信息的数据库。包括术语型数据库、事实型数据库和数值型数数据库。包括术语型数据库、事实型数据库和数值型数据库。据库。
8、(1)(1)术语型数据库术语型数据库 指专门存储并揭示各类名语、术语、词语的检索工具。指专门存储并揭示各类名语、术语、词语的检索工具。大多是辞书、词典、百科全书等数字化版本。大多是辞书、词典、百科全书等数字化版本。(2)(2)事实型数据库事实型数据库 指存储简单而独立存在的非文献信息,如机构、人物、指存储简单而独立存在的非文献信息,如机构、人物、产品、地理位置、事件等实体信息。产品、地理位置、事件等实体信息。如:各种人物数据库、机构名录数据库、产品或商品数如:各种人物数据库、机构名录数据库、产品或商品数据库等。据库等。(3)(3)数值型数据库数值型数据库 一种以自然数值形式表示、计算机可读的数
9、据集合。一种以自然数值形式表示、计算机可读的数据集合。信息检索技术信息检索技术布尔逻辑检索布尔逻辑检索 利用布尔逻辑算符将一些具有简单的、表达某利用布尔逻辑算符将一些具有简单的、表达某一主题概念的检索单元(或检索标识)组配成一主题概念的检索单元(或检索标识)组配成一个具有复杂概念的检索式,以满足课题检索一个具有复杂概念的检索式,以满足课题检索的要求。主要通过的要求。主要通过“和和(and,*)”(and,*)”、“或或(or,+)”(or,+)”、“非非(not,-)”(not,-)”等将检索词联络起来等将检索词联络起来 。逻辑算符逻辑算符含义含义表示关系表示关系作用及表达作用及表达“与与”(
10、AND 或或*)检索出的记录必须检索出的记录必须同时含有所有的检同时含有所有的检索词索词概念交叉和限定概念交叉和限定缩小检索范围缩小检索范围,提高提高查准率查准率A and B或或A*B“或或”(OR或或+)检出的结果中只需检出的结果中只需满足检索项中的任满足检索项中的任何一个或同时满足何一个或同时满足即可即可并列关系并列关系组配相同概念的检组配相同概念的检索词,如同义词、索词,如同义词、近义词等。扩大检近义词等。扩大检索范围索范围,提高查全率提高查全率A or B或或A+B“非非”(NOT或或-)检出的记录中只能检出的记录中只能含有含有NOT算符前的算符前的检索词,不能同时检索词,不能同时含
11、有其后的检索词含有其后的检索词概念删除关系概念删除关系缩小检索范围,提缩小检索范围,提高检索的专指度高检索的专指度A not B或或AB运算优先级顺序为运算优先级顺序为运算优先级顺序为运算优先级顺序为NOTNOT、ANDAND、OROR,可以用括号,可以用括号,可以用括号,可以用括号“()”改变它们的运算顺序。改变它们的运算顺序。改变它们的运算顺序。改变它们的运算顺序。如如如如A and(B or C),A and(B or C),检索顺序为先检索顺序为先检索顺序为先检索顺序为先B B或或或或C,C,然后再与然后再与然后再与然后再与A A逻辑算符举例逻辑算符举例查找关于查找关于“动物保护动物保
12、护”的文献:的文献:“动物动物”和和“保护保护”可以用可以用“逻辑与逻辑与”组配,表示为组配,表示为“动物动物AND保护保护”,检出记录中既涉及动物又涉及保护,检出记录中既涉及动物又涉及保护的相关文献。的相关文献。查找有关冬虫夏草的文献:查找有关冬虫夏草的文献:冬虫夏草又称冬虫草、虫草冬虫夏草又称冬虫草、虫草,“冬虫夏草冬虫夏草”、“冬虫草冬虫草”、“虫草虫草”三者要用逻辑或组配,表示为三者要用逻辑或组配,表示为“冬虫夏草冬虫夏草or冬虫草冬虫草or虫草虫草”,检索出文献中包含三者任意一种,检索出文献中包含三者任意一种即被检出。即被检出。查找关于国外建筑特色的文章查找关于国外建筑特色的文章:国
13、外即不包括中国国外即不包括中国,建筑和中国之间为逻辑非的关系,建筑和中国之间为逻辑非的关系,表示为表示为“建筑建筑not中国中国”,检索结果排除了中国建筑的,检索结果排除了中国建筑的相关文献。相关文献。检索西红柿种植技术的相关文章检索西红柿种植技术的相关文章:西红柿西红柿”又称又称“番茄番茄”,表示为,表示为“西红柿西红柿+番茄番茄”;“种植种植”的同义词有的同义词有“栽培栽培”、“培育培育”,表示为,表示为“种植种植+栽培栽培+培育培育”;检索表达式为检索表达式为:(西红柿西红柿+番茄番茄)*(种植种植+栽栽培培+培育培育)词组检索词组检索:通常在所检索词上加通常在所检索词上加“”对所检索词
14、视为词组处理对所检索词视为词组处理例如例如:“动物保护动物保护”,表示动物保护是个词组,检索结果动物和,表示动物保护是个词组,检索结果动物和保护不能分开。若不加保护不能分开。若不加“”,检索结果可以是动物保护、动物多,检索结果可以是动物保护、动物多样性保护、动物栖息地保护、动物资源保护等形式样性保护、动物栖息地保护、动物资源保护等形式。截词检索截词检索又称部分一致检索,是在检索词的适当位置进行截断,然后使用又称部分一致检索,是在检索词的适当位置进行截断,然后使用截词符代替,利用截断的词的一部分进行检索,检索词与文献部截词符代替,利用截断的词的一部分进行检索,检索词与文献部分一致性。分一致性。截
15、词检索是预防漏检,提高查全率截词检索是预防漏检,提高查全率尤其适用于英语,常用于处理词语的单复数,不同拼写方式,相尤其适用于英语,常用于处理词语的单复数,不同拼写方式,相同词根的相近意义词,以及动词的不同形式等。同词根的相近意义词,以及动词的不同形式等。截词的类型:按照截词的位置,分为后截词截词的类型:按照截词的位置,分为后截词(前方一致),前截(前方一致),前截词(后方一致),中截词(中间一致和中间不一)。词(后方一致),中截词(中间一致和中间不一)。截词符:不同的检索系统所使用的截词符不同,常用的有截词符:不同的检索系统所使用的截词符不同,常用的有“*”、“?”“*”、“?”的比较的比较“
16、*”,无限截词,代表多个字符如,无限截词,代表多个字符如regard*,代表代表regard,regarding,regardless,等等absorb*“?”有限截词,代表有限截词,代表0个或个或1个字符,如个字符,如“wom?n”,则包含,则包含“woman,women”;可以用可以用“n?”来代表多个字符来代表多个字符前截词、后截词、中间截词的比较前截词、后截词、中间截词的比较前截词前截词将截词符放在词根的前边,后方一致,表示在词根将截词符放在词根的前边,后方一致,表示在词根前方有无限个或有限个字符变化。前方有无限个或有限个字符变化。如:如:*computer将将检检索出索出comput
17、er、minicomputer、microcomputer等等单单词词的文献。的文献。后截词后截词将截词符放在词根的后面,前方一致。如:将截词符放在词根的后面,前方一致。如:grow*,系统将检索出含有系统将检索出含有grow、growth、growing等词的所有记录等词的所有记录中间截词中间截词是将截词符号置于检索词的中间,而词的前后方是将截词符号置于检索词的中间,而词的前后方一致。通常用于英、美不同拼写形式的词(英语单词)进行一致。通常用于英、美不同拼写形式的词(英语单词)进行检索。如:检索。如:colo?r可检出的词为可检出的词为colour(英音英音)、color(美美音音)。位置检
18、索技术位置检索技术利用位置逻辑算符来限定检索词与检索词之间的位置关系,从而使检索利用位置逻辑算符来限定检索词与检索词之间的位置关系,从而使检索出的文献更确切地符合用户要求,提高查准率。出的文献更确切地符合用户要求,提高查准率。在不同的检索系统中,所采用的位置算符是不同的,功能也有差异。在不同的检索系统中,所采用的位置算符是不同的,功能也有差异。(W)(W)(WITHWITH)算符)算符:表示两个检索词紧挨着,词序不能颠倒,中间不能表示两个检索词紧挨着,词序不能颠倒,中间不能有其他词,但可以有空格和标点符号。也可以用()有其他词,但可以有空格和标点符号。也可以用()A(W)BAB两词靠近,次序为
19、两词靠近,次序为A先先B后。后。例如:例如:communication(w)satellite或者或者communication()()satellite,只检索出,只检索出communicationsatellite,communication-satellite的记录的记录(nW)算符:算符:表示两个检索词之间插有表示两个检索词之间插有n个词,但顺序不能颠个词,但顺序不能颠倒。倒。A(nW)BAB两词靠近,次序为两词靠近,次序为A先先B后,中间最多可加后,中间最多可加n个词。个词。例例如如:communication(2w)satellite,只只检检索索出出communicationsa
20、tellite、communication-satellite,communicationthroughsatellite、communicationonthesatellite词组的记录。词组的记录。(N N)(Near)(Near)算符算符:表示两个检索词为相邻关系,两:表示两个检索词为相邻关系,两个词之间不能插入任何词,但词序可以颠倒。个词之间不能插入任何词,但词序可以颠倒。A(N)B:AB两词靠近,次序可变。两词靠近,次序可变。如如building(N)construction可检索出可检索出buildingconstruction,constructionbuilding,const
21、ruction-building的记录的记录(nN)算符:算符:表示两个检索词之间可以插入表示两个检索词之间可以插入n个词个词并且词序可以颠倒并且词序可以颠倒A(nN)B:AB两词靠近,次序可变,中间最多可加两词靠近,次序可变,中间最多可加n个词。个词。例如:例如:information(1N)retrieval可检索出可检索出informationretrieval,informationandretrieval,retrievalofinformation的记录。的记录。限制检索技术限制检索技术限制检索是通过限制检索范围,缩小检索结果,达限制检索是通过限制检索范围,缩小检索结果,达到精确检
22、索的方法。到精确检索的方法。检索方式主要有:限定检索方式主要有:限定字段字段检检索和索和限定限定范范围围检索检索限定限定字段字段检检索:索:将检索词限定在特定的字段中。将检索词限定在特定的字段中。如:题名(如:题名(TI,title)、关键词、关键词(KW,keyword)、主题词(、主题词(DE,descriptor)、文摘(文摘(AB,abstract)、全文(、全文(FT,Fulltext)、作者(作者(AU,author)、期刊名称、期刊名称Journal(JN)、出版国出版国Country(CO)、出版年份、出版年份PublicationYear(PY)、语种、语种Language(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文献 检索 计算机 基础知识
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内