信息检索基本方法及技术.ppt
信息检索基本方法及技术信息检索基本方法及技术2023/3/3第一页,编辑于星期六:十六点十七分。一、信息需求一、信息需求(一)文献信息需求(一)文献信息需求文献信息需求以获得一定的文献原文来满足人们的信息需要。文献信息需求以获得一定的文献原文来满足人们的信息需要。1 1、写论文需要的文献信息、写论文需要的文献信息 主要是要求能给论文帮助的新的、有代表性的文献信息。主要是要求能给论文帮助的新的、有代表性的文献信息。2 2、科学研究需要的文献信息、科学研究需要的文献信息 要求能全面、系统地掌握某一阶段内相关的全部文献信息。要求能全面、系统地掌握某一阶段内相关的全部文献信息。3 3、解决某种具体问题需要的文献信息、解决某种具体问题需要的文献信息 要求文献种能提供相同或相似情况下的解决方法。要求文献种能提供相同或相似情况下的解决方法。4 4、知识学习、知识学习 要求较新的、成熟的学术性资源要求较新的、成熟的学术性资源(二)非文献信息需求(二)非文献信息需求非文献信息需求以获得一定的有关事实或数据来服务人们。这种非文献信息需求以获得一定的有关事实或数据来服务人们。这种检索通常利用能直接提供事实或数据的工具来检索。检索通常利用能直接提供事实或数据的工具来检索。2023/3/3第二页,编辑于星期六:十六点十七分。二、信息检索工具二、信息检索工具(一)计算机检索工具(一)计算机检索工具1、搜索引擎、元搜索引擎;、搜索引擎、元搜索引擎;Google、Alltheweb、百度、百度飓风搜索通、飓风搜索通、iTools2、网络资源目录:、网络资源目录:yahoo、BUBLLINK3、各类网站:、各类网站:http:/sosig.esrc.bris.ac.uk、www.eric.ed.gov、国家精品课、国家精品课程导航、程导航、EconWPA、4、学术性检索系统:、学术性检索系统:ISIWebofKnowledge、OVID、OCLC、CNKI平台、平台、NSTL、CSDL、CALIS、维普资讯、万方数据系统、维普资讯、万方数据系统5、数据库、数据库(二)手工检索工具(二)手工检索工具二次文献、工具书二次文献、工具书(三)线索检索工具、原文检索工具、馆藏检索工具三)线索检索工具、原文检索工具、馆藏检索工具2023/3/3第三页,编辑于星期六:十六点十七分。(四)(四)各类文献的网络检索工具各类文献的网络检索工具1、图书信息检索工具、图书信息检索工具各地各地图书馆的公共检索目录图书馆的公共检索目录(OPAC)(OnlinePublicAccessCatalog)联合目录数据库联合目录数据库Worldcad:是由是由OCLC及其成员图书馆共同建设联机联合目录及其成员图书馆共同建设联机联合目录数据库数据库CALIS联合目录数据库联合目录数据库网上书店网上书店A,当当网上书店当当网上书店,电子图书电子图书超星数字图书馆超星数字图书馆,书生之家书生之家,北大方正北大方正Apabi数字图书馆数字图书馆,书同文书同文,http:/读秀学术搜索读秀学术搜索2023/3/3第四页,编辑于星期六:十六点十七分。2、学术期刊检索工具、学术期刊检索工具期刊收藏信息:期刊收藏信息:OPAC和期刊联合目录和期刊联合目录期刊内容信息:期刊内容信息:中国期刊网中国期刊网中国期刊全文数据库中国期刊全文数据库万方数据资源系统之数字化期刊子系统中文科技期刊数据库UnCover,:世界上规模最大、更速度最快:世界上规模最大、更速度最快的期刊检索系统。的期刊检索系统。UMI-ProQuest、OCLCFirstSearch、Ovid、SciFinderScholarWilsonWeb,http:/KluwerOnline、Elsevier、SpringLinkIEEE/IEEElectronicDirectLibrary(IEL)(TheInstituteofElectricalandElectronicsEngineers/TheInstituteofElectricalEngineers),IEL是世界信息量最大的电子、工程类是世界信息量最大的电子、工程类信息源之一。信息源之一。电子期刊电子期刊、期刊网站、集合型期刊、期刊网站、集合型期刊2023/3/3第五页,编辑于星期六:十六点十七分。3、学位论文检索工具、学位论文检索工具UMI的学位论文服务的学位论文服务, 主题检索语言是直接以代表文献内容特征和主题检索语言是直接以代表文献内容特征和科学概念的词汇作为检索标识。主题语言可分科学概念的词汇作为检索标识。主题语言可分为标题语言、叙词语言和关键词语言。为标题语言、叙词语言和关键词语言。它们的它们的优点是:在表达主题内容方面具有较大的灵活优点是:在表达主题内容方面具有较大的灵活性,抛弃了人为的号码系统,代之以通用的规性,抛弃了人为的号码系统,代之以通用的规范语言,并在各主题之间建立有机的参照系统,范语言,并在各主题之间建立有机的参照系统,代替了等级制的直线排列。它使用组配和索引代替了等级制的直线排列。它使用组配和索引等方式,较好地满足多元检索的要求。等方式,较好地满足多元检索的要求。2023/3/3第十八页,编辑于星期六:十六点十七分。四、检索方法及检索途径四、检索方法及检索途径 (一)检索方法(一)检索方法查找查找(Searching)(Searching)就是实施检索策略、搜寻所得就是实施检索策略、搜寻所得文献信息的过程。以下几种方法,无论是计算机还文献信息的过程。以下几种方法,无论是计算机还是手工检索,都是常用的方法。是手工检索,都是常用的方法。1.1.“拉网法拉网法”在不了解查询某一专题信息的在不了解查询某一专题信息的URLURL地址时,可从地址时,可从提供信息总目的提供信息总目的Web Web 页面开始浏览,沿着专题链接层页面开始浏览,沿着专题链接层层查找,直至找到有关的内容为止。然后用层查找,直至找到有关的内容为止。然后用“书签书签”保存这个页面的保存这个页面的URLURL,转向另一个分支。这种方法可,转向另一个分支。这种方法可以迅速获得较多的相关地址,然后进行筛选。就使用以迅速获得较多的相关地址,然后进行筛选。就使用引擎而言,国外专家也建议先用链接页面多、响应时引擎而言,国外专家也建议先用链接页面多、响应时间快的引擎。间快的引擎。2023/3/3第十九页,编辑于星期六:十六点十七分。2.2.引文法引文法(跟踪法跟踪法)文献之间的引证和被引证关系揭示了文文献之间的引证和被引证关系揭示了文献之间存在的某种内在联系,引文法献之间存在的某种内在联系,引文法(也有也有称为跟踪法称为跟踪法)就是利用文献后所附的参考文就是利用文献后所附的参考文献、相关书目、推荐文章和引文注释查找相献、相关书目、推荐文章和引文注释查找相关文献的方法。这些材料指明了与用户需求关文献的方法。这些材料指明了与用户需求最密切的文献线索,往往包含了相似的观点、最密切的文献线索,往往包含了相似的观点、思路、方法,具有启发意义思路、方法,具有启发意义。2023/3/3第二十页,编辑于星期六:十六点十七分。引文法又可分为两种,一种是由远及近地搜寻,即引文法又可分为两种,一种是由远及近地搜寻,即找到一篇有价值的论文后进一步查找该论文被哪些找到一篇有价值的论文后进一步查找该论文被哪些其它文献引用过,以便了解后人对该论文的评论、其它文献引用过,以便了解后人对该论文的评论、是否有人对此作过进一步研究、实践结果如何、最是否有人对此作过进一步研究、实践结果如何、最新的进展怎样等等。由远及近地追寻,越查资料越新的进展怎样等等。由远及近地追寻,越查资料越新,研究也就越深入,但这种查法主要依靠专门的新,研究也就越深入,但这种查法主要依靠专门的引文索引,如引文索引,如 科学引文索引科学引文索引、社会科学引社会科学引文索引文索引 。2023/3/3第二十一页,编辑于星期六:十六点十七分。另一种较为普遍的查法是由近及远地另一种较为普遍的查法是由近及远地追溯,这样由一变十,由十变百地获取更追溯,这样由一变十,由十变百地获取更多相关文献,直到满足要求为止。这种方多相关文献,直到满足要求为止。这种方法适合于历史研究或对背景资料的查询,法适合于历史研究或对背景资料的查询,其缺点是越查材料越旧,追溯得到的文献其缺点是越查材料越旧,追溯得到的文献与现在的研究专题越来越疏远。因此,最与现在的研究专题越来越疏远。因此,最好是选择综述、评论和质量较高的专著作好是选择综述、评论和质量较高的专著作为起点,它们所附的参考文献筛选严格,为起点,它们所附的参考文献筛选严格,有时还附有评论。有时还附有评论。2023/3/3第二十二页,编辑于星期六:十六点十七分。3.3.常规法常规法所谓常规法就是利用常规检索工具查找有关文所谓常规法就是利用常规检索工具查找有关文献的方法,是信息时代应掌握的最基本的信息查找献的方法,是信息时代应掌握的最基本的信息查找方法。现在对文献的书目控制手段已日趋完善,各方法。现在对文献的书目控制手段已日趋完善,各种印刷版、缩微版、光盘版和网络版的检索工具层种印刷版、缩微版、光盘版和网络版的检索工具层出不穷,有很大的挑选余地。用户应根据自己的检出不穷,有很大的挑选余地。用户应根据自己的检索知识和条件选用一种或几种检索工具。索知识和条件选用一种或几种检索工具。常规法可常规法可分为顺查法、逆查法和抽查法。分为顺查法、逆查法和抽查法。2023/3/3第二十三页,编辑于星期六:十六点十七分。4.4.排除、限定和合取法排除、限定和合取法这实际上是将信息加工的方法融入检索中这实际上是将信息加工的方法融入检索中去。思维中使用去。思维中使用排除这一概念,是指对查找对排除这一概念,是指对查找对象的产生和存在的状态在时间和空间上加以外象的产生和存在的状态在时间和空间上加以外在否定。在否定。把这一方法移植到检索中,就是在时把这一方法移植到检索中,就是在时间或空间上极大地收缩检索范围。间或空间上极大地收缩检索范围。限定法是相限定法是相对于排除法而言的,指对查找对象在时间和空对于排除法而言的,指对查找对象在时间和空间上加以内在的肯定间上加以内在的肯定。排除的结果必然是限定,。排除的结果必然是限定,反之亦然。反之亦然。2023/3/3第二十四页,编辑于星期六:十六点十七分。(二)检索途径(检索入口)(二)检索途径(检索入口)所谓检索途径就是检索时切入信息群所谓检索途径就是检索时切入信息群体的路径。体的路径。检索途径有两大类,一类是用检索途径有两大类,一类是用信息的外部特征,如题名、责任者、某种信息的外部特征,如题名、责任者、某种序号、机构名等作为检索标识;另一类是序号、机构名等作为检索标识;另一类是用能够描述信息内容的分类号、关键词、用能够描述信息内容的分类号、关键词、主题词等作为检索标识。在数据库中检索主题词等作为检索标识。在数据库中检索时,几乎所有的字段都可以作为检索的途时,几乎所有的字段都可以作为检索的途径。径。2023/3/3第二十五页,编辑于星期六:十六点十七分。分类检索分类检索这种检索是根据信息内容的学科分类来进这种检索是根据信息内容的学科分类来进行的。最大的优点能保证信息的系统性,行的。最大的优点能保证信息的系统性,而且具有较好的族性检索功能。而且具有较好的族性检索功能。分分类检索的要点:类检索的要点:1 1。对待检课题的概念及学。对待检课题的概念及学科间的各种关系清楚;科间的各种关系清楚;2 2。正确掌握相关。正确掌握相关课题的分类名称、分类号,手工检索中课题的分类名称、分类号,手工检索中掌握工具的分类排检。掌握工具的分类排检。2023/3/3第二十六页,编辑于星期六:十六点十七分。分类检索的步骤:分类检索的步骤:1 1。分析待检课题,确定其学科,并弄。分析待检课题,确定其学科,并弄 清学科间的各清学科间的各种关系。种关系。2 2。查出待检课题的分类号(工具简单时可以。查出待检课题的分类号(工具简单时可以 省略)省略)3 3。选择适当的检索工具。选择适当的检索工具 4 4。进入检索系统后选择分类号途径,并在对话框内。进入检索系统后选择分类号途径,并在对话框内 输入分类号,开始检索。输入分类号,开始检索。5 5。对比题目,阅览相关信息,选出所需信息,并下载。对比题目,阅览相关信息,选出所需信息,并下载相关信息相关信息6 6。原文的索取。原文的索取2023/3/3第二十七页,编辑于星期六:十六点十七分。词汇检索词汇检索 与分类号检索相比,词汇检索具有直与分类号检索相比,词汇检索具有直观、灵活、专指性和适应性好的特点,同观、灵活、专指性和适应性好的特点,同时检索速度也比分类检索快。时检索速度也比分类检索快。词汇检索的要点:首先是要选好检索词汇检索的要点:首先是要选好检索词,正确理解词间关系,检索中还要注意词,正确理解词间关系,检索中还要注意词间关系的正确表达。词间关系的正确表达。常用的词汇检索有常用的词汇检索有关键词检索和主题检索。计算机检索时,关键词检索和主题检索。计算机检索时,选择任意字段检索时,检索项也可以是各选择任意字段检索时,检索项也可以是各种词汇。种词汇。2023/3/3第二十八页,编辑于星期六:十六点十七分。词汇检索的步骤:词汇检索的步骤:a a、分析课题,确定检索词及词间关系分析课题,确定检索词及词间关系 b b、选择适当的检索工具、选择适当的检索工具 c c、选择词汇检索途径,在对话框内输入检索词、选择词汇检索途径,在对话框内输入检索词 (注(注意词间关系的表达)意词间关系的表达)d d、根据快捷显示,选出有用信息并下载。根据快捷显示,选出有用信息并下载。e e、原文的索取原文的索取2023/3/3第二十九页,编辑于星期六:十六点十七分。其他检索途径其他检索途径1、题名检索、题名检索包括书名、刊名、篇名和其他信息的标题等包括书名、刊名、篇名和其他信息的标题等2、作者、作者3、机构、机构4、号码、号码分类号、分类号、报告号、登记号、专利号、报告号、登记号、专利号、ISBN、ISSN记记录号等录号等5、来源、来源6、其他特殊途径、其他特殊途径2023/3/3第三十页,编辑于星期六:十六点十七分。五、五、基本检索技术基本检索技术1、布尔检索、布尔检索AND(默认、空格、(默认、空格、+、allofthesewords)OR(必须大写,关键词必须大写,关键词1、关键词、关键词2,|,/,anyofthesewords)NOT(-,noneofthesewords)NEAR2023/3/3第三十一页,编辑于星期六:十六点十七分。下面以下面以“计算机计算机”和和“文献检索文献检索”两个词来解释三种逻两个词来解释三种逻辑算符的含义。辑算符的含义。计算机计算机”AND“文献检索文献检索”,表示查找文献内容中,表示查找文献内容中既含有既含有“计算机计算机”又含有又含有“文献检索文献检索”词的文献。词的文献。计算机计算机”OR“文献检索文献检索”,表示查找文献内容中含有,表示查找文献内容中含有“计算机计算机”或含有或含有“文献检索文献检索”以及两词都包含的文献。以及两词都包含的文献。计算机计算机”NOT“文献检索文献检索”,表示查找文献内容中含,表示查找文献内容中含有有“计算机计算机”而不含有而不含有“文献检索文献检索”的那部分文献。的那部分文献。这里需要说明的是,在这里需要说明的是,在Windows环境下,尤环境下,尤其是在中文数据库及网站中,逻辑检索可以用算符其是在中文数据库及网站中,逻辑检索可以用算符将检索要求编成综合表达式向计算机一次输入检索将检索要求编成综合表达式向计算机一次输入检索提问,也可以用窗口上的逻辑指令按钮(与、或、提问,也可以用窗口上的逻辑指令按钮(与、或、非)进行分步组配提问和检索。非)进行分步组配提问和检索。2023/3/3第三十二页,编辑于星期六:十六点十七分。例检索水稻和小麦不包括除草和施肥有关栽培的文献(水稻+小麦)*栽培*not(除草+施肥)inTI2023/3/3第三十三页,编辑于星期六:十六点十七分。2.截词检索截词检索(*、?)、?)截词检索就是用截断的词的一个局部进行截词检索就是用截断的词的一个局部进行的检索,并认为凡满足这个词局部中的所有的检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。按截字符(串)的文献,都为命中的文献。按截断的位置来分,截词可有后截断、前截断、断的位置来分,截词可有后截断、前截断、中截断三种类型。按截断字符数量分为有限中截断三种类型。按截断字符数量分为有限截词(即一个截词符只代表一个字符)和无截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符)。限截词(一个截词符可代表多个字符)。综合搜索引擎一般不支持截词检索综合搜索引擎一般不支持截词检索2023/3/3第三十四页,编辑于星期六:十六点十七分。n后截断n中截断n前截断无限截断如:economic?有限截断截词检索与截词检索算符economiceconomicseconomicsteconomicalismeconomiceconomicseconomicst如:economic*如:wom?nwomanwomen如:?lishsul*ur sulfur sulphur 无限截断有限截断2023/3/3第三十五页,编辑于星期六:十六点十七分。3、位置检索、位置检索位置检索一般用用来限制检索项之间的位置关系和位置检索一般用用来限制检索项之间的位置关系和前后次序。其目的是增强检索项组配的灵活性,更前后次序。其目的是增强检索项组配的灵活性,更准确地表达复杂的检索概念。常用的位置算符有以准确地表达复杂的检索概念。常用的位置算符有以下几种:下几种:邻近位置算符(邻近位置算符(W)(W)算符也可以简写为()算符,)算符也可以简写为()算符,A(W)B,表示,表示A紧挨着紧挨着B,并且顺序不能颠倒。,并且顺序不能颠倒。A和和B之间除允许有一之间除允许有一个空格、一个标志符号或一个连接号以外,不得插个空格、一个标志符号或一个连接号以外,不得插入任何单位或字母。入任何单位或字母。邻词位置算符(邻词位置算符(nw)A(nw)B,表示两个词的次序不变,其间可以插入,表示两个词的次序不变,其间可以插入n个个词。词。2023/3/3第三十六页,编辑于星期六:十六点十七分。句子位置算符(句子位置算符(S)A(s)B,表表A和和B必须同时出现在记录的同一个句子或短语中,但次序必须同时出现在记录的同一个句子或短语中,但次序可能随意改变,可能随意改变,A与与B之间可以有若干个其他的词。之间可以有若干个其他的词。字段位置符(字段位置符(F)A(F)B,表示,表示A和和B必须同时出现在记录的同一个字段之中,必须同时出现在记录的同一个字段之中,但位置和次序不限,两者之间还可以任意加词。如但位置和次序不限,两者之间还可以任意加词。如Rice(F)Genetics/Ti要求要求Rice和和Genetics必在同时出现在篇名之必在同时出现在篇名之中。中。(字段标识符:(字段标识符:TI、AU、AB、SO、PY、LA、DE、TN)记录位置算符(记录位置算符(C)A(C)B其作用等同于其作用等同于AandB,均表示,均表示A和和B同时出现在同一同时出现在同一记录内,但词序不限,也不要求在同一字段内。记录内,但词序不限,也不要求在同一字段内。2023/3/3第三十七页,编辑于星期六:十六点十七分。4、限定检索、限定检索就是将检索词限定在一定的范围内进行检索就是将检索词限定在一定的范围内进行检索(1)限定网站)限定网站【实例】3/3/2023输入“金庸古龙site:”搜索包含“金庸”和“古龙”的中文新浪网站页面。(2)限定网页)限定网页【实例】输入“inurl:midi沧海一声笑”查找MIDI曲“沧海一声笑”。【实例】输入inurl:plog/register.php,搜索plog注册文件(现在用的很普遍的一套PHP博客程序,在其安装说明中明确说明希望用户安装后删除register.php文件)。【实例】输入“inurlsecuritywindows2000site:”查找微软网站上关于windows2000的安全课题资料。2023/3/3第三十八页,编辑于星期六:十六点十七分。(3)限定标题)限定标题【实实例例】输输入入“intitle:张张娜娜拉拉写写真真”查查找找韩韩国国张张娜娜拉拉的的照片集。照片集。(4)限定文件类型)限定文件类型【实实例例】输输入入filetype:litlit(booksebooks),搜搜索索网网络络图图书书(FILETYPE可以更换)。可以更换)。【实实例例】利利用用后后缀缀名名来来搜搜索索电电子子书书,输输入入“存存在在与与虚虚无无chm”、“菜根谭菜根谭exe”、“水煮三国水煮三国chm”。(5)其他类型限定)其他类型限定【实例实例】输入输入“related: 例例】输输 入入pwd inurl:(service or authors oradministratorsorusers),搜索密码文件。,搜索密码文件。2023/3/3第三十九页,编辑于星期六:十六点十七分。6 6 信息检索的基本步骤信息检索的基本步骤分析检索课题分析检索课题1.主题概念2.信息类型3.时间范围4.检索目的构造检索式构造检索式(试验性检索)(试验性检索)1.简单提问式2.上下文提问式3.复合提问式4.结构性提问式调调整整检检索索策策略略(正式检索)(正式检索)1,信息量过多时2.信息量太少时输出检索结果输出检索结果1.文摘2.全文选择检索系统选择检索系统1.学科范围2.系统类型3.系统功能 确定检索词确定检索词1.切分2.删除3.替补4.组合5.增加用户评价 2023/3/3第四十页,编辑于星期六:十六点十七分。确定检索词确定检索词1切分切分切分是对课题的语句以自由词为单位进行拆分,切分是对课题的语句以自由词为单位进行拆分,转换为检索的最小单元。自由词切分仅适用于转换为检索的最小单元。自由词切分仅适用于自然语言检索。自然语言检索。例例1:检索:检索“妇女吸烟与肺癌的关系研究妇女吸烟与肺癌的关系研究”相相关文献。关文献。直接切分:直接切分:妇女妇女|吸烟吸烟|与与|肺癌肺癌|的的|关系关系|研究)研究)注意,当词切分后将失去原来的意思时,不应注意,当词切分后将失去原来的意思时,不应再切分,如再切分,如“中国科学院中国科学院”、“电子邮件电子邮件”2023/3/3第四十一页,编辑于星期六:十六点十七分。2删除删除删除是对自然语言中不具有实质性检索意义删除是对自然语言中不具有实质性检索意义的的虚词虚词(如介词、连词、副词等),或者(如介词、连词、副词等),或者使使用频率较低的词,用频率较低的词,或者或者专指性太高、过分宽专指性太高、过分宽泛的词,泛的词,或者或者过分具体的限定词、禁用词,过分具体的限定词、禁用词,或者或者不能表达课题实质的高频词,不能表达课题实质的高频词,或者存在或者存在蕴含关系蕴含关系可以合并的词可以合并的词,一律予以删除,使,一律予以删除,使自然语言转换成为关键词和主题词的集合。自然语言转换成为关键词和主题词的集合。2023/3/3第四十二页,编辑于星期六:十六点十七分。例例2:检检索索“中中国国IT业业的的发发展展前前景景研研究究”方方面面的的相相关关文文献献。进进行行拆拆分分以以后后,发发展展、前前景景、研研究究这这三三个个自自由由词词具具有有一一定定的的检检索索意意义义,但但是是由由于于或或者者是是意意义义过过于于宽宽泛泛、或或者者是是不不能能表表达达课课题题实实质质、或或者者是是存存在在蕴蕴含含关关系系的的原原因因,没没有有必必要要全全部部作作为为检检索索词词,根据需要可以保留根据需要可以保留1-2个作为检索词。个作为检索词。2023/3/3第四十三页,编辑于星期六:十六点十七分。3替补替补替补就是在进行切分、删除后,对检索词进替补就是在进行切分、删除后,对检索词进行替换和补充。行替换和补充。“公交公交”应替换为:公共交通;应替换为:公共交通;“绿色包装绿色包装”中的中的“绿色绿色”,应替换为:环,应替换为:环保、无污染、可降解;保、无污染、可降解;“煤气中毒煤气中毒”应替换为:一氧化碳中毒;应替换为:一氧化碳中毒;“非典非典”应考虑补充:应考虑补充:SARS、非典型肺炎、非典型肺炎、传染性非典型肺炎、严重急性呼吸综合征传染性非典型肺炎、严重急性呼吸综合征(severeacuterespiratorysyndrome);2023/3/3第四十四页,编辑于星期六:十六点十七分。4增加增加增增加加“限限义义词词”。有有两两种种方方法法:直直接接增增加加限限义义词词、挖挖掘掘隐隐含含词词、提提取取潜潜在在的的检检索索词词;把把限限义义词词以以逻逻辑辑的的方方式式加加入入,可可采采用用逻逻辑辑“与与”或或逻逻辑辑“非非”的的方方法增加限义词。法增加限义词。分分析析隐隐含含概概念念。挖挖掘掘潜潜在在的的主主题题词词还还可可以以通通过过对对上上位位词词、下下位位词词、同同类类词词关关系系的的分分析析得得到到其其它它相相关关主主题题词词。如如例例1:“妇妇女女吸吸烟烟与与肺肺癌癌的的关关系系研研究究”,切切分分、删删除除后后得得:吸吸烟烟、肺肺癌癌两两个个检检索索词词,分分析析、补补充充上上位位词可增加检索词:词可增加检索词:烟、癌症、恶性肿瘤烟、癌症、恶性肿瘤。2023/3/3第四十五页,编辑于星期六:十六点十七分。构造检索式(试验性检索)所所 谓谓 的的 检检 索索 提提 问问 式式(query,searchformulation),是是信信息息检检索索中中用用来来表表达达用用户户检检索索提提问问的的逻逻辑辑表表达达式式,主主要要是是使使用用各各种种布布尔尔逻逻辑辑算算符符、位位置置算算符符、截截词词符符、限限制制算算符符以以及及系系统统规规定定的的其其他他组组配配连连接接符符号号将将检检索索词词进进行行组组配配,确确定定检检索索词词之之间间的的概概念关系或位置关系念关系或位置关系。2023/3/3第四十六页,编辑于星期六:十六点十七分。简单提问式简单提问式含一个检索词的提问式;上下文提问式上下文提问式精确短语或近似精确短语的提问式,也可称为短语提问式;复合提问式复合提问式含有布尔算符和至少2个检索词的提问式;结构性提问式结构性提问式含有2个以上布尔算符和至少4个检索词的多层结构组合的提问式。2023/3/3第四十七页,编辑于星期六:十六点十七分。例如:例如:“华中农业大学研究生招生华中农业大学研究生招生”计算机计算机*网络安全网络安全-病毒病毒番茄番茄*基因基因*(果实成熟(果实成熟+果实软化果实软化+耐贮藏耐贮藏+衰老衰老+滞绿滞绿+叶绿素降解)叶绿素降解)课题:地震序列分析的工具和方法研究课题:地震序列分析的工具和方法研究要完成本项检索课题,必须使用结构性提问式:要完成本项检索课题,必须使用结构性提问式:(“sequenceanalysis”INTI)AND(method*ORtool*ORinstrument*)INB)AND(SeismicORearthquake)2023/3/3第四十八页,编辑于星期六:十六点十七分。5 调整检索策略(正式检索)所谓所谓检索策略检索策略(searchstrategy)就是为完)就是为完成检索课题,实现检索目的,对检索的全过程成检索课题,实现检索目的,对检索的全过程进行谋划之后所制定的全盘检索方案。进行谋划之后所制定的全盘检索方案。在实施检索时,应及时分析检索结果在实施检索时,应及时分析检索结果与检索的与检索的内容、目的和要求是否一致内容、目的和要求是否一致,同时根据,同时根据检索结检索结果的多少果的多少对检索策略进行相应的修改和调整,对检索策略进行相应的修改和调整,以获得最佳的以获得最佳的查全率查全率和和查准率查准率,直至得到比较,直至得到比较满意的检索结果为止。满意的检索结果为止。2023/3/3第四十九页,编辑于星期六:十六点十七分。调整检索策略(正式检索)1当检索结果信息量过多时当检索结果信息量过多时原因原因:选用了多义性的检索词;截词截得过短;:选用了多义性的检索词;截词截得过短;输入的检索词太少;应该使用输入的检索词太少;应该使用“与(与(AND)”的使用了的使用了“或(或(OR)”;优先运算符;优先运算符“()()”使用错误。使用错误。2023/3/3第五十页,编辑于星期六:十六点十七分。考虑缩小检索范围,方法如下:考虑缩小检索范围,方法如下:(1)采用专指性强的主题词(主题词表),减少同义)采用专指性强的主题词(主题词表),减少同义词、同族相关词等相关性不强的检索词;词、同族相关词等相关性不强的检索词;(2)增加限制概念,采用)增加限制概念,采用“AND”算符连接检索词或算符连接检索词或进行二次检索;进行二次检索;(3)使用字段限定,把检索词限定在题目、主题词等)使用字段限定,把检索词限定在题目、主题词等主要字段;主要字段;(4)缩短检索年限,限制检索结果的文献类型、语种)缩短检索年限,限制检索结果的文献类型、语种及出版国;及出版国;(5)使用)使用“NOT”算符,排除无关概念;算符,排除无关概念;(6)调整位置算符,由松变严;)调整位置算符,由松变严;(7)改模糊检索为精确检索。)改模糊检索为精确检索。2023/3/3第五十一页,编辑于星期六:十六点十七分。2当检索结果信息量太少时当检索结果信息量太少时原因原因:检索词拼写错误;遗漏重要的同义:检索词拼写错误;遗漏重要的同义词或隐含概念;检索词过于冷僻具体;没词或隐含概念;检索词过于冷僻具体;没有使用截词算符;位置算符和字段算符使有使用截词算符;位置算符和字段算符使用的过多;使用过多的用的过多;使用过多的“AND”算符。算符。2023/3/3第五十二页,编辑于星期六:十六点十七分。考虑扩大检索范围,方法如下:考虑扩大检索范围,方法如下:(1)根据分类结构体系扩展关键的检索词,用)根据分类结构体系扩展关键的检索词,用“扩展扩展”按钮增加同义词和相关词并用按钮增加同义词和相关词并用“OR”算符连接这些词;算符连接这些词;(2)降低检索词的专指度,可从词表或检出文献中选择)降低检索词的专指度,可从词表或检出文献中选择上位词或泛指词补充到检索式中;上位词或泛指词补充到检索式中;(3)减少检索年限、文献类型、语种及出版国的限制,如)减少检索年限、文献类型、语种及出版国的限制,如增加回溯检索年限;增加回溯检索年限;(4)取消某些限制过严的字段限制、位置算符限制(或者)取消某些限制过严的字段限制、位置算符限制(或者改用限制程度较小的位置算符)改用限制程度较小的位置算符)(5)在词干相同的单词后使用截词符(?或)在词干相同的单词后使用截词符(?或*););(6)改精确检索为模糊检索;)改精确检索为模糊检索;(7)同时使用拼写正确的词,以及拼写错误的词或存在)同时使用拼写正确的词,以及拼写错误的词或存在多种普遍错别字的词作为检索词。多种普遍错别字的词作为检索词。2023/3/3第五十三页,编辑于星期六:十六点十七分。谢谢谢谢!2023/3/3第五十四页,编辑于星期六:十六点十七分。