精准获取信息的方法——编写检索式(课堂PPT).ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《精准获取信息的方法——编写检索式(课堂PPT).ppt》由会员分享,可在线阅读,更多相关《精准获取信息的方法——编写检索式(课堂PPT).ppt(74页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精准获取信息的方法编写检索式1主要内容主要内容n为什么要精准什么要精准获取信息取信息n检索策略和步索策略和步骤n如何如何编写写检索式索式n搜索引擎中的搜索引擎中的检索式索式2为什么要精准获取信息为什么要精准获取信息保保证检索的全面性索的全面性不仅要广泛查阅自己特定范围内的国内外有关研究成果,而且要把视野放宽,广泛测览特定范围以外的有关研究成果。不仅要搜集与自己观点一致的材料,也要搜集那些与自己观点不一致,或与自己构思相矛盾的资料。不仅要广泛查阅中文资料,同时也应查阅外文资料,以便及时掌握最新的研究资料和动向特别是要着力搜集第一手资料,以保证研究的客观全面。3保证检索的准确性保证检索的准确性 通
2、过细读,基本掌握若干年来所研究的领域内讨论过的问题,分歧意见,代表人物和主要著作,主要倾向。要认真推敲观点和论据,并做好记录。从前人分歧矛盾中发现问题:从前人分歧矛盾中发现问题:(1)前人的结论可能是正确的,但论据不充分;结论可能是错误的,但研究过程或研究方法可能有启发;(2)前人的争论焦点,可能是问题的关键所在,也可能只在表面现象上争吵不休,并未触及问题的实质;(3)前人的理论依据及史料依据,可能是准确无误十分丰富,也可能是篡改文献,贫乏薄弱得不足为据。我们要通过细致查阅,搞清来龙去脉。4检索效果评价检索效果评价n查全率查全率是指检索出的相关文献量占系统中所有相关是指检索出的相关文献量占系统
3、中所有相关文献总量的百分比,用来反映检索的全面性。文献总量的百分比,用来反映检索的全面性。n查准率查准率是指检索出的相关文献量占所有检出文献总是指检索出的相关文献量占所有检出文献总量的百分比,用来反映检索的准确性。量的百分比,用来反映检索的准确性。查全率查全率P=a/(a+c)100%P=a/(a+c)100%查准率查准率R=a/(a+b)100%R=a/(a+b)100%R R:表示查全率;:表示查全率;P P:表示查准率;:表示查准率;a a:检出的相关文献量为;:检出的相关文献量为;b b:检出的非相关文献量;:检出的非相关文献量;c c:系统中未检出的相关文献量。:系统中未检出的相关文
4、献量。5n查全率的互补数就是漏检率查全率的互补数就是漏检率n查准率的互补数就是误检率。查准率的互补数就是误检率。n查全率和查准率也是互补的关系。查全率和查准率也是互补的关系。在一个特定的检索在一个特定的检索系统中,当查全率不断提高的同时,查准率就会降低,系统中,当查全率不断提高的同时,查准率就会降低,而当查准率提高的同时,查全率又会降低。但当查全而当查准率提高的同时,查全率又会降低。但当查全率和查准率都很低的时候,两者可以通过检索策略的率和查准率都很低的时候,两者可以通过检索策略的改善同时得到提高。改善同时得到提高。6检索课题检索课题主题分析主题分析选择数据库选择数据库确定检索词确定检索词制定
5、检索式制定检索式计算机处理计算机处理 数据库数据库原文原文标引标引 结果评价结果评价用户用户词表词表检索步骤检索步骤NY结结果果返返回回构造检索策略构造检索策略7制定检索策略制定检索策略n什么是什么是检索式索式检索式:索式:检索式是指索式是指计算机算机检索中用来表达用索中用来表达用户检索提索提问的的逻辑表达式,由表达式,由检索索词、检索算符索算符以及系以及系统规定的定的其他其他连接符号接符号等构成等构成n运算符运算符又称又称逻辑算符,是表达算符,是表达检索索词之之间逻辑关系和限制关系的关系和限制关系的运算符号,它是复合运算符号,它是复合检索式中必不可缺的构件。包括索式中必不可缺的构件。包括逻辑
6、算符、截算符、截词符、位置算符等字段符、位置算符等字段检索索8编制检索式编制检索式n用用逻辑算符算符说明明词间的的逻辑关系关系n用位置算符指定用位置算符指定词间的位置关系的位置关系n用截用截词符描述符描述词尾尾变化化n检索字段索字段n分析分析检索索结果,果,调整整检索式,直至索式,直至满意意试解解释检索式:索式:S(speckle and nondestruc?(w)test?)/ab,ti,de9检索词的选定确定确定检索索词的基本准的基本准则n必须能正确反映检索要求;必须能正确反映检索要求;n必须符合数据库的检索用词规则;必须符合数据库的检索用词规则;n优先选用具有检索意义学科名词术语;优先
7、选用具有检索意义学科名词术语;n多选常用的基本词汇进行组配。多选常用的基本词汇进行组配。10 进行文献的主进行文献的主题分析,包括审读题分析,包括审读文献,划分主题类文献,划分主题类型和分析主题结构,型和分析主题结构,选直接表达文献主选直接表达文献主题概念的词表中的题概念的词表中的正式专指叙词;正式专指叙词;要利用概念之间的属种关系和相关关系增加检索线索选择主题词要领选择主题词要领把握概念的含义注意利用词表 属种关系又称上下位关属种关系又称上下位关系,包括概念是属概念,被系,包括概念是属概念,被包括的概念是种概念。利用包括的概念是种概念。利用属概念扩大检索途径,可提属概念扩大检索途径,可提高查
8、全率,利用种概念缩小高查全率,利用种概念缩小查找范围,可提高查准率。查找范围,可提高查准率。相关关系指属种关系以相关关系指属种关系以外的具有交叉、并列、对立外的具有交叉、并列、对立关系的概念,以及形式与内关系的概念,以及形式与内容、本质与现象、原因与结容、本质与现象、原因与结果等关系。善于利用这些关果等关系。善于利用这些关系,有利于提高查全率。系,有利于提高查全率。词表词表是文献检索是文献检索的重要辅助工具,使用的重要辅助工具,使用时要注意从多角度查词,时要注意从多角度查词,要充分利用辅助表。当要充分利用辅助表。当查不到与某个具体概念查不到与某个具体概念相对应的专指叙词时,相对应的专指叙词时,
9、可以把该概念分解为几可以把该概念分解为几个较一般的概念个较一般的概念(外延外延相对宽的相对宽的),然后再去,然后再去查表。查表。111 1 直接选词法直接选词法n当当检检索索题题目目中中使使用用的的自自由由词词与与规规范范词词相相一一致致时时,可可直直接接选选取。取。n例如:例如:“光缆光缆(optical fiber)(optical fiber)”、“计计算算机机辅辅助助设设计计(computer(computer aided aided design)design)”等等,这这些些词词属属于于范范围围大大、命命中中率率高高的的选选词词,检检索索人人员员可可直直接接进进行行检索。这种方法的
10、结果最为接近主题。检索。这种方法的结果最为接近主题。122 2 专指选词法专指选词法n选用专指性强的主题词越多,则检出的文献针对性越强,选用专指性强的主题词越多,则检出的文献针对性越强,查准率就越高。查准率就越高。n突出检索主题的深度。突出检索主题的深度。133 3 转换选词法转换选词法n检索词的确定必须经过对检索主题的正确分析得到。检索词的确定必须经过对检索主题的正确分析得到。n选选词词过过程程中中还还经经常常会会遇遇到到不不能能直直接接查查到到所所需需文文献献的的词词,这这中间就需要有一个转变过程。中间就需要有一个转变过程。n例例如如:检索COBOL语言设计课题,若不加分析就选用“COBO
11、L language design”,则必然碰壁。而通过正确分析理解就会知道COBOL语言是一种用来编制计算机程序的语言,所以应先确定检索词为“计算机程序语言(computer programming languages)”,然后再进一步与COBOL组配,定能得到满意结果。n此此种种选选词词法法可可促促使使科科技技人人员员对对主主题题词词表表的的主主题题词词结结构构及及类类型有所了解,锻炼多角度选词的能力。型有所了解,锻炼多角度选词的能力。144 4 通配符的运用通配符的运用(1 1)“?”代代表表检检索索词词中中的的一一个个汉汉字字、西西文文字字符符或或其其他字符。他字符。例如:例如:“计算
12、?计算?”,表示,表示“计算机计算机”、“计算器计算器”等词;等词;“航?器航?器”,表示,表示“航空器航空器”、“航天器航天器”等词;等词;“int?netint?net”,表表示示“internetinternet”、“intranetintranet”等词。等词。15(2 2)“#”代表检索词中的一个汉字、西文字符或其他代表检索词中的一个汉字、西文字符或其他字符,也可不代表任何汉字、西文字符或其他字符。字符,也可不代表任何汉字、西文字符或其他字符。例如:例如:“微微#机机”,表示,表示“微机微机”、“微型机微型机”等词;等词;“missile#missile#”,表示,表示“missil
13、emissile”、“missilesmissiles”等等词;词;“colo#rcolo#r”,表示,表示“colorcolor”、“colourcolour”等词。等词。16(3 3)“$”代表检索词中的任意多个汉字、西文字符或其代表检索词中的任意多个汉字、西文字符或其他字符,也可不代表任何汉字、西文字符或其他字符。他字符,也可不代表任何汉字、西文字符或其他字符。例如:例如:“网络网络$”,代表,代表“网络网络”、“网络软件网络软件”、“网络计算网络计算机机”、“网络操作系统网络操作系统”等词;等词;“electron$electron$”,代表,代表“electronelectron”、
14、“electronselectrons”、“electronicelectronic”、“electronicselectronics”等词。等词。17 “?”、“#”和和 “$”的相同点与不同点:的相同点与不同点:(1 1)“?”与与“#”均代表一个汉字、西文字符或其他字符;均代表一个汉字、西文字符或其他字符;“#”与与“$”均可以不代表任何汉字、西文字符或其均可以不代表任何汉字、西文字符或其他字他字 符,检出的词均包括词干本身。符,检出的词均包括词干本身。(2 2)不同点:)不同点:使用使用“?”,检出的词不包括词干本身;,检出的词不包括词干本身;使用使用“$”,可代表多个汉字、西文字符或
15、其他字符,可代表多个汉字、西文字符或其他字符 检出的词包括词干本身检出的词包括词干本身。18使用运算符的检索技术1.布尔逻辑检索技术2.位置检索技术3.截词检索技术4.字段限定检索技术5.原文检索技术6.扩检与缩检 19一、布尔逻辑检索技术一、布尔逻辑检索技术n在检索实际中,检索提问涉及的概念往往不止一个,而同一个概念又往往涉及多个同义词或相关词。n为了正确地表达检索提问,系统中采用布尔逻辑运算符将不同的检索词组配起来,使一些具有简单概念的检索单元通过组配成为一个具有复杂概念的检索式,用以表达用户的信息检索要求。201逻辑逻辑“与与”n含含义:检出的记录必须同时含有所有的检索词。n基本作用:基
16、本作用:一种用于交叉概念或限定关系的组配,可以缩小检索范围,有利于提高检索的专指性。n用and 或*表示例如:查找同时含有概念A 和概念B 的文献,可表 示为:“A and B”或“A*B”212逻辑逻辑“或或”n含含义:检出的记录中,至少含有两个检索词中的一个。n基本作用:基本作用:用于具有并列概念关系的组配。这种组配可以扩大检索范围,提高查全率。可以避免了命中文献的重复出现。n用OR 或“+”表示例如:例如:检索含有检索项A 或检索项B 的文献,可表 示为:“A OR B”或“A+B”223逻辑逻辑“非非”n含含义:排除含有某些词的记录的,即检出的记录中只能含有NOT算符前的检索词,但不能
17、同时含有其后的词。n基本作用:基本作用:用于从某一检索范围中排除不需要的概念。这种组配可以缩小检索范围。n用“NOT”或“-”表示,但在但在检索索时建建议使用使用NOT,以避免与,以避免与词间的分隔符的分隔符“-”混淆。混淆。例如:例如:在含有概念A 的文献集合中,排除同时含有 概念B 的文献,可表示为:“A NOT B”或 “A-B”。234运算优先级运算优先级n运算优选级顺序为(),NOT,OR,AND;n可以用括号改变它们之间的运算顺序。通常在有通常在有括号的情况下,括号内的逻辑运算先执行,有多括号的情况下,括号内的逻辑运算先执行,有多层括号时,先执行最内层的括号。层括号时,先执行最内层
18、的括号。例如:例如:(A OR D)AND B,表示先执行“A OR D”的 检索,再与B进行AND运算。245注意事项注意事项1)有的检索工具以符号形象地表达布尔检索的功能,如“+”表示逻辑与,“-”表示逻辑非。有的检索工具直接把布尔逻辑隐含在菜单中,例如,Lycos以“match all terms”表示逻辑与,以“match any term”表示逻辑或。绝大多数检索工具的高级检索完全用表格和文字来表达布尔关系,如,Excite以“必须包括(MUST contain)”表示逻辑与,用“一定不含”(MUST NOT contain)表示逻辑非。有的检索工具部分支持布尔关系,如Yahoo!尚
19、不支持逻辑非。252)用布尔逻辑表达检索要求,除要掌握检索课题的相关因素外,还应在布尔算符对检索结果的影响方面引起注意。布尔算符使用正确但却不能达到应有检索效果的例子很多。nOR逻辑 有些检索词表达的概念,存在整体与部分的关系。在检索中,这类关系如果处理不好,就不能得到满意的检索效果。对此,一般原则是,如果检索词涉及到表达整体的概念,就要针对具体情况分别列出每一个表达部分概念的检索词,否则将出现漏检。nNOT逻辑 在检索逻辑中使用NOT,能排除含有由NOT指定的检索词的文献,协助检索出更准确的文献。但是,使用NOT必须慎重。因为,如果两个关系紧密的检索词同在一个检索逻辑中,对其中一个使用NOT
20、逻辑会导致含另一个词的文献也被排除。266小结小结n检索中逻辑算符使用是最频繁的,对逻辑算符使用的技巧决定检索结果的满意程度。n用布尔逻辑表达检索要求,除要掌握检索课题的相关因素外,还应在布尔算符对检索结果的影响方面引起注意。n另外,对同一个布尔逻辑提问式来说,不同的运算次序会有不同的检索结果。布尔算符使用正确但不能达到应有检索效果的事情是很多的。27示例:使用布尔逻辑运算符示例:使用布尔逻辑运算符示例:使用布尔逻辑运算符示例:使用布尔逻辑运算符表明查询结果中必须同时包含表明查询结果中必须同时包含intelligent robot和和control表明查询结果中至少包含两个检索词中的任意一个表
21、明查询结果中至少包含两个检索词中的任意一个,intelligent robot或或control表明检索结果包含表明检索结果包含intelligent robot,但同时必须去掉和,但同时必须去掉和control相关的内容相关的内容Intelligent robot and control(intelligent robot*control)Intelligent robot or control(intelligent robot+control)Intelligent robot not control(intelligent robot-control)注:英文数据库通常用字母,中文数据
22、库要用符号。注:英文数据库通常用字母,中文数据库要用符号。28二、位置检索(邻近检索)技术二、位置检索(邻近检索)技术n表明两或多个检索词之间关系的符号。表明两或多个检索词之间关系的符号。n适用于两个检索词以指定间隔距离或者指定的顺序出现的场合。可以看成特殊功能的AND算符。AND算符不限制两个检索词的位置和出现顺序。n例如:communication AND satellite 命中的文献可能有 communication satellite;satellite communication;communicaticn devices for satellites;communicaticn
23、links without satellites;n 位置算符可以改进AND算符的这种不足,它是特殊功能的AND算符。按照两个检索词出现的顺序和距离,可以有多种位置算符,而且对同一位置算符,检索系统不同,规定的位置算符也不同。291)“(W)”n含义:“(W)”算符中的W含义为“With”。表示其两侧的检索词必须紧密相连,除开空格和标点号外,不得插入其他词或字母,两词的词序不可颠倒。其简略形式为()。n例如:communication(W)satellite communication()satellite 两者相同302)“(nw)”n“(nW)”中的“W”的含义为“Word”,它允许两词间
24、插入最多为n个其他词,包括实词和系统禁用词,词序不变。n 例如:communication(2W)satellite 则会检出 communication satellite communication though satellite communication on the satellite313)“(N)”n含义:“(N)”中的N含义为“Near”。表示其两侧的检索词必须紧密相连,除开空格和标点符号外,不得插入其他词或字母,两词的词序可以颠倒。324)“(nN)”n含含义:“(nN)”是“(N)”算符的变形,不同之处为允许两词间插入最多为n个其他词,包括实词和系统禁用词。n例如:例如:
25、COTTON(2N)PROCESSING 则命中:Cotton processing;processing of cotton;processing of Egyptian cotton335)5)“(F)(F)”同字段检索同字段检索 n 含义:含义:“(F)”算符中F的含义为“Field”。这个算符表示其两侧的检索词必须在同一个词段中出现,(例如;同在题目字段或文摘字段)词序不限,中间可插任意检索词项。n例如:例如:POLLUTION(F)CONTRON 可命中 Contron and management of industrial pollution 同在题目中(F)邻近算符与AND布尔
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精准 获取 信息 方法 编写 检索 课堂 PPT
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内