精准获取信息的方法——编写检索式ppt课件.ppt
《精准获取信息的方法——编写检索式ppt课件.ppt》由会员分享,可在线阅读,更多相关《精准获取信息的方法——编写检索式ppt课件.ppt(74页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精准获取信息的方法编写检索式我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物主要内容主要内容n为什么要精准获取信息为什么要精准获取信息n检索策略和步骤检索策略和步骤n如何编写检索式如何编写检索式n搜索引擎中的检索式搜索引擎中的检索式我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物为什么要精准获取信息为什么要精准获取信息保证检索的全面性保证检索的全面性 不仅要广泛查阅自己特定范围内的国内外有关研究成果,而且要把视野放宽,广
2、泛测览特定范围以外的有关研究成果。不仅要搜集与自己观点一致的材料,也要搜集那些与自己观点不一致,或与自己构思相矛盾的资料。不仅要广泛查阅中文资料,同时也应查阅外文资料,以便及时掌握最新的研究资料和动向特别是要着力搜集第一手资料,以保证研究的客观全面。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物保证检索的准确性保证检索的准确性 通过细读,基本掌握若干年来所研究的领域内讨论过的问题,分歧意见,代表人物和主要著作,主要倾向。要认真推敲观点和论据,并做好记录。 从前人分歧矛盾中发现问题:从前人分歧矛盾中发现问题
3、: (1)前人的结论可能是正确的,但论据不充分;结论可能是错误的,但研究过程或研究方法可能有启发; (2)前人的争论焦点,可能是问题的关键所在,也可能只在表面现象上争吵不休,并未触及问题的实质; (3)前人的理论依据及史料依据,可能是准确无误十分丰富,也可能是篡改文献,贫乏薄弱得不足为据。我们要通过细致查阅,搞清来龙去脉。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物检索效果评价检索效果评价 n查全率查全率是指检索出的相关文献量占系统中所有相关是指检索出的相关文献量占系统中所有相关文献总量的百分比,用来反
4、映检索的全面性。文献总量的百分比,用来反映检索的全面性。n查准率查准率是指检索出的相关文献量占所有检出文献总是指检索出的相关文献量占所有检出文献总量的百分比,用来反映检索的准确性。量的百分比,用来反映检索的准确性。 查全率查全率P=a/(a+c)100%P=a/(a+c)100% 查准率查准率R=a/(a+b)100%R=a/(a+b)100% R R:表示查全率;:表示查全率; P P:表示查准率;:表示查准率; a a:检出的相关文献量为;:检出的相关文献量为; b b:检出的非相关文献量;:检出的非相关文献量; c c:系统中未检出的相关文献量。:系统中未检出的相关文献量。我吓了一跳,蝎
5、子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物n查全率的互补数就是漏检率查全率的互补数就是漏检率n查准率的互补数就是误检率。查准率的互补数就是误检率。 n查全率和查准率也是互补的关系。查全率和查准率也是互补的关系。在一个特定的检索在一个特定的检索系统中,当查全率不断提高的同时,查准率就会降低,系统中,当查全率不断提高的同时,查准率就会降低,而当查准率提高的同时,查全率又会降低。但当查全而当查准率提高的同时,查全率又会降低。但当查全率和查准率都很低的时候,两者可以通过检索策略的率和查准率都很低的时候,两者可以通过检索策略
6、的改善同时得到提高。改善同时得到提高。 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物检索课题检索课题主题分析主题分析选择数据库选择数据库确定检索词确定检索词制定检索式制定检索式计算机处理计算机处理 数据库数据库原文原文标引标引 结果评价结果评价用户用户词表词表检索步骤检索步骤NY结结果果返返回回构造检索策略构造检索策略我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物制定检索策略制定检索策略 n什么是检索式什么是检索式
7、 检索式:检索式是指计算机检索中用来表达用户检索提问检索式:检索式是指计算机检索中用来表达用户检索提问的逻辑表达式,由的逻辑表达式,由检索词检索词、检索算符检索算符以及系统规定的以及系统规定的其他其他连接符号连接符号等构成等构成n运算符运算符 又称逻辑算符,是表达检索词之间逻辑关系和限制关系的又称逻辑算符,是表达检索词之间逻辑关系和限制关系的运算符号,它是复合检索式中必不可缺的构件。包括逻辑运算符号,它是复合检索式中必不可缺的构件。包括逻辑算符、截词符、位置算符等字段检索算符、截词符、位置算符等字段检索我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉
8、快,证实我的猜测没有错:表里边有一个活的生物编制检索式编制检索式n用逻辑算符说明词间的逻辑关系用逻辑算符说明词间的逻辑关系n用位置算符指定词间的位置关系用位置算符指定词间的位置关系n用截词符描述词尾变化用截词符描述词尾变化n检索字段检索字段n分析检索结果,调整检索式,直至满意分析检索结果,调整检索式,直至满意 试解释检索式:试解释检索式:S (speckle and nondestruc? (w) test?) /ab,ti,de我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物检索词的选定确定检索词的基本准
9、则确定检索词的基本准则n必须能正确反映检索要求;必须能正确反映检索要求; n必须符合数据库的检索用词规则;必须符合数据库的检索用词规则; n优先选用具有检索意义学科名词术语;优先选用具有检索意义学科名词术语; n多选常用的基本词汇进行组配。多选常用的基本词汇进行组配。 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 进行文献的主进行文献的主题分析,包括审读题分析,包括审读文献,划分主题类文献,划分主题类型和分析主题结构,型和分析主题结构,选直接表达文献主选直接表达文献主题概念的词表中的题概念的词表中的正式
10、专指叙词;正式专指叙词;要利用概念之间的属种关系和相关关系增加检索线索选择主题词要领选择主题词要领把握概念的含义注意利用词表 属种关系又称上下位关属种关系又称上下位关系,包括概念是属概念,被系,包括概念是属概念,被包括的概念是种概念。利用包括的概念是种概念。利用属概念扩大检索途径,可提属概念扩大检索途径,可提高查全率,利用种概念缩小高查全率,利用种概念缩小查找范围,可提高查准率。查找范围,可提高查准率。 相关关系指属种关系以相关关系指属种关系以外的具有交叉、并列、对立外的具有交叉、并列、对立关系的概念,以及形式与内关系的概念,以及形式与内容、本质与现象、原因与结容、本质与现象、原因与结果等关系
11、。善于利用这些关果等关系。善于利用这些关系,有利于提高查全率。系,有利于提高查全率。 词表词表是文献检索是文献检索的重要辅助工具,使用的重要辅助工具,使用时要注意从多角度查词,时要注意从多角度查词,要充分利用辅助表。当要充分利用辅助表。当查不到与某个具体概念查不到与某个具体概念相对应的专指叙词时,相对应的专指叙词时,可以把该概念分解为几可以把该概念分解为几个较一般的概念个较一般的概念( (外延外延相对宽的相对宽的) ),然后再去,然后再去查表。查表。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物1 1 直
12、接选词法直接选词法n当检索题目中使用的自由词与规范词相一致时,可直接选当检索题目中使用的自由词与规范词相一致时,可直接选取。取。n例如:例如: “ “光缆光缆(optical fiber)”(optical fiber)”、 “ “计算机辅助设计计算机辅助设计(computer aided design)”(computer aided design)”等,这等,这些词属于范围大、命中率高的选词,检索人员可直接进行些词属于范围大、命中率高的选词,检索人员可直接进行检索。这种方法的结果最为接近主题。检索。这种方法的结果最为接近主题。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美
13、丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物2 2 专指选词法专指选词法n选用专指性强的主题词越多,则检出的文献针对性越强,选用专指性强的主题词越多,则检出的文献针对性越强,查准率就越高。查准率就越高。n突出检索主题的深度。突出检索主题的深度。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物3 3 转换选词法转换选词法n检索词的确定必须经过对检索主题的正确分析得到。检索词的确定必须经过对检索主题的正确分析得到。n选词过程中还经常会遇到不能直接查到所需文献的词,这选词过程中还经常会
14、遇到不能直接查到所需文献的词,这中间就需要有一个转变过程。中间就需要有一个转变过程。n例如:例如:检索COBOL语言设计课题,若不加分析就选用“COBOL language design”,则必然碰壁。而通过正确分析理解就会知道COBOL语言是一种用来编制计算机程序的语言,所以应先确定检索词为“计算机程序语言(computer programming languages)”,然后再进一步与COBOL组配,定能得到满意结果。n此种选词法可促使科技人员对主题词表的主题词结构及类此种选词法可促使科技人员对主题词表的主题词结构及类型有所了解,锻炼多角度选词的能力。型有所了解,锻炼多角度选词的能力。我吓
15、了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物4 4 通配符的运用通配符的运用(1 1) “ “?”?”代表检索词中的一个汉字、西文字符或其代表检索词中的一个汉字、西文字符或其他字符。他字符。 例如:例如: “ “计算?计算?”,表示,表示“计算机计算机”、“计算器计算器”等词;等词; “航?器航?器”,表示,表示“航空器航空器”、“航天器航天器”等词;等词; “ “int?net”int?net”,表示,表示“internet”internet”、 “ “intranet”intranet”等词。等词。我吓
16、了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物(2 2)“#”#”代表检索词中的一个汉字、西文字符或其他代表检索词中的一个汉字、西文字符或其他字符,也可不代表任何汉字、西文字符或其他字符。字符,也可不代表任何汉字、西文字符或其他字符。 例如:例如:“微微# #机机”,表示,表示“微机微机”、“微型机微型机”等词;等词;“missile#”missile#”,表示,表示“missile”missile”、 “ “missiles”missiles”等等词;词;“colo#r”colo#r”,表示,表示“colo
17、r”color”、 “ “colour”colour”等词。等词。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物(3 3)“$”$”代表检索词中的任意多个汉字、西文字符或其代表检索词中的任意多个汉字、西文字符或其他字符,也可不代表任何汉字、西文字符或其他字符。他字符,也可不代表任何汉字、西文字符或其他字符。 例如:例如:“网络网络$”$”,代表,代表“网络网络”、“网络软件网络软件”、“网络计算网络计算机机”、“网络操作系统网络操作系统”等词;等词;“electron$”electron$”,代表代表“e
18、lectron”electron”、 “ “electrons”electrons”、 “electronic”electronic”、 “ “electronics”electronics”等词。等词。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 “?” “?” 、 “ “#” #” 和和 “ “$”$”的相同点与不同点:的相同点与不同点:(1 1)“?”与与“#”#”均代表一个汉字、西文字符或其他字符;均代表一个汉字、西文字符或其他字符; “ “#”#”与与“$”$”均可以不代表任何汉字、西文字符或
19、其均可以不代表任何汉字、西文字符或其他字他字 符,检出的词均包括词干本身。符,检出的词均包括词干本身。(2 2)不同点:)不同点: 使用使用“?”,检出的词不包括词干本身;,检出的词不包括词干本身; 使用使用“$”$”,可代表多个汉字、西文字符或其他字符,可代表多个汉字、西文字符或其他字符 检出的词包括词干本身检出的词包括词干本身。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物使用运算符的检索技术布尔逻辑检索技术位置检索技术截词检索技术字段限定检索技术原文检索技术扩检与缩检 我吓了一跳,蝎子是多么丑恶和恐
20、怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物一、布尔逻辑检索技术一、布尔逻辑检索技术n在检索实际中,检索提问涉及的概念往往不止一个,而同一个概念又往往涉及多个同义词或相关词。n为了正确地表达检索提问,系统中采用布尔逻辑运算符将不同的检索词组配起来,使一些具有简单概念的检索单元通过组配成为一个具有复杂概念的检索式,用以表达用户的信息检索要求。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物1 逻辑逻辑“与与”n含义:含义:检出的记录必须同时含有所有
21、的检索词。n基本作用:基本作用:一种用于交叉概念或限定关系的组配,可以缩小检索范围,有利于提高检索的专指性。n用and 或*表示例如:查找同时含有概念A 和概念B 的文献,可表 示为:“A and B”或“A*B”我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物2 逻辑逻辑“或或”n含义:含义:检出的记录中,至少含有两个检索词中的一个。n基本作用:基本作用:用于具有并列概念关系的组配。这种组配可以扩大检索范围,提高查全率。可以避免了命中文献的重复出现。n用OR 或“+”表示例如:例如:检索含有检索项A 或检
22、索项B 的文献,可表 示为:“A OR B”或“A+B”我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物3 逻辑逻辑“非非”n含义:含义:排除含有某些词的记录的,即检出的记录中只能含有NOT算符前的检索词,但不能同时含有其后的词。n基本作用:基本作用:用于从某一检索范围中排除不需要的概念。这种组配可以缩小检索范围。n用“NOT”或“-”表示,但在检索时建议使用但在检索时建议使用NOT,以避免与词间的分隔符以避免与词间的分隔符“-”混淆。混淆。例如:例如:在含有概念A 的文献集合中,排除同时含有 概念B 的文
23、献,可表示为:“A NOT B”或 “A-B”。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物4 运算优先级运算优先级n运算优选级顺序为(),NOT,OR ,AND ;n可以用括号改变它们之间的运算顺序。通常在有通常在有括号的情况下,括号内的逻辑运算先执行,有多括号的情况下,括号内的逻辑运算先执行,有多层括号时,先执行最内层的括号。层括号时,先执行最内层的括号。例如:例如:(A OR D) AND B,表示先执行“A OR D”的 检索,再与B进行AND运算。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么
24、把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物5 注意事项注意事项1)有的检索工具以符号形象地表达布尔检索的功能,如“+”表示逻辑与,“-”表示逻辑非。有的检索工具直接把布尔逻辑隐含在菜单中,例如,Lycos以“match all terms”表示逻辑与,以“match any term”表示逻辑或。绝大多数检索工具的高级检索完全用表格和文字来表达布尔关系,如,Excite以“必须包括(MUST contain)”表示逻辑与,用“一定不含”(MUST NOT contain)表示逻辑非。 有的检索工具部分支持布尔关系,如Yahoo!尚不支持逻辑非。我
25、吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物2)用布尔逻辑表达检索要求,除要掌握检索课题的相关因素外,还应在布尔算符对检索结果的影响方面引起注意。布尔算符使用正确但却不能达到应有检索效果的例子很多。nOR逻辑 有些检索词表达的概念,存在整体与部分的关系。在检索中,这类关系如果处理不好,就不能得到满意的检索效果。对此,一般原则是,如果检索词涉及到表达整体的概念,就要针对具体情况分别列出每一个表达部分概念的检索词,否则将出现漏检。nNOT逻辑 在检索逻辑中使用NOT,能排除含有由NOT指定的检索词的文献,协助
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精准 获取 信息 方法 编写 检索 ppt 课件
限制150内