信息资源检索教程优秀课件.ppt
《信息资源检索教程优秀课件.ppt》由会员分享,可在线阅读,更多相关《信息资源检索教程优秀课件.ppt(53页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、信息资源检索教程第1页,本讲稿共53页第四章第四章 计算机检索技术计算机检索技术计算机检索的实质:匹配运算计算机检索的实质:匹配运算计算机检索技术计算机检索技术检索提问检索提问检索表达式检索表达式扫描、匹配扫描、匹配识别识别数据库数据库检索词的组检索词的组配技术配技术计算机检索计算机检索技术技术检索表达式的检索表达式的构成规则构成规则检检索索词词:主主题题词词、关关键键词词、名名称称、分分类类号号分分子子式式等等。检检索索表表达达式式:运运用用各各种种运运算算符符,把把检检索索词词连连接接组组配配。第2页,本讲稿共53页第四章第四章 计算机检索技术计算机检索技术布尔布尔逻辑逻辑位置位置逻辑逻辑
2、截词截词字段字段限制限制加权加权计算机检索技术计算机检索技术计算机检索技术计算机检索技术其他其他4.14.24.34.44.64.5第3页,本讲稿共53页4.1 布尔逻辑检索技术布尔逻辑检索技术布尔逻辑检索技术就是利用布尔逻辑算符进行检索项布尔逻辑检索技术就是利用布尔逻辑算符进行检索项的逻辑组配,用以表达检索者的提问概念。的逻辑组配,用以表达检索者的提问概念。布尔逻辑算符指规定检索词之间相互关系的运算符布尔逻辑算符指规定检索词之间相互关系的运算符号,在检索表达式中起着逻辑组配的作用号,在检索表达式中起着逻辑组配的作用复杂概念的复杂概念的复杂概念的复杂概念的检索式检索式检索式检索式组配检索词检索
3、词检索词检索词检索词检索词检索词检索词检索词检索词检索词检索词简 单第4页,本讲稿共53页4.1 布尔逻辑检索技术布尔逻辑检索技术常用的布尔逻辑运算符:常用的布尔逻辑运算符:逻辑逻辑“与与(AND)”逻辑逻辑“或或(OR)”逻辑逻辑“非非(NOT)”运算顺序运算顺序第5页,本讲稿共53页4.1.1 逻辑逻辑“与与”运算符运算符:AND 或或*用于交叉概念或限定关系的组配,实现检用于交叉概念或限定关系的组配,实现检索词概念范围的交集。索词概念范围的交集。表达式:表达式:A and B 或或 A*BBAndAnd两侧的检索词两侧的检索词必须同时出现在检必须同时出现在检索字段中索字段中检出同时含有检
4、索词检出同时含有检索词A和检索词和检索词B的记录的记录A第6页,本讲稿共53页4.1.1 逻辑逻辑“与与”作用作用缩小检索范围,提高查准率。缩小检索范围,提高查准率。举例举例 检索检索“人口控制人口控制”或者或者“控制人口控制人口”方面的方面的文献信息。文献信息。人口人口 and 控制控制返 回第7页,本讲稿共53页4.1.2 逻辑逻辑“或或”运算符:运算符:OR 或或+用于检索词并列关系(同义词、近义词)的用于检索词并列关系(同义词、近义词)的组配,实现检索词概念范围的并集。组配,实现检索词概念范围的并集。表达式:表达式:A or B 或或 A+BB在文献记录中只要含有检索词A和检索词B中的
5、任何一个即算命中检索出的记录含有检索词A或者检索词BA第8页,本讲稿共53页4.1.2 逻辑逻辑“或或”作用作用扩大检索范围,防止漏检,提高查全率。扩大检索范围,防止漏检,提高查全率。举例举例 检索检索“计算机计算机”方面的文献信息。方面的文献信息。计算机计算机 or 电脑电脑使用的注意事项使用的注意事项 如果检索词涉及表达整体概念,要针对具体情如果检索词涉及表达整体概念,要针对具体情况分别列出每个表达部分概念的检索词,否则将出况分别列出每个表达部分概念的检索词,否则将出现漏检。现漏检。返 回第9页,本讲稿共53页4.1.3 逻辑逻辑“非非”运算符:运算符:NOT 或或-一种排斥关系的组配,用
6、来从原来的检索范一种排斥关系的组配,用来从原来的检索范围中排除不需要的概念。围中排除不需要的概念。表达式:表达式:A not B 或或 A-BB适用于排除含有某个指定检索词的记录A检索出的记录含有检检索出的记录含有检索词索词A A,但同时不含检,但同时不含检索词索词B B第10页,本讲稿共53页4.1.3 逻辑逻辑“非非”作用作用缩小检索范围,增强检索的准确性。但使用不当,易缩小检索范围,增强检索的准确性。但使用不当,易排除有用文献信息,从而导致漏检排除有用文献信息,从而导致漏检 举例举例 检索有关能源方面的文献信息,但不包括核能。检索有关能源方面的文献信息,但不包括核能。energy not
7、 nuclear使用的注意事项使用的注意事项 两个关系紧密的检索词不宜用两个关系紧密的检索词不宜用not返 回第11页,本讲稿共53页4.1 布尔逻辑检索技术布尔逻辑检索技术优先级高优先级高优先级低优先级低NOTANDOR布尔逻辑运算符的运算顺序返 回第12页,本讲稿共53页4.2 位置逻辑检索技术位置逻辑检索位置逻辑检索 利用位置逻辑算符限定检索词之间的位置,或指定检利用位置逻辑算符限定检索词之间的位置,或指定检索词在记录中某一特定位置进行检索。位置算符又称索词在记录中某一特定位置进行检索。位置算符又称邻接运算符。邻接运算符。位置逻辑检索的作用位置逻辑检索的作用 表达各个检索词之间的顺序与相
8、对位置关系。表达各个检索词之间的顺序与相对位置关系。与布尔逻辑检索的区别与布尔逻辑检索的区别 使用布尔逻辑检索时,计算机只判断参加运算的检索词使用布尔逻辑检索时,计算机只判断参加运算的检索词在数据库记录中出现与否,不能确定检索词之间的相对在数据库记录中出现与否,不能确定检索词之间的相对位置关系。而通过与位置算符配合使用可以减少检索误位置关系。而通过与位置算符配合使用可以减少检索误差。差。第13页,本讲稿共53页4.2 位置逻辑检索技术Dialog系统中的几种位置算符系统中的几种位置算符 同词位检索同词位检索 (W)(With/Word)、)、(nW)(N)(NEAR)、()、(nN)同字段检索
9、同字段检索 (F)(Field)(L)(Link)其他位置算符其他位置算符 (S)(Subfield)(C)(Citation)第14页,本讲稿共53页4.2.1 同词位检索允许在连接的两个词之允许在连接的两个词之间最多夹入间最多夹入n n个其他单个其他单元词,只强调插入单元元词,只强调插入单元词个数没限定插入单元词个数没限定插入单元词的具体范围,同时词词的具体范围,同时词序不能颠倒序不能颠倒此算符两侧的检索词必须按输此算符两侧的检索词必须按输入时的前后顺序排列,而且所入时的前后顺序排列,而且所连接的词之间除可以有一个空连接的词之间除可以有一个空格或一个标点符号或一个链接格或一个标点符号或一个
10、链接号外不得夹有任何其他单词或号外不得夹有任何其他单词或字母字母(W)/()()(nW)举例举例举例举例严密性强严密性强严密性差严密性差第15页,本讲稿共53页4.2.1 同词位检索允许两个检索词之间最允许两个检索词之间最多可以插入多可以插入n个单词,个单词,且这两个检索词的词序且这两个检索词的词序任意任意此算符两侧的检索词必此算符两侧的检索词必须紧密相连,所连接的须紧密相连,所连接的词间不允许插入任何其词间不允许插入任何其他单词或字母,但词序他单词或字母,但词序可以颠倒可以颠倒(N)(nN)举例举例举例举例第16页,本讲稿共53页(N)举例检索式检索式 chemistry(N)physics
11、命中命中含有含有chemistry physics或或physics chemistry的文献的文献返返 回回第17页,本讲稿共53页检索式检索式 economic(2N)recovery(nN)举例命中命中含有含有economic recovery或或recovery of the economic的文献的文献返返 回回第18页,本讲稿共53页(W)/()举例检索式检索式 American()()Literature命中命中有关有关American Literature或或American,Literature的文献的文献返返 回回第19页,本讲稿共53页(nW)举例检索式检索式 knowl
12、edge(1W)economy命中命中有关有关knowledge economy或或knowledge-based economy的文献的文献返返 回回第20页,本讲稿共53页举举 例例举举 例例4.2.2 同字段检索(L)(F)表示此算符两表示此算符两侧的检索词必侧的检索词必须同时出现在须同时出现在同一字段内。同一字段内。如:篇名字段、如:篇名字段、文摘字段、叙文摘字段、叙词字段等,但词字段等,但两词的词序中两词的词序中间插入的次数间插入的次数不限。不限。表示两个检索表示两个检索词之间存在从词之间存在从属关系或限制属关系或限制关系。如果其关系。如果其中一个为一级中一个为一级主题词,另一主题词
13、,另一个就为二级主个就为二级主题词。题词。第21页,本讲稿共53页(L)举例检索式检索式 control(L)stability命中命中标题含有标题含有controlcontrol和和stabilitystability两个检索两个检索词的文献记录。词的文献记录。返返 回回第22页,本讲稿共53页(F)举例检索式检索式 economic(F)knowledge命中命中标题为标题为“the Economic Impact of the Economic Impact of Knowledge-BasedKnowledge-Based”的文献记录。的文献记录。返返 回回原因:原因:算符两侧的检索词
14、在同一标题字段中算符两侧的检索词在同一标题字段中第23页,本讲稿共53页4.2.3 其他位置逻辑检索(S)(Subfield)表示在此算副辆车的检索词必须出现在表示在此算副辆车的检索词必须出现在同一个子字段同一个子字段同一个子字段同一个子字段中,顺中,顺序不变,中间可插入词数不限。序不变,中间可插入词数不限。举例举例 (basic or cobol or pascal)()(S)()(program*or compil*)Basic(S)program*basic(S)compil*Cobol(S)program*cobol(S)compil*Pascal(S)program*pascal(S
15、)compil*第24页,本讲稿共53页4.2.3 其他位置逻辑检索(C)(Citation)表示两侧的检索词只能出现在表示两侧的检索词只能出现在同一条记录同一条记录同一条记录同一条记录中,且中,且对它们的相对位置或次序没有任何限制,作用对它们的相对位置或次序没有任何限制,作用和布尔算符和布尔算符and完全相同完全相同第25页,本讲稿共53页位置逻辑算符位置逻辑算符的优先顺序的优先顺序C(S)(N)(W)(F)4.2 位置逻辑检索技术严谨严谨宽松宽松返 回第26页,本讲稿共53页4.3 截词检索技术实质实质 截词检索就是用截词符号将检索词截断,用截词检索就是用截词符号将检索词截断,用检索词的片
16、段进行匹配运算。检索词的片段进行匹配运算。注意注意 在截断时,截断的词干不能太短,词干一在截断时,截断的词干不能太短,词干一般应在般应在3个字符以上,以免增加检索时间,个字符以上,以免增加检索时间,产生误检。产生误检。第27页,本讲稿共53页4.3 截词检索技术截词形式截词形式 按截词的字符数量按截词的字符数量有限截断、无限截断有限截断、无限截断按截词的位置按截词的位置右截断、左截断、中间截断右截断、左截断、中间截断第28页,本讲稿共53页4.3.1 按截词数量截断有限截断有限截断 指限定截去有限个字符。指限定截去有限个字符。截断符号截断符号?截断截断1个字符个字符?截断截断2个字符个字符 依
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息资源 检索 教程 优秀 课件
限制150内