计算机文献检索策略.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《计算机文献检索策略.ppt》由会员分享,可在线阅读,更多相关《计算机文献检索策略.ppt(65页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二节第二节 计算机文献检索策略计算机文献检索策略n n计算机文献信息检索包含计算机文献信息检索包含制定检索表达式、制定检索表达式、制定合理的检索策略、检索策略的调整制定合理的检索策略、检索策略的调整三三个过程个过程n n一、检索表达式及构成要素一、检索表达式及构成要素n n二、计算机检索策略的制定二、计算机检索策略的制定n n三、调整计算机检索策略三、调整计算机检索策略n n检索表达式的基本含义检索表达式的基本含义:检索表达式是一:检索表达式是一个既能反映检索课题内容、又能为计算机个既能反映检索课题内容、又能为计算机识别的式子,是进行计算机文献信息检索识别的式子,是进行计算机文献信息检索的依
2、据的依据n n它主要是运用各种逻运算符号、逻辑位置它主要是运用各种逻运算符号、逻辑位置符号及逻辑限制符号,把检索词连接组配符号及逻辑限制符号,把检索词连接组配起来,确定检索词之间的关系,准确表达起来,确定检索词之间的关系,准确表达检索课题的内容检索课题的内容n n构成检索表达式的基本要素构成检索表达式的基本要素n n(一)检索词(一)检索词n n(二)运算符(二)运算符n n检索词检索词:表达检索课题主题概念的名词术:表达检索课题主题概念的名词术语,包括叙词和自由词。叙词是规范词,语,包括叙词和自由词。叙词是规范词,大型数据库都有自己专用的词表,检索者大型数据库都有自己专用的词表,检索者可以从
3、选择合适的词进行检索。可以从选择合适的词进行检索。n n关键词关键词:是未经过规范化的人工语言,往:是未经过规范化的人工语言,往往是各学科通用的专业名词术语、惯用语往是各学科通用的专业名词术语、惯用语及新出现的专有名词,所以在检索时应从及新出现的专有名词,所以在检索时应从有关专业文献或专业词典中选取关键词。有关专业文献或专业词典中选取关键词。n n构成检索表达式的基本要素构成检索表达式的基本要素n n(一)检索词(一)检索词n n(二)运算符(二)运算符n n1.布尔逻辑算符布尔逻辑算符n n常用的布尔逻辑算符有三种,分别是逻辑常用的布尔逻辑算符有三种,分别是逻辑或或OR,逻辑与,逻辑与AND
4、,逻辑非,逻辑非NOT。下面。下面分别简释它们各自的含义与用法。分别简释它们各自的含义与用法。n n(1)逻辑或)逻辑或“OR”n n逻辑或逻辑或“OR”可以扩大信息的检索范围,可以扩大信息的检索范围,使用它相当于增加检索词主题的同义词与使用它相当于增加检索词主题的同义词与近义词,能提高检索的查全率。近义词,能提高检索的查全率。n n(2)逻辑与)逻辑与“AND”n n逻辑与逻辑与“AND”可以缩小信息的检索范围,可以缩小信息的检索范围,提高检索的查准率。提高检索的查准率。n n(3)逻辑非)逻辑非“NOT”n n逻辑非逻辑非“NOT”可以用来排除不希望出现的可以用来排除不希望出现的检索词,它
5、与逻辑与检索词,它与逻辑与“AND”的作用类似,的作用类似,能够缩小命中信息的范围,提高检索的查能够缩小命中信息的范围,提高检索的查准率。准率。新浪的使用(新浪的使用(http:/)搜狐的使用(搜狐的使用(http:/ n2邻近检索邻近检索n n位置检索也叫全文检索、邻近检索。所谓位置检索也叫全文检索、邻近检索。所谓全文检索,就是利用记录中的自然语言进全文检索,就是利用记录中的自然语言进行检索,词与词之间的逻辑关系用位置算行检索,词与词之间的逻辑关系用位置算符组配,对检索词之间的相对位置进行限符组配,对检索词之间的相对位置进行限制。制。n n这是一种可以不依赖主题词表而直接使用这是一种可以不依
6、赖主题词表而直接使用自由词进行检索的技术方法。不同的检索自由词进行检索的技术方法。不同的检索系统其位置算符的表示方法不尽相同,美系统其位置算符的表示方法不尽相同,美国国DIALOG 检索系统的位置算符的用法意检索系统的位置算符的用法意义如下:义如下:n n(1)(W)Withn n(W)表示该算符两侧的检索词相邻,且两者表示该算符两侧的检索词相邻,且两者之间只允许只有一个空格或标点符号,不之间只允许只有一个空格或标点符号,不允许有任何字母或词,顺序不能颠倒。允许有任何字母或词,顺序不能颠倒。(W)也可以简写为也可以简写为()。n n例如例如:Aircraft()design 可检索出含有可检索
7、出含有Aircraft design 的文献记录。的文献记录。n nComputer()aided()design 可检索出含有可检索出含有Computer aided design 的文献记录。的文献记录。n n(2)(nW)nWordsn n(nW)表示在此算符两侧的检索词之间最多表示在此算符两侧的检索词之间最多允许间隔允许间隔n 个词个词(实词或虚词实词或虚词),且两者的相,且两者的相 对位置不能颠倒。对位置不能颠倒。n n例如:例如:laser(1w)printer 可检出含有可检出含有laser printer 和和laser color printer 的文献记录。的文献记录。n
8、n(3)(N)Nearn n(N)表示该算符两侧的检索词相邻,但两者表示该算符两侧的检索词相邻,但两者的相对位置可以颠倒。的相对位置可以颠倒。n n例如:例如:computer(N)network 可检出含有可检出含有computer network、network computer 形式形式的文献记录。的文献记录。n n(4)(nN)nNearn n(nN)表示此算符两侧的检索词之间允许间表示此算符两侧的检索词之间允许间隔最多隔最多n 个词,且两者的顺序可以颠倒。个词,且两者的顺序可以颠倒。n n例如例如 computer(2N)system 可检出含有可检出含有computer syste
9、m,computer code system,n ncomputer aided design system,system using modern computer 等形式的文献记录。等形式的文献记录。n n(5)(S)Subfieldn n(S)表示其两侧的检索词必须是在文献记录表示其两侧的检索词必须是在文献记录的同一子字段中,而不限定它们在该子字的同一子字段中,而不限定它们在该子字段中的相对次序和相对位置的距离。在文段中的相对次序和相对位置的距离。在文摘字段中,一个句子就是一个子字段。摘字段中,一个句子就是一个子字段。n n例如例如computer()control(s)system 可
10、检出文可检出文摘中含有摘中含有“This paper is concerned with an application of the computer control technique in a intelligent system for testing inner walls of pipes.”这样一句话的文献记这样一句话的文献记录。录。n n这样的文献记录也是可以被检索到的这样的文献记录也是可以被检索到的“Design of a Design of a System System for Data for Data Acquisition and Acquisition and Co
11、mputer ControlComputer Control of a of a Pulmonary Physiology Lab”Pulmonary Physiology Lab”n n(6)(F)Fieldn n(F)表示其两侧的检索词必须是在文献记录表示其两侧的检索词必须是在文献记录的同一字段中,而它们在该字段中的相对的同一字段中,而它们在该字段中的相对次序和相对位置的距离不限。次序和相对位置的距离不限。n n例如:例如:water()pollution(F)control 表示在同表示在同一个字段中一个字段中(如篇名、文摘、叙词等如篇名、文摘、叙词等)同时同时含有含有water pol
12、lution 和和control 的文献记录均的文献记录均可检索出来。可检索出来。n n3截词检索截词检索n n截词检索是计算机检索系统中应用非常普截词检索是计算机检索系统中应用非常普遍的一种技术。由于西文的构词特性,在遍的一种技术。由于西文的构词特性,在 检索中经常会遇到名词的单复数形式不一致;检索中经常会遇到名词的单复数形式不一致;同一个意思的词,英美拼法不一致;词干同一个意思的词,英美拼法不一致;词干加上不同性质的前缀和后缀就可以派生出加上不同性质的前缀和后缀就可以派生出许多意义相近的词等等。许多意义相近的词等等。n n所谓截词,就是指在检索词的适当位置截所谓截词,就是指在检索词的适当位
13、置截断。不同的检索系统其截词检索的表示是断。不同的检索系统其截词检索的表示是不同的。不同的。n n例如,美国例如,美国Dialog 系统用系统用“?”表示截词符。表示截词符。有以下截词方式:有以下截词方式:n n1)后方截词后方截词n n后方截词,也称前方一致。它是将截词符后方截词,也称前方一致。它是将截词符放在一串字符的后面,用以表示以相同字放在一串字符的后面,用以表示以相同字符串开头,而结尾不同的所有词。符串开头,而结尾不同的所有词。n n后方截词又分为词尾的有限截断和词尾的后方截词又分为词尾的有限截断和词尾的无限截断两种情况。无限截断两种情况。n n(1)词尾的有限截断词尾的有限截断n
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 文献 检索 策略
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内