《数据库检索策略初步.ppt》由会员分享,可在线阅读,更多相关《数据库检索策略初步.ppt(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据库检索策略初步数据库检索策略初步数据库是获取文献资源的首要途径。数据库是获取文献资源的首要途径。具备一定的检索策略知识,是在数据库中具备一定的检索策略知识,是在数据库中有效查找资源的前提和保障。有效查找资源的前提和保障。不同的不同的数据库数据库,内容可能千差万别,内容可能千差万别,但它们的但它们的原理原理、结构结构以及以及检索方式检索方式是基本是基本相同的。数据库相同的。数据库检索策略检索策略是一个一般性的是一个一般性的理论,它适用于所有的数据库。理论,它适用于所有的数据库。相关基础知识:检索检索:查找所需信息或资料的过程:查找所需信息或资料的过程。策略策略:实现:实现目标目标的方案的集合
2、。的方案的集合。检索策略检索策略:为实现:为实现检索目标检索目标而制订的检而制订的检索计划和方案。索计划和方案。查全率查全率 100100查准率查准率 100100检索词相关概念:主题词主题词:表达文献主题的:表达文献主题的规范化规范化的检索词的检索词关键词关键词:表达文献主题内容的检索词:表达文献主题内容的检索词同义词同义词:概念相同的检索词:概念相同的检索词相关词相关词:有相关关系的其他检索词:有相关关系的其他检索词 上位词上位词:概念上外延更广的检索词:概念上外延更广的检索词下位词下位词:概念上外延更窄的检索词:概念上外延更窄的检索词检索项(以中国知网为例):(以中国知网为例):SU=主
3、题主题,TI=题名题名,KY=关键词关键词,AB=摘要摘要,FT=全文全文,AU=作者作者,FI=第第一责任人一责任人,AF=机构机构,JN=文献来源文献来源,RF=参考文献参考文献,YE=年年,FU=基金基金,CLC=中图分类号中图分类号,SN=ISSN,CN=统一统一刊号刊号,IB=ISBN,CF=被引频次被引频次。词频控制符:词频控制符:“$”。精确匹配:精确匹配:“=”;模糊匹配:;模糊匹配:“%”。检索项(以中国知网为例):(以中国知网为例):SU=主题主题,TI=题名题名,KY=关键词关键词,AB=摘要摘要,FT=全文全文,AU=作者作者,FI=第第一责任人一责任人,AF=机构机构
4、,JN=文献来源文献来源,RF=参考文献参考文献,YE=年年,FU=基金基金,CLC=中图分类号中图分类号,SN=ISSN,CN=统一统一刊号刊号,IB=ISBN,CF=被引频次被引频次。词频控制符:词频控制符:“$”。精确匹配:精确匹配:“=”;模糊匹配:;模糊匹配:“%”。数据库基本结构:数据库数据库是相关数据的集合,含有是相关数据的集合,含有数据数据表表、记录记录、字段字段、索引索引等各种成分。目前等各种成分。目前使用最为普遍的是关系式数据库。使用最为普遍的是关系式数据库。关系数据库关系数据库由一个或一组由一个或一组数据表数据表(简(简称表)组成。表实际上是一个二维表格,称表)组成。表实
5、际上是一个二维表格,表中的一行称为一个表中的一行称为一个记录记录,一列称为一个,一列称为一个字段字段。记录由若干个字段组成。记录由若干个字段组成。数数 据据 表表字段字段A A 字段字段B B字段字段C C记录记录001001记录记录002002记录记录003003记录记录004004记录记录005005 检索方式:主要有主要有初级检索初级检索、高级检索高级检索和和专业专业检索检索等三种。各种检索方式的功能遵循等三种。各种检索方式的功能遵循向下兼容的原则,即高级检索包含初级向下兼容的原则,即高级检索包含初级检索的全部功能,专业检索包含高级检检索的全部功能,专业检索包含高级检索的全部功能。与此相
6、应,检索方式的索的全部功能。与此相应,检索方式的功能越强,操作也越复杂。功能越强,操作也越复杂。初级检索初级检索:也称简单检索,:也称简单检索,是只有一个是只有一个检索条件检索条件,即通过单,即通过单个个检索词检索词与与检索项检索项(字段)的匹(字段)的匹配来实现资源检索的方式。配来实现资源检索的方式。高级检索高级检索:通过:通过多个条件多个条件查查找来实现资源检索的方式。较初找来实现资源检索的方式。较初级检索,高级检索可以大大提高级检索,高级检索可以大大提高数据查找的效率及准确性。数据查找的效率及准确性。高级检索高级检索:通过:通过多个条件多个条件查查找来实现资源检索的方式。较初找来实现资源
7、检索的方式。较初级检索,高级检索可以大大提高级检索,高级检索可以大大提高数据查找的效率及准确性。数据查找的效率及准确性。专业检索专业检索:用:用逻辑运算符逻辑运算符将将检索条件检索条件联结起来构造联结起来构造检索式检索式进进行检索。专业检索的功能最强、行检索。专业检索的功能最强、效率也最高。构造检索式是数据效率也最高。构造检索式是数据库检索策略的核心问题。库检索策略的核心问题。检索式检索式:全称为:全称为检索表达式检索表达式,由,由检索项检索项、检索词检索词和和逻辑运算符逻辑运算符组成。组成。它是用检索系统规定的各种算符将检它是用检索系统规定的各种算符将检索词之间的索词之间的逻辑关系逻辑关系和
8、和位置关系位置关系联接联接起来构成的计算机可以识别和执行的起来构成的计算机可以识别和执行的检索命令式。检索式构造的优劣决定检索命令式。检索式构造的优劣决定着检索的成败。着检索的成败。逻辑运算符逻辑运算符有三种:有三种:或或,符号,符号“”、“OROR”;与与,符号,符号“”、“ANDAND”;非非,符号,符号“”、“NOTNOT”。在中国知网中在中国知网中,“”、“”、“”用于用于同一检索同一检索项项内检索词的联结,内检索词的联结,“OROR”、“ANDAND”、“NOTNOT”用于用于不同检不同检索项索项之间的联结。之间的联结。使用使用“逻辑或逻辑或”的检索结果是分的检索结果是分别检索结果之
9、集的别检索结果之集的“并并”;使用使用“逻辑与逻辑与”的检索结果是分的检索结果是分别检索结果之集的别检索结果之集的“交交”;使用使用“逻辑非逻辑非”的检索结果是分的检索结果是分别检索结果之集的别检索结果之集的“差差”。使用使用“逻辑或逻辑或”的检索结果是分的检索结果是分别检索结果之集的别检索结果之集的“并并”;使用使用“逻辑与逻辑与”的检索结果是分的检索结果是分别检索结果之集的别检索结果之集的“交交”;使用使用“逻辑非逻辑非”的检索结果是分的检索结果是分别检索结果之集的别检索结果之集的“差差”。三种逻辑运算中,三种逻辑运算中,“非非”的优先的优先级最高,级最高,“与与”次之,次之,“或或”最低
10、。最低。若要改变运算顺序,则需加括号。若要改变运算顺序,则需加括号。构造检索式时,要在检索词的前构造检索式时,要在检索词的前后加上引号;后加上引号;各种各种运算符号运算符号(包括逻(包括逻辑运算符、括号、引号、空格等),辑运算符、括号、引号、空格等),都必须使用半角拉丁字符。都必须使用半角拉丁字符。基本检索步骤:分析课题,明确检索目标分析课题,明确检索目标初步拟订检索策略初步拟订检索策略实施检索实施检索,调整完善策略,调整完善策略获取目标文献获取目标文献 检索策略的内容:选择选择检索范围检索范围,即确定相关数据库。这是制订,即确定相关数据库。这是制订检索策略的第一步;检索策略的第一步;选择选择
11、检索词检索词。合理选择检索词,是制订检索策。合理选择检索词,是制订检索策略的关键和基础;略的关键和基础;选择选择检索方式检索方式。核心问题是合理构造检索式。核心问题是合理构造检索式。调整调整检索方案检索方案。根据检索结果重新选择和组配。根据检索结果重新选择和组配检索条件,提高查全率或查准率。检索条件,提高查全率或查准率。选择检索词的途径:利用各种主题词表或叙词表利用各种主题词表或叙词表利用各类词典、手册、百科全书利用各类词典、手册、百科全书等参考工具书等参考工具书利用引文珠串增长法利用引文珠串增长法选择检索词的原则:检索索词必必须是是能够正确表达文献主题内能够正确表达文献主题内容特征的容特征的
12、关键性词语关键性词语尽量使用尽量使用专指性强专指性强的检索词的检索词避免使用不能明确表达主题内容的避免使用不能明确表达主题内容的泛指泛指概念概念如分析、研究、调查、问题、如分析、研究、调查、问题、方法、作用、展望、对策等方法、作用、展望、对策等多使用多使用单词,少使用,少使用词组选择检索词的原则:检索索词必必须是是能够正确表达文献主题内能够正确表达文献主题内容特征的容特征的关键性词语关键性词语尽量使用尽量使用专指性强专指性强的检索词的检索词避免使用不能明确表达主题内容的避免使用不能明确表达主题内容的泛指泛指概念概念如分析、研究、调查、问题、如分析、研究、调查、问题、方法、作用、展望、对策等方法
13、、作用、展望、对策等多使用多使用单词,少使用,少使用词组逻辑运算符的使用:“或或”:用于:用于扩检扩检。一般用来组配同义词、。一般用来组配同义词、相关词,可增加命中量,提高查全率;相关词,可增加命中量,提高查全率;“与与”:用于:用于缩检缩检。属于。属于同时性同时性限制条件,限制条件,可以减少命中量,提高查准率;可以减少命中量,提高查准率;“非非”:用于:用于缩检缩检。属于。属于排除性排除性限制条件,限制条件,可以减少命中量,提高查准率。但是很容可以减少命中量,提高查准率。但是很容易造成大量漏检,一般不提倡使用。易造成大量漏检,一般不提倡使用。常用检索策略引文珠串增长策略引文珠串增长策略积木型
14、策略积木型策略逐次分馏策略逐次分馏策略引文珠串增长策略用课题中用课题中最专指最专指的词开始初步检的词开始初步检索,从命中的文献中选取新的检索词索,从命中的文献中选取新的检索词补充到提问式中再次检索,不断重复补充到提问式中再次检索,不断重复以上过程,最终得到所需要的各种检以上过程,最终得到所需要的各种检索词或者出现了满意的检索结果。这索词或者出现了满意的检索结果。这就如同串珍珠一样,越串越多,因此就如同串珍珠一样,越串越多,因此称之为称之为引文珠串引文珠串增长策略。增长策略。积 木 型 策 略首先将课题分解为若干部分(概念组首先将课题分解为若干部分(概念组面、概念组或概念块)分别试检,选出与面、
15、概念组或概念块)分别试检,选出与之有关的各种检索词(同义词、相关词、之有关的各种检索词(同义词、相关词、上位词、下位词等),然后将各概念组面上位词、下位词等),然后将各概念组面进行逻辑组配,构成进行逻辑组配,构成检索式检索式。这种策略类。这种策略类似于把积木块拼成一个完整的图形,因此似于把积木块拼成一个完整的图形,因此称为称为积木型积木型检索策略。检索策略。逐次分馏策略先从一个涵盖范围足够大先从一个涵盖范围足够大的的概念概念(检索词)开始检索,(检索词)开始检索,然后,逐步提高检索词的专指然后,逐步提高检索词的专指度,减少检索的度,减少检索的命中量命中量,直至,直至得到合乎要求的结果。得到合乎要求的结果。逐次分馏策略先从一个涵盖范围足够大先从一个涵盖范围足够大的的概念概念(检索词)开始检索,(检索词)开始检索,然后,逐步提高检索词的专指然后,逐步提高检索词的专指度,减少检索的度,减少检索的命中量命中量,直至,直至得到合乎要求的结果。得到合乎要求的结果。
限制150内