文献数据库与计算机检索.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《文献数据库与计算机检索.ppt》由会员分享,可在线阅读,更多相关《文献数据库与计算机检索.ppt(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、文献数据库与计算机检索1.文献信息数据库2.计算机信息检索基础3.检索效果评价及其优化1.文献信息数据库 文献是记录知识的载体。数据库是结构化的数据集合,至少由一种文档组成并能够满足某种特定目的或特定数据处理系统需要的数据集合。当数据库记录的对象为文献信息时,就称为文献信息数据库。文献信息数据库的结构一个数据库通常由一个主文档(Master File)和若干个索引文档或称倒排文档(Inverted File)组成。文档是具有某种特征的全部记录的集合。记录是构成文档的基本单元,由各种反映 文献特征的字段组成。如一篇论文、一件专利、一本图书、一个标准的相关信息都能够成为文 档中的一条记录。字段是记
2、录的基本组成元素。一条记录的 常见字段通常包含题名字段、著者字段、主题 词字段、文献出处字段(如刊名等)多种字段。文献数据库中常见的字段和段码2022/12/11文献数据库的类型按数据库文献记载的详细度可分为书目型数据库(二次文献数据库):仅提供文献检索,读者根据其提供的线索查找文献原文。可以分为:题录型 文摘型EI SCI 中国科学引文索引文献数据库的类型按数据库文献记载的详细度可分为全文数据库:不仅提供文献的基本信息及线索,同时还提供原始文献本身的数据库。主要包括全文数据库、术语数据库、图像数据库等等。如:CNKI 万方 Elsevier IEL文献数据库的类型按数据库文献记载的详细度可分
3、为混合型数据库:数据中的数据,一部分只是提供参考数据库中的信息(文献的基本情况及线索);另一部分则可以提供全文数据库中的信息(原始文献本身)。如:EBSCO(ASPBSP)文献数据库的类型按文献数据库收录信息的学科范围可分为(1)专业性文献信息数据库(CA)(2)综合性文献信息数据库(中国期刊网)文献信息数据库的评价标准收录内容范围系统准确。揭示文献详略完备详细。更新速度快慢及时快速。检索字段多寡途径丰富。检索功能强弱高效完善。用户使用方便易学易用。维护服务质量及时到位。计算机信息检索基础计算机信息检索指利用计算机及相关软件和通信设施,对本地计算机、远程服务器及网上信息进行检索的过程或活动。随
4、着信息技术的快速发展及对各种文献信息的数字化处理,计算机文献信息检索已经成为文献信息检索的主要手段。计算机信息检索发展过程脱机检索阶段(50年代中期到60年代中期)联机检索阶段(60年代中期到70年代中期)光盘数据库检索阶段(70年代中期到80年代末)网络化检索阶段(90初年代至今)1)分析检索课题,明确检索要求(2)选择适当检索系统(数据库)(3)确定检索途径及检索词(4)构建检索提问式(5)上机检索并调整检索策略(6)输出检索结果(具体)计算机检索的一般程序计算机检索的一般程序主题分析明确检索需求及检索目标(1)检索信息的学科范围(2)检索信息的类型(3)检索的目的选择检索系统(数据库等)
5、(1)根据检索目的确定所需数据库的类型(2)根据信息需求的内容、专业范围选择数据库(3)根据记录来源选择数据库(4)根据熟悉程度选择数据库计算机检索的一般程序主题概念分析(注:是课题检索的重点和难点)检索目的(申报课题、开题报告、学术论文、成果查新、课程论文、商业需求以及其它需求类型等)文献类型(期刊论文、会议论文、科技报告、图书、专利、标准、网站等)?结果形式(全文、文摘、题录、数值、事实等)检索年限(如2000年以来的文献)语种(中文、外文;英文、日文)检索结果数量(100?50?)2.计算机检索基本技术布尔逻辑检索技术布尔检索技术是指利用布尔运算符连接各个检索词,然后由计算机进行相应逻辑
6、运算,以检索出所需信息的方法。常用算符及含义:AND(*)OR (+)NOT (-)布尔逻辑检索技术AND(*)接不相容的主题概念(或不同字段)检索结果同时出现连接的词限定,缩小范围,提高准确率。OR(+)?连接同义词,同族词,相关词检索结果至少含有其中一词或同时有扩大,检索范围,提高查全。NOT(-)缩小检索范围,起到减少文献输出量。布尔逻辑检索技术优先处理算符“()”逻辑算符OR和AND的使用方法,如果归纳成一个模式,比如有A、B、C、D四个检索词(其中A和B,C和D分别为同义概念),检索提问式为:(A OR B)AND(C OR D)即,同一组检索提问既含有OR算符,又含有AND算符,此
7、时须使用优先处理算符“()”,将OR算符前后的词放入括号中,计算机将优先运算括号内的算符。位置算符位置检索可要求检索词以用户所规定的相对位置出现。比如:以词组形式表达的概念;彼此相邻的两个或两个以上的词;被禁用词或特殊符号分隔的词以及化学分子式等。位置算符是调整检索策略的一种重要手段。输入:COMMUNICATION SATELLITE系统认为:COMMUNICATION AND SATELLITE结果:communication satellite,satellite communication,communication devices for satellite;communicatio
8、n links without satellite位置算符常用的位置算符及含义:(W)算符(WITH)表示两个检索词紧挨着,词序不能颠倒,中间不得插入其他词、字母或代码,但允许有空格或标点符号,也可用()表示。例:COMMUNICATION(W)SATELLITE (n W)算符(n WORD)表示两个检索词中间可插入n个词,但它们之间的顺序不可颠倒。(N)算符(NEAR)表示两个检索词必须相连,不得插入其他词,但词序可以颠倒。位置算符(n N)算符(n NEAR)表示两个检索词中间可以插入n个词,且词序可以颠倒。(S)算符(SUBFIELD)表示两个检索词必须出现在同一个子句子中,但两词的词
9、序和插入的词数不限。句子位置算符 (F)算符(FIELD)表示两个检索词必须同时出现在同一个字段内,但两词的词序和中间插入的词数不限。字段位置算符 (C)算符(CITATION)表示两个检索词必须出现在同一记录中,但两词的词序和所在的字段不限。(L)算符(LINK)表示两个检索词之间存在从属关系或限制关系,如果其中一个为一级主题词,另一个就为二级主题词。截词检索技术 截词检索是为扩大检索范围与增加检索结果而采用的一种检索技术。常件的截词符号及含义:“*”可代表多个字符“#”代表单个的字符一个“?”或者“n?”代表0个到9个额外的字符。加权检索技术加权检索是在检索提问式中,根据每个提问词在检索要
10、求中的重要程度,分别给予一定的加权数值加以区别,我们称这个数值为权数。同时再给出检索命中的阈值。当检索结果达到所设定的阈值时,系统将显示为命中记录。采用加权检索的目的在于提高检索结果的准确程度限制检索技术具体形式主要有:(1)字段限制检索(2)使用符号限制(3)进行范围限制(4)采用限制指令字段限制检索基本字段限制字段限制(TI,AB,DE,ID)基本字段限制的用法是在需要指定字段(题目、叙词、识别词和文摘)的检索词后加上后缀运算符“/”和段码。例如,检索策略“OPTICAL/TI AND FIBER/TI”的含义是指定在题目字段中查找含有“optical”和“fiber”两词的所有记录。字段
11、段码可以多个连用,段码之间加“,”即可。例如,检索策略“FIB?/TI,DE”的含义是指定在题目和叙词字段中查找以“fib”为词干的所有记录。字段限制检索辅助字段限制辅助字段运算符的用法是在需要指定字段的检索词(有时检索词须放在双引号内)之前加上段码和前缀运算符“=”。例如检索策略AU=“Robert,S.”的含义是在作者字段中查找含有“Robert,S.”的所有记录。下面是其他常用的辅助字段限制及其实例:指定著者单位字段 CS=SHANGHAI UNIVERSITY指定刊物名称字段 JN=APPLIED MATHEMATICS 指定语言字段 LA=ENGLISH 指定文献类型字段 DT=JO
12、URNAL3.检索式的调整检索表达式输入检索系统后,输出的检 索结果有时不一定能满足课题的要求:检出的篇 数过多,而且不相关文献 所占比例很大检出的文献数量太少,有时甚至为零,需要调整检索策略。调整检索策略对于输出篇数过多的情况a.选用了多义性的检索词;b.截词截得过短;c.输入的检索词太少;d.应该使用“与(AND)”的使用了“或(OR)”;e.优先运算符“()”使用错误。调整检索策略对于输出篇数过少的情况a.检索词拼写错误;b.遗漏重要的同义词或隐含概念;c.检索词过于冷僻具体;d.没有使用截词算符;e.位置算符和字段算符使用的过多;f.使用过多的“AND”算符。计算机检索实例检索需求查找
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文献 数据库 计算机 检索
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内