《计算机检索的基本原理及过程优秀课件.ppt》由会员分享,可在线阅读,更多相关《计算机检索的基本原理及过程优秀课件.ppt(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、计算机检索的基本原理及过程第1页,本讲稿共29页目目 录录w文献数据库的概念w文献数据库检索步骤w主题词关键词的选取w文献数据库的字段检索w检索效果评价w常用检索技术w计算机信息检索实例第2页,本讲稿共29页1 文献数据库 文献数据库是将各个学科领域、各种专业技术方面的文献信息汇集在一起,经过分门别类的组织、加工、编排后形成的数据库。它能够提供人们方便而快速地,更具针对性地查找各种文献资料的线索或者全文。文献数据库基本知识第3页,本讲稿共29页 1.1 文献数据库的类型文献数据库的类型按收录文献的类型划分按收录文献的类型划分 按提供信息的详略划分按提供信息的详略划分作者作者 关键词关键词 题名
2、题名 论文来源论文来源 文摘文摘全文+文献数据库基本知识第4页,本讲稿共29页 2、文献数据库检索步骤文献数据库检索步骤确定检索要求和目标确定检索要求和目标 拟定检索对象范围拟定检索对象范围主题主题词选择数据库及选择数据库及检索途径检索途径 实施检索并显示检索结果实施检索并显示检索结果用用检索技术检索技术优化检索结果优化检索结果 选择输出(打印、拷贝或发送至电子邮箱)选择输出(打印、拷贝或发送至电子邮箱)第5页,本讲稿共29页 2.1 2.1 选择检索词选择检索词w利用主题词表选取规范化的主题词或词组w利用印刷版的检索工具书手工试检,根据检出文献的主题词标引情况,选取合适的主题词。w选用自由词
3、由于词表规模的限制,不可能对某一专业作全面检索时,应考虑选用自由词,尽可能多地选用与课题有关的同义词,以防漏检。第6页,本讲稿共29页 检索词选取时应注意的问题检索词选取时应注意的问题避免冷僻词避免冷僻词找出隐性概念找出隐性概念使用核心概念使用核心概念注意同义词近义词词型变化注意同义词近义词词型变化第7页,本讲稿共29页 2.2 检索途径检索途径作者(文章的责任者)作者(文章的责任者)篇名(或题名)篇名(或题名)机构(如浙江工业大学)机构(如浙江工业大学)关键词(如污水处理、高层建筑)关键词(如污水处理、高层建筑)主题词(规范化的主题概念,如用激光不用雷射)主题词(规范化的主题概念,如用激光不
4、用雷射)文摘(论文或图书的摘要或内容提要)文摘(论文或图书的摘要或内容提要)引文(即参考文献)引文(即参考文献)基金(如国家自然科学基金项目)基金(如国家自然科学基金项目)刊名(期刊的名称)刊名(期刊的名称)全文(或者全记录)全文(或者全记录)第8页,本讲稿共29页w逻辑算符w位置算符w截词符w常用命令2.3 常用检索技术常用算符第9页,本讲稿共29页逻辑检索概念示意图逻辑检索概念示意图ABABABA and BA or BB not A第10页,本讲稿共29页w与、AND、*用于概念交叉和限定。起缩小检索范围和提高文献查准率的作用。w例 Solar*Energy常用算符逻辑算符常用算符逻辑算
5、符第11页,本讲稿共29页w或、OR、用于概念之间并列关系的组配。增加主题的同义词,以扩大检索范围,避免文献漏检。w例 www+internet+network常用算符逻辑算符第12页,本讲稿共29页w非、NOT、从原检索范围中剔除一部分不需要的内容。w例 EnergyNuclear除核能以外的有关能源方面的文献才被命中。常用算符逻辑算符第13页,本讲稿共29页常用算符位置算符布尔算符中的逻辑“与”只要求两个检索词必须同时出现在同一篇文献中,而没有限定算符两侧检索词之间的位置关系,有时难免造成误检。第14页,本讲稿共29页常用算符位置算符例如,查找“细菌对染料破坏”方面的文献,检索词:细菌、破
6、坏、染料逻辑“与”组配检索结果:命中同时用这三个词标引的文献有“细菌对染料的破坏”方面的文献,也会有“染料对细菌的破坏”方面的文献,要排除后一部分的文献,就需用位置算符限定词与词之间的位置关系。第15页,本讲稿共29页w(W)或()算符:“With”的缩写词序不许颠倒两词之间不许插词,只许空格或连字符号w例 CD(W)ROM 将命中 CD ROM 或 CD-ROMw solar()energy 检出 solar energy常用算符位置算符第16页,本讲稿共29页常用算符位置算符w(nW)算符:“n words”的缩写(nW)是从(W)算符引伸出来检索词之间允许插入0n个词词序不许颠倒w例 a
7、nticorrosion(1W)paint 可检出 anticorrosion paint 和 anticorrosion of paintw例 检 索“材 料 磨 损”(WEAR OF MATERIALS)方面的文献,检索式:WEAR(1W)MATERIALS第17页,本讲稿共29页常用算符位置算符w(N)算符:“Near”的缩写词序可以颠倒两词之间不许插词w例 cross(N)section 可检出 cross section 和 section cross 第18页,本讲稿共29页常用算符位置算符w(nN)算符:(nN)是从(N)算符引伸出来检索词之间允许插入0n个词词序可以颠倒第19页
8、,本讲稿共29页常用算符位置算符w(F)算符:“Field”的缩写算符两侧的检索词必须在同一字段内词序及两词间插入的词数不限w例 digital(F)computer/TI,AB第20页,本讲稿共29页常用算符位置算符w(S)算符:“Sentence”和“Sub-field”的缩写算符两侧的检索词必须在同一句子词序及两词间插入的词数不限第21页,本讲稿共29页常用算符位置算符 上述位置算符可以混合用于同一检索式中,由于检索系统是按从左到右的顺序处理检索式,因此,应将限制最严的算符放在最左边。第22页,本讲稿共29页w 非限制性截词:“?”加在词干或不完整的词上,对词的完整意义进行检索。comp
9、uter?代表 Computer,computers,computerized等w限制性截词:analy?er 命中记录中将出现analyzer 和analyser;work?命中记录中将出现,work,works,worker,workers,working常用算符截词符第23页,本讲稿共29页3、检索效率w检索系统进行检索时产生的有效结果w它直接反映了检索系统性能的好坏。w衡量检索效果的指标查全率(recall ratio)查准率(precision ratio)第24页,本讲稿共29页检索出的相关文献量数据库中的全部相关文献查全率R=x100%检索出的相关文献量检出的文献总量查准率P=x
10、100%最理想的检索结果是查全率和查准率都达到100。R100表示数据库中收录的全部相关文献都被检索出来P100表示检索出来的文献全部都是相关文献但事实上,检索中有许多因素使这个指标很难达到。第25页,本讲稿共29页R0P查全率R与查准率P的关系曲线CADBC.W.Cleverdon(英)进行Granfield试验,得出查全率R与查准率P曲线。RP之间存在着互逆关系 A点检索词数量多,泛指性强,查全率较高但查准率却非常低B点检索词专指性较强,查准率就高查全率因此降低 C,D两点两种极端的折衷。查全率一般在6070查准率一般在4050无论怎样调整检索策略和改进系统效率,都无法使P和R同时接近10
11、0。第26页,本讲稿共29页4 4、计算机检索实例、计算机检索实例课题名称:高层建筑的抗震结构设计w 课题分析该课题涉及的主要概念有:高层、建筑、抗震问题和结构设计等方面。第27页,本讲稿共29页作 业1、信息素质包括哪几个方面?2、信息检索活动的功用有哪些?3、文献按加工深度、出版形式和载体形态分别可分成哪几类?4、文献检索的工具有哪些?文献数据库可分成哪几种类型?请列举五种检索途径。5、请查询本校图书馆的馆藏目录,写出5本有关“计算机应用”或“国际贸易”的图书的索书号并简要说明索书号的构成。6、什么是检索语言,检索语言有几种?请详细列举并进行比较。7、文献检索的方法有哪些?各自的优缺点是什么?8、如何提高检索文献的效率并查全查准文献?9、检索词选取时应注意的问题有哪些?10、国际商业经济活动中应了解的信息有哪些?(非经贸专业不做)11、请说明计算机检索系统的基本原理及检索过程。12、布尔逻辑检索、截词检索、词位置检索、加权检索各举一例。13、通过浏览浙工大图书馆网页,说明图书馆的资源布局,服务项目(包括网上服务项目至少8项)并对网页加以评论(200字以上)第28页,本讲稿共29页 QQ:6464179http:/第29页,本讲稿共29页
限制150内