《信息检索技术41539.pptx》由会员分享,可在线阅读,更多相关《信息检索技术41539.pptx(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、信息检索技术与方法主讲:黄艳娟主讲:黄艳娟Tel:82519545 提 纲 信息检索方法 信息检索途径 信息检索技术 信息检索步骤 网络信息资源检索信息检索方法直接检索法间接检索法追溯检索法循环检索法顺查法倒查法抽查法间接检索方法顺查法顺查法:按时间顺序,从过去到现在,由:按时间顺序,从过去到现在,由远及近地利用检索系统进行文献信息检索远及近地利用检索系统进行文献信息检索的方法。的方法。倒查法倒查法:利用检索工具从最近期向早期查:利用检索工具从最近期向早期查找。找。抽查法抽查法:根据检索课题的特点,选择有关:根据检索课题的特点,选择有关课题的文献发表较多的年代,利用检索工课题的文献发表较多的年
2、代,利用检索工具进行重点检索的方法。具进行重点检索的方法。追溯检索法 是指不利用检索工具,而是利用文献后面所列的参考文献,逐一追查原文(被引用文献),然后再从这些原文后所列的参考文献目录逐一扩大文献的信息范围,一环扣一环地追查下去的方法。信息检索途径u责任者途径u题名途径u分类途径u主题途径u序号途径u引文途径信息检索技术 布尔逻辑检索 截词检索 邻近检索 字段限制检索 模糊检索布尔逻辑检索截词检索对于词干相同而词尾不同的词,如computer compute computing等,可以采用截词检索。Comput*截词的方式有前截断、中截断和后截断。bas?s=basis bases等 截词符
3、号有*?$#等。邻近检索邻近检索表示两词之间的位置邻近关系,常用到的位置算符有(W)(nW)(N)(nN)等 W算符是word或with的缩写,表示在此算符两侧的检索词必须按输入时的前后顺序排列,而且所连接的词之间除了有一个空格或一个标点外不得夹有其他的单词或字母。information 2W management 可包括 Information technologies and management和 Information management N 算符是near的缩写,表示在此算符两侧的检索词必须紧密相连,词序可颠倒。nN表示两检索词之间最多可以插入n个单词,且词序可颠倒。informa
4、tion N retrieval information 2N retrieval字段限制检索字段限制检索是限定检索词在数据库中出现的字段范围的一种检索方法。如:作者=张三 题名=金属热处理字段检索词模糊检索模糊检索(fuzzy search)也称概念检索。是指检索系统不仅能检索出包含指定的检索词,还将与检索词主题概念相同的信息检索出来。当输入一个只表达所要查检信息的检索词或词语,系统即可以反馈一串与此内容相近的词或词语。信息检索的步骤 课题分析课题分析 选择相关信息资源选择相关信息资源 制定检索策略,选择检索入口制定检索策略,选择检索入口 试验性检索和修改检索策略试验性检索和修改检索策略 检
5、索结果的评价检索结果的评价课题分析1 明确检索目的 *需要关于某一课题的系统详尽的信息 *需要关于某课题的最新信息 *了解一些片段信息,解决一些具体问题2 明确课题的主题或主要内容 要形成若干个既能代表信息需求又具有检 索意义的主题词(关键词),主题词(关键词),及其关系3 课题涉及的学科范围4 所需信息的数量、语种、年代范围等指标 课题一一 深潜器的发展综述深潜器的发展综述二二 我国近我国近3 3年深潜器的研究年深潜器的研究三三 哈尔滨工程大学哈尔滨工程大学20052005年发表的有关机年发表的有关机器人方面的论文器人方面的论文四四 纳米管的结构和制备纳米管的结构和制备五五 聚氯乙烯的机理及
6、应用研究聚氯乙烯的机理及应用研究选择相关信息资源是否所有与检索课题相关的信息资源都检索选择哪些学科的信息资源选择哪些语种的信息资源信息资源覆盖的年限范围信息资源的特点及针对性制定检索策略,选择检索入口检索策略是为完成检索课题,实现检索目的,对检索的全过程进行谋划之后所制定的全盘检索方案。检索式:是检索策略的逻辑表达式,是用来表达用户检索提问的,由基于检索概念产生的检索词和各种组配算符构成。(篇名篇名=深浅器深浅器 or 潜器)潜器)and 年代年代=2000-2007选择检索入口(检索途径/字段)题名责任者篇名主题词文摘关键词CNKI数据库简单检索数据库简单检索CNKI数据库高级检索数据库高级
7、检索CNKI数据库二次检索数据库二次检索试验性检索和修改检索策略无论是手工检索还是计算机检索,对于较大的检索课题,一般应先进行快速、少量的试验性检索,以检验检索策略是否合理有效。然后根据试验见过确认或修改原定的检索策略。检索结果的评价查全率:从数据库中检出的相关文献量与数据库中总文献量的比率。查准率:指数据库中检出的相关文献量与检出的文献总量的比率。查全率a/a+c100查准率a/a+b1000查全率检出的相关文献数系统中的相关文献总数查准率检出的相关文献数 检出的文献总数例题:如CNKI数据库中共有“企业管理”方面的相关文献280篇,而小李同学在CNKI数据库中只检索出160篇,而且其检索出
8、的结果中还有28篇是不相关的,那么小李这次检索的查全率和查准率各是多少?KEY查全率 47.1%查准率 82.5%索原文原文的含义如果索取原文什么是原文原文就是原始文献。相对于题名、文摘、参考文献等从不同侧面描述文献的检索标识和著录信息来说,原文就是我们所要查找的文献本身。如何索取原文通过相应的链接直接获取原文通过专门收藏机构获取原文在相应的数据库或检索系统中检索后,直接采取单篇购买方式获取全文 网络信息资源检索网络信息资源检索 网络信息资源的含义网络信息资源的含义 网络信息资源的检索工具网络信息资源的检索工具 国内外典型搜索工具国内外典型搜索工具网络信息资源的含义网络信息资源是指以电子数据的
9、形式网络信息资源是指以电子数据的形式将文本、图像、声音、动画等多种形将文本、图像、声音、动画等多种形式的信息存放在光磁等非印刷型载体式的信息存放在光磁等非印刷型载体的介质中,并通过网络通信、计算机的介质中,并通过网络通信、计算机或终端等方式再现出来的电子信息资或终端等方式再现出来的电子信息资源。源。网络信息资源的检索工具网络信息资源的检索工具FTPBBSRSS搜索引擎FTP是英文是英文File Transfer Protocol的缩写,译为的缩写,译为文件传输协议。它的主要功能就是完成从一个系文件传输协议。它的主要功能就是完成从一个系统到另一个系统的完整的文件拷贝。统到另一个系统的完整的文件拷
10、贝。BBS称为电子公告板,称为电子公告板,Bulletin Board System。它提供一块公共电子白板,每个用户都可以在它提供一块公共电子白板,每个用户都可以在上面发布信息或提出看法,具有信件交流、软上面发布信息或提出看法,具有信件交流、软件交流、信息发布等功能。件交流、信息发布等功能。RSS是简易信息聚合(是简易信息聚合(RSS:Really Simple Syndication)的英文缩写,使用)的英文缩写,使用RSS订阅功能就如同线下订阅报纸、杂志一订阅功能就如同线下订阅报纸、杂志一样,并且更加地便捷。本站每一个频道,例样,并且更加地便捷。本站每一个频道,例如新闻、个人如新闻、个人
11、Blog、论坛、黄页、分类信息、论坛、黄页、分类信息等等,都提供了等等,都提供了RSS订阅功能,使用订阅功能,使用RSS阅阅读器,例如读器,例如Foxmail 6.0以上版本,您就可以上版本,您就可以从中订阅自己感兴趣的内容。以从中订阅自己感兴趣的内容。RSS阅读器阅读器会自动收集您订阅的最新信息,保持信息内会自动收集您订阅的最新信息,保持信息内容的及时性,无需您再逐页访问网站,目标容的及时性,无需您再逐页访问网站,目标性强,为您节省宝贵的时间。性强,为您节省宝贵的时间。搜索引擎(搜索引擎(search engines)是对互联网上的信息资源进行搜集整理,然后供用)是对互联网上的信息资源进行搜集整理,然后供用户查询的系统,它包括信息搜集、信息整理和用户查询三部分。搜索引擎是一个户查询的系统,它包括信息搜集、信息整理和用户查询三部分。搜索引擎是一个为用户提供信息为用户提供信息“检索检索”服务的网站,它使用某些程序把因特网上的所有信息归服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。类以帮助人们在茫茫网海中搜寻到所需要的信息。国内外典型的搜索工具网络免费信息资源网络免费信息资源网上免费电子图书网站网上免费电子图书网站
限制150内