《浅谈信息检索的方法.pdf》由会员分享,可在线阅读,更多相关《浅谈信息检索的方法.pdf(2页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 浅谈信息检索的方法 摘要:信息检索源于传统的文献检索,现在的大学生不仅要掌握传统的文献检索,还要对计算机检索这一新的检索方式有所掌握。在当今的社会竞争下,如何提高自己获取和利用信息的能力,如何更新自己的知识结构,使自己不落伍。这就使得获取知识和信息的能力成为了大学生具备的重要能力之一。所以信息检索的策略和方法就显得尤为重要。关键词:检索 策略 逻辑 加权 截词 现在的学生一说起找资料,就去图书馆借书,上网搜索,往往花费了大量的时间却发现最后找到的东西不是最符合自己想要的,所以在进行检索前要理清所找的资料是属于什么学科范围,检索的资料是什么类型的等等,在检索目的明确的前提下再开始进行检索。首先
2、是检索工具的选择,这里包括搜索引擎和数据库的合理选择。对于搜索引擎的选择现在的学生普遍都是用百度,google,其实经过使用我们会发现有时候找的内容和实际要求的内容有很大的出入,所以选择正确的搜索引擎也能提高检索的查全率和查准率。搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎、目录索引类搜索引擎和元搜索引擎。全文搜索引擎是名副其实的搜索引擎,代表性的有 Google、百度等,它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。目录索引,顾名思义就是将网站分门别类地
3、存放在相应的目录中,因此用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。元搜索引擎是一种将多个独立搜索引擎集成在一起,提供统一的检索界面,将用户的检索提问同时提交各多个独立的搜索引擎,并将检索结果一并返回给用户的网络检索工具。在检索前要考虑到不同的搜索引擎侧重点不同,选择搜索引擎的一般的规则是:如果你在找什么特殊的内容或文件,那么使用全文搜索引擎如 google,如果你想从总体上或比较全面的了解一个主题,那么使用网站分类目录如 yahoo。不同的数据库学科范围不同、检索指令不同、收费标准也不同
4、,所以数据库的选择应该有一定的针对性,选择比较熟悉的数据库,因为用户熟悉的检索环境能够帮助用户既快速又准确地查找到真正需要的资料:考虑到检索的成本问题应选择检索费用比较低廉的数据库:当用户要求检索的信息量比较少时,可以利用“数据库主题指南”查询待查主题内容的文档号码,缩小检索范围、选定数据库,也可利用系统所提供的数据库总索引文档,联机选择数据库。选择好检索工具后就要进行真正检索的过程,现在的学生发现在检索框中输 入的内容,词语的长度,个数,顺序的不同都会影响检索的结果。所以在检索的过程中怎样确定检索的内容,这些检索内容的准确表示形式都是要在检索时要考虑的,对于内容的确定可以选择专指词、特定概念
5、或专业术语作为检索词,避免普通词和太泛的词,以为词义太泛会反馈数以万计的检索结果失去了检索意义。选择的词语如人名、地名、机构名等专有名词,一般采用首字母大写方式,以此来提高信息检索的检索效率和准确性。内容确定好之后,怎样把这些词语进行组合从而提高检索的成功率呢?可以使用以下几种方法:(1)可以使用逻辑词辅助查找,常用的有:AND(和)、OR(或)、NOT(否)及 NEAR(两个单词的靠近程度),恰当应用它们可以使搜索结果非常精确。比如说想要查找关于“研究生教育”的资料,但要求不包括在职研究生,可以将提问内容表示为研究生 AND 教育 NOT在职研究生。(2)可以使用括号将搜索词分别组合,如(新
6、闻 OR 足球)AND 米兰)NOT(“新闻”OR 足球。(3)使用加权表达式,加权检索是指在检索提问中,根据每个检索词在检索要求中的重要程度,分别给予一定的数值(权值)加以区别,然后对含有这些检索词的文献进行加权计算,其和在规定的值以上,就表示找到了相应的文献。所以这种方法一般用在文献查找中。(4)使用截词表达式进行检索,表示检索词的某一部分允许有一定的变化。可用的符号有“?”、“*”等。(5)使用双引号进行精确查找,如果查找的是一个词组或多个汉字,最好的办法就是将它们用双引号括起来,这样得到的结果最少、最精确。(6)适当的名词首字母大写,多数搜索引擎对特殊名词是很敏感的,这意味着,如果你使
7、用大写的任命、地名或者其他合适的名词,将得到更好的结果。(7)根据要求选择查询方法,如果需要快速找到一些相关性比较大的信息,可以使用目录式搜索引擎的查找功能。如果想得到某一方面比较系统的资源信息,可以使用目录一级一级地进行查找。如果要找的信息比较冷门,应该用比较大的全文搜索引擎查找。(8)利用选项界定查询。目前越来越多的搜索引擎开始提供更多的查询选项,利用这些选项人们可以轻松地构造比较复杂的搜索模式,进行更为精确的查询,并且能更好地控制查询结果的显示。检索过程是+动态的随机过程,在某些检索环节中,会不可避免地产生一些和检索结果相差很多的现象,因此对检索结果进行信息反馈,进而重新修正检索表达式,实现检索表达式的优化,从而增加检索的成功率。在日常的学习和生活中,要查找的信息和资料数不胜数,选择什么要的检索方式才能提高检索的效率,是要在平时一点一滴的积累,前面介绍在检索过程中可以使用的策略和技巧只能帮助少走一点弯路,要真正快速而准确的找到资料就需要多练习,多发现,多总结。
限制150内