网络信息检索-精品文档.docx
《网络信息检索-精品文档.docx》由会员分享,可在线阅读,更多相关《网络信息检索-精品文档.docx(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、网络信息检索【关键词】网络信息信息检索搜索引擎1网络信息检索简介随着信息技术的飞速发展,信息已成为全社会的重要资源,对信息的占有程度及信息处理水平的先进程度已成为衡量一个国家或地区当代化程度的重要标志,而网络上丰富的信息在更大程度上改变了人们的工作和生活的方式。Internet是当今世界上规模最大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络,基于Internet的网络信息检索的研究,无论对研究人员还是一般用户来讲,都有着很强的现实性和实用性。1.1信息检索概念信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的经过和技术。人们获取信息源的方式主要有:传统
2、的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;联机信息检索相对于前者来讲具有实时性、完好性、分享性、广泛性等优点;网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。1.2网络信息检索的原理网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。布尔逻辑模型这是一种简单而常用的严格匹配模型。用户能够根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档构造确定查询结果。标准的布尔逻辑模型为二元逻辑,所搜索的文档要么与查询相关,要么与查
3、询无关。利用这种模型进行查询,其查询结果一般没有根据内容的相关特性排序。模糊逻辑模型它在查询结果处理中引进了模糊逻辑比拟,并且根据相关的优先次序排列查询结果,这样就能够克制布尔逻辑模型信息查询结果的无序性。概率模型它是基于贝叶斯概率原理而提出的,根据词条、文档间的内在联络,利用词条间和词条与文档间的概率相依性来进行信息检索。2搜索引擎搜索引擎是目前使用最为频繁的一种网络信息检索工具。与其他工具相比,它的检全率和检准率都比拟高,具有很强的使用价值和广泛的应用前景。2.1搜索引擎的工作原理作为一种www站点资源和其它网络资源进行组织和检索的检索工具,搜索引擎的检索机制一般包括数据采集和标引机制、数
4、据组织机制和用户检索机制,基本构成如图1所示。数据采集标引机制根据一定规律和方式对网络上www站点进行搜索,并将搜索到的www页面信息存入搜索引擎的临时数据库中。数据组织据组织机制的主要功能是对www页面信息进行整理以构成规范的页面索引,并建立相应的索引数据库。索引数据库是用户进行检索的基础,它的数据质量直接影响到检索效果,而搜索引擎的数据采集标和标引机制又是决定数据库质量的关键技术。用户检索机制帮助用户以一定方式检索引擎的索引数据库,以获得符合用户需要的www站点或页面。2.2搜索引擎的分类根据用户查找的途径划分,可将搜索引擎分为如下几种:基于关键词的搜索引擎主要通过使用自动采集软件来对网络
5、上的数据进行采集标引,建立成索引数据库。它主要采用自动搜索和标引方式来建立和维护其索引数据库,供用户查询使用。基于分类目录的搜索引擎一般依靠于根据某种分类标准进行人工编排的分类体系。联合式搜索引擎是基于关键词的搜索引擎的另外一种表现形式,是后者与基于类目的搜索引擎的一种结合。2.3搜索引擎的功能目前Internet上的搜索引擎种类繁多,固然各种搜索引擎都有本人的不同信息采集标引机制,在其他一些方面各具特色,但其基本功能却是类似的。布尔逻辑检索这一功能使得用户能使用AND、OR和NOT来进行关键词的搭配检索。模糊检索在用户进行检索的经过中,系统会对跟用户提供的关键词类似的词语进行检索,并返回包含
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网络 信息 检索 精品 文档
限制150内