网络信息检索与利用精品文稿.ppt
《网络信息检索与利用精品文稿.ppt》由会员分享,可在线阅读,更多相关《网络信息检索与利用精品文稿.ppt(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、网络信息检索与利用第1页,本讲稿共57页2/7/202316.1意义、目的、定义通过网络广泛、及时地了解外面的世界。对大学的用户来说,更重要的是及时了解有哪些网上学术资源能有利于教学、科研和学习。学习的目的是熟练掌握网上查找、利用所需文献信息的技能。定义有广义和狭义之分第2页,本讲稿共57页2/7/202326.2网上信息资源的构成p115由连接在网上的计算机中的计算机中的信息信息、网上的信息工具信息工具以及网络通信渠道网络通信渠道三方面构成。第3页,本讲稿共57页2/7/20233接上页*计算机中的数据库、电子出版物、主页信息、软件以及各种格式的文件;*信息工具包括FTP、Telnet、Em
2、ail、Gopher、Archie、WAIS、WWW浏览器、搜索引擎等提供信息交流、浏览、查询、保存、组织功能的各种工具。*网络通信渠道是指网络提供的信息交流的渠道。第4页,本讲稿共57页2/7/202346.2网上信息资源的特点p116(1)数量庞大、增长迅速(2)更新频繁、变化无常(3)多维显示、交互方便(4)良莠混杂、参差不一第5页,本讲稿共57页2/7/202356.2网络学术资源的类型按照内容区分,主要有四类.按照出版类型区分,有着与纸质型出版物类似的对应关系.按照是否具有原创性,有一次资源和二次资源的区分.第6页,本讲稿共57页2/7/20236接上页按照有否经过审核,分为正式出版
3、物和非正式出版物两种.按照是否属于搜索引擎检索范围,分为可见资源和不可见资源两类。第7页,本讲稿共57页2/7/202376.3网上信息服务功能1、基本信息服务:、基本信息服务:E-mail电子邮件FTP(FileTransferProtocol)文件传输TELNET远程登录以及基于电子邮件的一系列扩展服务,如电子公告板(BBS)、网络新闻(Usenet)等;2、网上信息查询服务、网上信息查询服务包括名录服务、索引服务和交互式信息查询服务等。第8页,本讲稿共57页2/7/202386.4网络信息利用工具的几个概念p1171、WWW浏览器是用来浏览信息的客户程序(worldwideweb全球信息
4、网)2、URL(UniformResourceLocator 统一资源定 位器)提供了一种地址寻找方式p117。3、超文本标识语言(HTML)第9页,本讲稿共57页2/7/202394 网站网站:是互联网的基本信息单元。网站的划分网站的划分:按照服务性质区分为两类:门户网站综合性(信息面广)垂直网站专业性5 网页网页:是浏览网站内容的主要形式。第10页,本讲稿共57页2/7/202310URL 的的 构构 成成URL的构成:p117通信协议通信协议:/主机主机 名名/路径路径/文件名文件名如:http:/ ftp telnet第11页,本讲稿共57页2/7/202311URL协议http:/超
5、文本传输协议ftp:/文件传输协议Gopher:/gopher服务器协议wais:/WAIS服务器协议telnet:/远程登录协议mail:/E-mail协议第12页,本讲稿共57页2/7/202312URL 主主 机机 地地 址址域名含义域名含义.acacademic学院.milMilitary军用.coCommercial商业英式.netNetwork网.comCommercial商业美式.orgNonprofit机构Organization.edueducational教育.plcPubliclimited公司Company.govgovernmental政府.schSchool学校第1
6、3页,本讲稿共57页2/7/202313URL国家地区域名域名 含义域名 含义.auAustralia.intinternational.caCanada.itIChina.jpJapan.deGerman.ruRussia.esSpain.ukUnitedKingdom第14页,本讲稿共57页2/7/2023146.5 搜索引擎搜索引擎(search engines)p119是网上信息搜索工具的通称。它可以是一个独立的门户网站,也可以是附在其他类型网站或主页上的一个搜索工具。各种搜索引擎工作过程一般包括以下三个方面:用自动搜索软件搜寻集中所有信息 将信息进行分类整理,建立搜索引擎数据库通过w
7、eb服务器端检索软件,提供信息查询的浏览器界面第15页,本讲稿共57页2/7/2023156.5.1搜索引擎的类型p119按工作方式区分:可分为:主题引擎目录引擎多元引擎第16页,本讲稿共57页2/7/202316主主 题题 引引 擎擎主题引擎又称基于Robot的搜索引擎。这种引擎的信息主要为网页.其特点是利用一个称为Robot(也叫做Spider、WebCrawler或WebWanderer)的程序自动访问Web站点,提取站点上的网页,并根据网页中的链接进一步提取其它网页,或转移到其它站点上。第17页,本讲稿共57页2/7/202317主题引擎由三个主要部分构成:Robot、Index和搜索
8、软件。主题引擎的优缺点:优点:信息量大、更新及时、无需人工干预缺点:返回信息过多,有很多无关信息,甚至有一定比例的死链接,用户必须从结果中进行筛选。第18页,本讲稿共57页2/7/202318主题引擎的代表主题引擎的代表:国外:国外:Google(http:/)Lycos(http:/)Excite(http:/)Inktomi(http:/)等国内国内:百度(http:/)OpenFind(http:/)等第19页,本讲稿共57页2/7/202319注:注:主题搜索引擎也提供分类查找途径,主题搜索引擎也提供分类查找途径,但其分类为自动分类,或是借用其但其分类为自动分类,或是借用其他目录引擎的
9、分类数据他目录引擎的分类数据(例如例如Google利用网景公司的利用网景公司的Open Directory分类分类),因而分类检索效,因而分类检索效果不如目录指南型搜索引擎。果不如目录指南型搜索引擎。第20页,本讲稿共57页2/7/202320目目 录录 引引 擎擎目录引擎又称目录指南型搜索引擎.信息大多面向网站.目录引擎的用户界面基本上都是分级结构.用户也可以利用目录引擎提供的搜索功能直接查找一个关键词,不过,由于目录引擎只在数据库保存的编辑对站点的描述中进行搜索,因此站点本身的动态变化不会反映到搜索结果中来,这也是目录引擎与主题引擎之间的一个主要区别。不少学术或研究性质的目录引擎是依靠志愿
10、者来建立和维护的。也带来了目录引擎分类质量参次不齐的问题。第21页,本讲稿共57页2/7/202321目录引擎的代表目录引擎的代表国外:Yahoo!(http:/)雅虎中国http:/ 纳纳主题引擎和目录引擎两者最主要区别:在于有无信息的人工处理过程。目录引擎的信息因为有人工处理过程,所以死链接较少、信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。而主题引擎的信息的收集和处理完全由程序软件自动进行,信息的特点正好和分类引擎相反,信息量大,更新速度略快,但死链接比例相对略高。因而主题引擎适用于专指度较高、内容要求比较新的课题。目录引擎适用于学科调研的场合。第23页,
11、本讲稿共57页2/7/202323多元搜索引擎多元搜索引擎又称元搜索引擎.多元引擎的服务方式为面向网页的全文检索.它本身没有存放网页信息的数据库。当用户查询一个关键词时,它把查询请求转换成其它数个搜索引擎能够接受的命令格式,并行地或者有选择性地访问这些搜索引擎并查询这个关键词,然后再返回给用户。第24页,本讲稿共57页2/7/202324严格意义上来讲,多元搜索引擎只能算是一种用户代理,而不是真正的搜索引擎。多数多元搜索引擎都只能访问少数几个搜索引擎,而且不支持这些搜索引擎的高级搜索功能,在处理逻辑查询时也常常会出现错误,这些是多元搜索引擎的缺点。第25页,本讲稿共57页2/7/202325多
12、元搜索引擎的代表国外:C4(http:/)Dogpile(http:/)Profusion(http:/)InfoMarket(http:/)等国内:万纬(http:/)等第26页,本讲稿共57页2/7/2023266.5.1搜索引擎的类型按检索语言区分:按分类(目录分类)建立索引:(人工)雅虎分类按关键词建立索引:(自动)Google第27页,本讲稿共57页2/7/202327按工作语种区分:可分为中西文(国内、国外)二种搜索引擎;按检索内容区分:以提供信息服务为主,具有门户网站性质的搜索引擎;专门以检索人名为目的的搜索引擎;第28页,本讲稿共57页2/7/2023286.5.2搜索引擎的使
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网络 信息 检索 利用 精品 文稿
限制150内