因特网信息检索讲稿.ppt
《因特网信息检索讲稿.ppt》由会员分享,可在线阅读,更多相关《因特网信息检索讲稿.ppt(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、因特网信息检索第一页,讲稿共四十二页哦本课内容l一、网络信息资源概述一、网络信息资源概述l二、网络信息检索二、网络信息检索l三、网络信息检索策略与技巧三、网络信息检索策略与技巧l四、网络信息检索的发展趋势四、网络信息检索的发展趋势第二页,讲稿共四十二页哦常用常用术语(一)(一)超文本超文本(Hypertext)是用超链结的方法,将各种不同空间的文字信息组织在一起的网状文本,这种文本与文本之间的链接关系就称为超链接。超文本的格式有很多,目前最常使用的是超文本标记语言(HyperTextMarkupLanguage,HTML)及富文本格式(RichTextFormat,RTF)。超媒体超媒体(Hy
2、perMedia),是超文本利用引用链接其他不同类型(内含声音、图片、动画)的文件,这些具有多媒体操作的超文本和多媒体在信息浏览环境下的结合,它是超级媒体的简称。意指多媒体超文本(MultimediaHypertext),即以多媒体的方式呈现相关文件信息。浏览器浏览器(Browser)是Web页浏览的客户应用程序,是一种在窗口环境下浏览互联网资源并获得信息的多媒体工具。有了浏览器,用户才能够在因特网的大海中航行。第三页,讲稿共四十二页哦常用常用术语(二)(二)(TCP/IP协议)TCP(TransportControlProtocol)指传输控制协议,IP(InternetProtocol)指
3、网际协议。互联网连接了世界上不同国家与地区无数不同硬件、不同操作系统与不同软件的计算机,数据在传输过程中很容易丢失或传错。为了保证这些计算机之间能够畅通无阻地交换信息,INTERNET采用统一的通信协议TCP/IP协议,它能保证数据迅速可靠传输。TCP/IP协议实际是一个协议集合。我们最常见的协议有http(超文本传输协议):WWW客户机和服务器用于在网上传输、响应用户请求的协议。第四页,讲稿共四十二页哦常用常用术语(三)(三)网络地址与域名(IP地址和DN)IP地址:互联网上连接了无数的计算机(主机),用户如何找到一个特定的主机呢?人们根据IP协议给每一个主机分配一个编码,这个编码称为IP地
4、址。它可用四组由圆点分割的数字表示。如,我校图书馆网站的IP地址:http:/210.44.146.11域名(Domainname):IP地址难于记忆,也可以用域名来表示主机。DNS:域名服务器(DomainNameServer)。第五页,讲稿共四十二页哦常用常用术语(四)(四)URL:统一资源定位符(UniformResourceLocator)WWW是World Wide Web(环球信息网环球信息网)的缩写,也可以简称为Web,中文名字为“万维网”。SMTP:简单邮件传输协议(SimpleMailTransferProtocol)SMTP是一种提供可靠且有效电子邮件传输的协议。SMTP是
5、建模在FTP文件传输服务上的一种邮件服务,主要用于传输系统之间的邮件信息并提供来信有关的通知。NNTP:网络新闻传输协议(网络新闻传输协议(Network News Transfer Protocol Overview)第六页,讲稿共四十二页哦一、网络信息资源概述一、网络信息资源概述(一)、网络信息资源网络信息资源的定义 通过计算机网络可以利用的各种信息资源的总和。即以数字化形式记录的,以多媒体形式表达的,分布式存储在网络计算机的磁介质、光介质以及各类通信介质上,并通过计算机通信方式进行传递的信息内容的集合。(载体、表达形式、组织结构、传播手段)第七页,讲稿共四十二页哦一、网络信息资源概述一、
6、网络信息资源概述(二)、网络信息资源的特点(二)、网络信息资源的特点1、信息量大、传播广泛2、信息类型多样、内容丰富3、信息时效性强、变化频繁4、信息分散无序、但关联程度高5、信息缺乏管理、良莠不齐第八页,讲稿共四十二页哦一、网络信息资源概述一、网络信息资源概述(三)、网络信息资源的类型(三)、网络信息资源的类型1、按采用的网络传输协议划分(1)WWW信息资源也称Web信息资源,采用超文本传输协议(HyperTextTransferProtocol,HTTP)在WWW客户端和服务器端之间传输,建立在超文本、超媒体等技术的基础上,集文本、图像、图形、声音等为一体,以网页的形式存在Internet
7、上。(2)Telnet信息资源是指在远程登录协议Telnet(TelecommunicationNetworkProtocol)的支持下,用户计算机经由Internet与远程计算机连接,并在权限允许的范围内检索和使用远程计算机的各种硬件、软件资源。Telnet方式是实现与远程计算机连接的最快方式。(Dialog、OCLC、OPAC)第九页,讲稿共四十二页哦一、网络信息资源概述一、网络信息资源概述(3)FTP信息资源FTP信息资源是借助于文件传输协议(FileTransferProtocol,FTP),以文件方式在联网计算机之间传输的信息资源。FTP协议的主要功能是实现文件从一个系统到另一个系统
8、的完整拷贝,资源类型广泛。(4)用户服务组信息资源 网上各种各样的用户服务组是Internet上最受欢迎的信息交流形式,包括新闻组(UsenetNewsgroup)、电子邮件组(Listserv)、邮件列表(MailingList)、专题讨论组(DiscussionGroup)等。用户服务组资源是一种最丰富、自由、最具开放性的资源,其信息交流的广泛性、直接性是其他任何类型的信息资源都无法比拟的。(论坛、邮件交流)第十页,讲稿共四十二页哦一、网络信息资源概述一、网络信息资源概述2、按信息资源组织形式划分(1)文件方式(2)超文本/超媒体方式超文本/超媒体方式是一种新型的信息组织方式,不仅注重所要
9、管理的信息本身,而且更加注重信息之间关系的建立与表示,是将网络信息按照相互关系非线性存储在节点(Node)上,节点间以链路(Link)相连,形成一个可任意连接的、有层次的、复杂的网状结构。超文本是以线性和静态的文本信息的文本为处理对象,超媒体是超文本与多媒体技术的结合,将文字、图表、声音、图像、视频等多媒体信息以超文本方式组织。(3)数据库方式(4)网站集网络信息提供、网络信息组织、网络信息服务于一体,一般综合了文件方式、超文本/超媒体方式和数据库方式来组织信息和提供信息的检索。第十一页,讲稿共四十二页哦一、网络信息资源概述一、网络信息资源概述3、按网络信息资源的内容划分、按网络信息资源的内容
10、划分(1)网络数据库)网络数据库(联机、光盘数据库)(联机、光盘数据库)(2)网络出版物)网络出版物(电子图书、电子期刊等)(电子图书、电子期刊等)(3)社会信息)社会信息(政策、新闻、娱乐信息等)(政策、新闻、娱乐信息等)(4)软件资源)软件资源(各种应用程序)(各种应用程序)(5)其他类型的信息)其他类型的信息(论坛、电子公告、网(论坛、电子公告、网络日志)络日志)第十二页,讲稿共四十二页哦二、网络信息检索二、网络信息检索l(一)、网络信息检索的定义(一)、网络信息检索的定义l狭义:是指网络信息的查找,即以Internet为检索平台和媒介,利用相应的网络检索工具或检索系统,运用一定的网络检
11、索技术与策略,从有序的网络信息集合中查出所需信息的过程。l广义:包括网络信息整序和网络信息查找。l网络信息整序是将与Internet相连的信息按一定的规则进行搜集、分析和标引,并以数据库方式、主题树方式或者其他方式组织、排序和存储。第十三页,讲稿共四十二页哦二、网络信息检索二、网络信息检索(二)、网络信息检索的特点(二)、网络信息检索的特点1、检索范围涵盖整个Internet2、传统检索方法与全新网络检索技术相结合3、用户界面友好且操作方便4、用户透明度高5、信息检索效率不高第十四页,讲稿共四十二页哦二、网络信息检索二、网络信息检索(三)、网络信息检索的一般方法(三)、网络信息检索的一般方法1
12、、浏览方式(1)随意浏览(2)分类体系浏览2、查询方式:通过输入检索条件,从大量的信息集合中检索信息的方式。第十五页,讲稿共四十二页哦二、网络信息检索二、网络信息检索(四)、网络信息检索技术(四)、网络信息检索技术1、全文检索技术 全文检索(FullTextRetrieval)技术,就是以信息资料的内容,如文字、声音、图像等为主要处理对象,而不是其外在特征来实现信息检索的技术,出现于20世纪50年代末。第十六页,讲稿共四十二页哦二、网络信息检索二、网络信息检索(四)、网络信息检索技术(四)、网络信息检索技术2、多媒体信息检索技术 (1)基于内容的图像检索技术(2)基于内容的视频检索技术(3)基
13、于内容的音频检索技术第十七页,讲稿共四十二页哦二、网络信息检索二、网络信息检索(四)、网络信息检索技术(四)、网络信息检索技术3、智能检索技术采用人工智能计算机技术进行信息检索的技术采用人工智能计算机技术进行信息检索的技术 (1)机器学习技术(2)知识发现技术(3)自然语言理解技术(4)智能代理技术第十八页,讲稿共四十二页哦二、网络信息检索二、网络信息检索(四)、网络信息检索技术(四)、网络信息检索技术4、数据挖掘技术 数据挖掘(数据挖掘(Data Mining)技术也称为数据库中的知识发)技术也称为数据库中的知识发现技术,是指从大型数据库或数据仓库中提取人们感兴趣的现技术,是指从大型数据库或
14、数据仓库中提取人们感兴趣的知识,这些知识是隐含的、事先未知的潜在有用信息,提取知识,这些知识是隐含的、事先未知的潜在有用信息,提取知识一般可表示为概念、规则、规律、模式等形式。知识一般可表示为概念、规则、规律、模式等形式。(1)Web内容挖掘(从文档内容或其描述中抽取知识)(从文档内容或其描述中抽取知识)(2)Web结构挖掘(从组织结构和连接关系中推导知识)(从组织结构和连接关系中推导知识)(3)Web使用记录挖掘(从(从Web访问记录中挖掘)访问记录中挖掘)第十九页,讲稿共四十二页哦二、网络信息检索二、网络信息检索(四)、网络信息检索技术(四)、网络信息检索技术5、自动标引和分类技术 自动标
15、引技术自动标引技术是指由计算机代替人工完成文本的内容分析,并赋予词语标识的技术,可分为抽词标引和赋词标引两种。抽词标引抽词标引:主要指利用原文本信息中的自然语言直接标引,不加任何处理。第二十页,讲稿共四十二页哦赋词标引:是指使用已建词表中的主题词(或叙词)替代文本信息中的关键词来表达文本主题内容概念的标引过程。即使用受控语词进行标引,这是一种受控语言标引。目前网上采用的是词频加权统计法(标引词=主题词+权值)自动分类技术自动分类技术:利用计算机信息技术按照一定:利用计算机信息技术按照一定的分类体系或标准进行自动分类标记,它主的分类体系或标准进行自动分类标记,它主要用于实现信息特征的聚类和归类,
16、即将具要用于实现信息特征的聚类和归类,即将具有相同或相近特征的信息对象集中在一起。有相同或相近特征的信息对象集中在一起。而将不同特征者尽可能归于不同的类别中,而将不同特征者尽可能归于不同的类别中,从而实现快速检索。(外文本预处理、文从而实现快速检索。(外文本预处理、文本表示和特征提取)本表示和特征提取)第二十一页,讲稿共四十二页哦二、网络信息检索二、网络信息检索(五)、网络信息检索工具的类型(五)、网络信息检索工具的类型1、WWW信息资源检索工具(1)网络资源指南(2)搜索引擎(3)信息门户(4)搜索软件第二十二页,讲稿共四十二页哦二、网络信息检索二、网络信息检索(五)、网络信息检索工具的类型
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因特网 信息 检索 讲稿
限制150内