网络信息检索基础.ppt
《网络信息检索基础.ppt》由会员分享,可在线阅读,更多相关《网络信息检索基础.ppt(58页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、网络信息检索基础,文献学教研室 冯勤 2004.10,Internet简介,Internet历史与发展 (因特网、国际互联网) 1. ARPANet (1969年,美国国防部研制) 2. NSFNet(1985年美国国家科学基金会建立,1989年取代ARPANet) 3. Internet(1990年后迅速普及),国内与Internet直接联网的四大网络,1.中国教育科研网(CERNET) 2.中国科技网(CSTNET) 3.中国公用计算机互联网(CHINANET) 4.中国金桥信息网(CHINAGBNET) ,Internet的入网方式,1.通过局域网方式 2.通过ISP接入( ISP是提供
2、Internet入网服务的机构) 拨号接入:计算机、Modem、电话线、ISP 帐号。 (ADSL) 专线接入:租用数据专线或光缆、DDN等以及配套网络设备。,ADSL,(Asymmetrical Digital Subscriber Line,非对称数字用户环路):是一种能够通过普通电话线提供宽带数据业务的技术,是目前极具发展前景的一种接入技术。 ADSL素有“网络快车”之美誉,因其下行速率高、频带宽、性能优、安装方便、不需交纳电话费等特点而深受广大用户的喜爱,成为继Modem、ISDN之后的又一种全新的、更快捷、更高效的接入方式。,Internet 的管理,1.TCP/IP协议:是计算机网
3、络协议中最核心的两个协议。 TCP是传输控制协议,处理由于路径不同及其它可能原因造成的数据包颠倒、数据丢失、数据失真等问题。 IP是网际协议,利用路由算法解决路由选择的问题。,Internet 的管理,2.IP地址: 是Internet上每台主机和用户终端的识别标识。 IP地址在全球范围内都是唯一的。 IP地址的表示:211.83.48.13 3.域名系统(DNS): 例: 结构为:主机名.机构名.网络名.最高域名,Internet 的管理,常用网络名: com(商业机构)、edu(教育机构)、 mil(军事部门)、gov(政府部门)、 org(非盈利组织)、net(网络服务商) 最高域名:
4、cn(中国)、uk(英国)、jp(日本) 美国享有国家域名默认权。,Internet 的管理,4.客户机/服务器(client/server)模式 服务器:是指向全球Internet用户提供信息和服务的高性能计算机,包括Web服务器、邮件服务器、文件传输服务器。 客户机:是指连接在服务器上的工作站(网络终端)。客户机通过有关程序(如浏览器等)向服务器发出指令或请求,服务器进行处理后将结果返回。,Internet 提供的主要服务,电子邮件服务( E-mail) 文件传输服务(FTP) 远程登录(Telnet) 电子论坛( Electronic Forum ) 信息查询服务( Archie、Gop
5、her、WAIS,WWW),Internet 提供的主要服务,1.电子邮件服务( E-mail) E-mail地址格式: 用户名电子邮件服务器名 如: 常用电子邮件软件:Outlook Express, Eudora, Foxmail等,可管理多个邮件帐号,直接收发邮件。(将邮件pop到本地),Internet 提供的主要服务,2.文件传输服务(File Transfer Protocol,FTP) 是以其遵守的文件传输协议 FTP而命名的。 FTP是Internet上文件传输的各种规程的集合。通过FTP,用户可将本地文件上载给远程主机(upload),更多情况是从远程主机上下载 (downl
6、oad)文件。(包括文本、图像、声音、多媒体、软件或数据文件等),Internet 提供的主要服务,3.远程登录(Telnet) 是指本地计算机通过Internet访问远程计算机上的硬件资源、软件资源和信息资源的过程。对于限制公开访问的远程主机,登录时要输入用户名和密码。 随着 www的普及, Telnet已少有使用。,Internet 提供的主要服务,4.电子论坛( Electronic Forum ) 是Internet用户在网上讨论交流的一种形式,又称新闻组(Newsgroop)或专题讨论组(Usenet)。 电子公告版(Bulletin Board System,BBS)与专题讨论组功
7、能相似,但其规模小得多,且BBS上的观点只留在本地服务器上。,Internet 提供的主要服务,5.信息查询(检索)服务 在E-Mail、FTP和Telnet基础上开发的,比较知名的工具有Archie、Gopher、WAIS等,目前大多数INTERNET用户通过WWW浏览和WWW信息检索工具查询和使用网络信息资源。,WWW概述,万维网(World Wide Web,WWW) 又称环球网、全球网,起源于1989年欧洲粒子物理研究中心,采用HTTP(超文本传输协议)在Internet上提供全球范围的多媒体信息服务。 1993年1月,因特网上约有50个WWW服务器在工作,1999年高达300万个。现
8、在WWW有等同于Internet的趋势。,WWW概述,超文本(Hypertext) 包含两个含义: 其一是信息的表达形式不局限于文字,还可以是图像、动画、视频、音频、动态数据、软件等非文本文件; 其二是网页文件内部包含链接(link)。,WWW概述,超文本标记语言 (Hyper Text Markup Language,HTML)是制作Web页面的语言,用来标记网页的标题、段落、链接、字体、颜色、表格等,并由浏览器来解释这些标识。 HTML编辑器:Frontpage、DreamWeaver、Netscape Composer,统一资源定位器 (Uniform Resource Locator,
9、URL) 用来描述信息资源的类型和在网上的位置,即网址。 URL格式: ftp:/ 协议:/文件所在服务器名/目录路径和文件名,WWW概述,WWW概述,浏览器(Browser) 是使用WWW资源的客户软件。 常用的浏览器有: 网景公司的Navigator Communicator 微软公司的Internet Explorer(IE),Web检索工具,是指提供万维网信息查询的计算机系统。 工作原理: 1.信息采集:利用网络自动搜索软件Robot或Spider,以一个URL清单为向导,定期对Internet上的网页进行扫描搜索,记录下网页的有关事项。 2.数据标引:对采集到的网页信息数据, Rob
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网络 信息 检索 基础
限制150内