《第五章因特网信息资源及其利用.ppt》由会员分享,可在线阅读,更多相关《第五章因特网信息资源及其利用.ppt(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章 因特网信息资源 及其利用第一节第一节 InternetInternet基础知识基础知识一一 InternetInternet的发展历史的发展历史lInternet就是国际计算机互联网的英文名称,也称为全球信息资源网l国际互联网是目前世界上最大、最流行的计算机网络,同时也是目前影响最大的一种全球性、开放的信息资源网。lInternet是全球计算机和计算机网络通过统一的网络通讯协议(TCP/IP协议)连接在一起的集合,计算机用户能够通过Internet共享信息资源并互通信息。l它是计算机技术和通讯技术相结合的产物,其作用主要表现在下面两方面:提供了一种便捷的信息交流和通讯的手段。提供了共享
2、信息资源。l纵观Internet的发展历程,它经历了如下三个发展阶段:1.ARPAnet的诞生2.NSFnet的出现3.现代Internet的产生l到目前为止,国内已经形成了四大互联网络:1.中国公用计算机互联网(ChinaNET)2.中国科学技术网(CSTNET)3.中国教育和科研计算机网(CERNET)4.中国金桥信息网(ChinaGBN)二、二、InternetInternet在中国在中国l我国Internet技术的发展大致可以划分为三个阶段:第一个阶段为1987年至1993年,我国的一些科研部门开展了一些和Internet联网的国际科技合作连接,开通了Internet的国际电子邮件服务
3、。第二个阶段从1994年开始,由于我国实现了和Internet的TCP/IP连接,开通了Internet的全功能服务,相继启动了数个全国范围的计算机广域网项目,从而使得Internet在国内得到了迅猛发展。第三个阶段是以Internet的商业化应用为标志。三、三、InternetInternet的几个基本概念的几个基本概念1.1.万维网(万维网(WWWWWW)lWWW是英文词组WordWideWeb的缩写,简称3W或Web,中文名字叫万维网。2.TCP/IP2.TCP/IPlInternet是一个由不同类型、不同规模的计算机网络所组成的巨大计算机网络,它是“网络之网络”,而维系Internet
4、的基础,就是TCP/IP。lTCP/IP是指一个完整的数据通信协议集,它是一族协议的代名词。TCP/IP包括两个重要协议传输控制协议TCP和网络协议IP。l简单而言,TCP/IP是一系列的协议,用于组织网络中计算机和通信设备上的信息传输与交换。3.IP3.IP地址与域名地址地址与域名地址(1 1)IPIP地址地址lInternet的计算机在通信时能够相互识别,网际互连IP协议规定没台正式入网的计算机都要有一个唯一的网络IP地址。l这个地址由四节数字组成,每节数字的取值范围从0到255,数字之间用点号“.”隔开,这四节数字又可细分为两个部分,一部分代表计算机网络的地址,另一部分代表网络中设备的地
5、址。lIP地址地址=网络号网络号+地址号地址号l任何正式加入Internet的计算机都必须有一个全世界唯一的IP地址.l接入Internet的网络根据其规模大小可分为A、B、C三类。A类网络是大型网,IP地址中的第一节表示网络地址,后三节表示网内主机地址,每个A类网络最多可容纳1600多万台设备;B类网络是中型网,IP地址中的前两节表示网络地址,后两节表示网内主机地址,每个B类网络最多可容纳6万多台设备;C类网络是小型网,IP地址中的前三节表示网络地址,最后一节表示主机地址,每个C类网络最多可容纳256台设备。如:218.197.1.8(2 2)域名地址)域名地址l由于IP地址是数字的形式,不
6、便于人们记忆。Internet就采用了域名系统DNS,依据通讯地址给每台主机起个名字,这个名字就成为域名地址。l域名地址一般由25段字符组成,中间用“.”隔开。一般结构为:host.inst.fild.stal。l其中stal是国别代码(美国无此代码),fild是网络分类代码(常用ac代表学术,com代表商用,edu代表教育等),inst代表单位或子网代码,host是主机或服务器代码。l例如。4.4.统一资源定位符(统一资源定位符(URLURL)l为了使连如Internet的计算机在查询信息时,特别在通过Web浏览器查询信息时,有一个标准的资源地址访问方法,人们开发了一种软件工具,称为统一资源
7、定位符URL。l对于用户而言,URL是一种统一格式的Internet信息资源地址表达方法,它将Internet提供的各类服务统一编址,以便用户通过Web客户程序进行查询。lURL在格式上可以分成以下三个基本部分:信息服务类型:信息服务类型:/信息资源地址信息资源地址/文件路径文件路径l例如URL地址http:/ InternetInternet提供的主要资源提供的主要资源一、Internet信息资源lInternet信息资源有以下特点:Internet信息资源的丰富性。Internet信息资源的分散性和无序性。Internet信息资源多类型、多媒体。二、二、InternetInternet服务
8、资源服务资源1.1.远程登录远程登录(telnet)(telnet)远程登录是Internet提供的最基本的信息服务之一。要在远程计算机上登录,首先应给出远程计算机的域名或域名或IP地址地址。另外,还必须有相应的账号和口令有相应的账号和口令。一旦登录成功,用户便可以实时使用远程计算机对外开放的功能和资源,2.2.电子邮件电子邮件(Email)(Email)Internet的电子邮件服务是一种通过计算机网络与其他用户进行联系的快速、简便、高效、价廉的现代化通信手段,用户可以快速将信件发送到收信人的电子信箱中。Internet用户通过电子邮件,能够发送或接收文字、图象和语音等多种形式的信息。3.3
9、.匿名匿名FTP(AnonymousFTP(Anonymous FTP)FTP)FTP与telnet类似,也是一种实时的联机服务。在进行工作时,用户首先要登录到对方的计算机上。与远程登录不同的是,登录后,用户只能进行与文件搜索和文件传送等有关的操作。使用FTP几乎可以传送任何类型的文件,如文本文件、二进制文件、图象文件、声音文件、数据压缩文件等。4.文档服务器(Archie)Archie是Internet上用来查找其标题满足特定条件的所有文档的自动搜索服务工具。Archie文档搜索系统是检索匿名FTP资源的工具。5.地鼠(Gopher)Gopher采用多级菜单界面,查找Gopher就像查找磁盘
10、的子目录一样,只要一级一级的查下去,总会查到所需要的信息。6.6.万维网万维网(WWW)(WWW)WWW服务是一种基于超文本的多媒体信息服务。虽然WWW服务在1990年左右才开始出现,但是它的增长十分惊人,以至很多人认为WWW信息服务就是Internet的全部或代名词。7.7.网络新闻论坛网络新闻论坛(UsernetUsernet)网络新闻论坛是具有共同爱好的Internet用户相互交换意见的一种无形的用户交流系统,它相当于一个全球范围的电子公告牌系统。网络新闻是按照不同的专题组织的。8.8.电子公告牌电子公告牌(BBS)(BBS)第三节搜索引擎一、搜索引擎概述l搜索引擎使用自动索引软件来发现
11、、收集并标引网页,建立数据库;以Web形式提供给用户一个检索界面,供用户输入检索关键词、词组或短语等检索项;代替用户在数据库中找出与提问匹配的记录,并返回结果且按相关度排序输出。l搜索引擎的特点是:由自动索引软件生成数据库,收录、加工信息的范围广、速度快,能及时地向用户提供新增信息。检索时直接输入关键词或词组、短语,无需判断类目归属,比较方便。二、搜索引擎的类型1.以分类目录为主的搜索引擎2.以全文检索为主的搜索引擎3.多元搜索引擎Internet庞大的信息,使得任何孤立的搜索引擎都无法单独覆盖,而建立在搜索引擎之上的搜索引擎,通常称为多元搜索引擎,由于它可以调用其他搜索引擎,从而在一定程度上
12、能够满足更多、更快的获得网络信息的要求。4.All-in-One集成搜索All-in-One集成搜索是指只要通过一个网站,即可选择多个搜索引擎依次进行搜索。这与多元搜索引擎的工作方式有些相似,只是多元搜索引擎只要一次性输入检索要求,就可以同时让多个搜索引擎一起或分别进行搜索,并对搜索结果进行分析整理;而All-in-One通常是逐一输入检索要求(可以相同,也可以不相同),然后从搜索引擎列表中每次选择一个进行检索,一般不对搜索结果进行处理。在很多场合,多元搜索引擎被视为All-in-One集成搜索的一部分。5.特殊用途的搜索引擎三、搜索引擎的检索方式与技术1.检索方式搜索引擎一般设有简单检索与高
13、级检索两种检索方式。2.检索技术(1)布尔逻辑检索(booleanlogic)(2)邻近检索(proximitysearch)(3)截词检索(truncation/wildcats)(4)字段限制检索(fieldlimiting)l一篇记录中主要用来表示文献内容特征的字段为基本索引字段(basicindexfields),如篇名字段、文摘字段、叙词字段、自由词字段;而表达文献外部特征的字段称为辅助索引字段(additionalindexfields),包括著者字段、著者机构字段、文献类型字段、语种字段等。(5)短语检索(phrasesearch)短语用“”表示,检索出与“”内容形式完全相同的短
14、语,以提高检索的精度和准确度,因而也有人称之为“精确检索”(exactsearch)。(6)括号检索(parentheses)用于改变运算的先后次序,括号内的运算优先进行。(7)自然语言检索(naturallanguagesearch)即直接采用自然语言中的字、词、句进行提问式检索,同一般口语一样。如WhoisGeorgeW.Bush?WhatisInternet?这种基于自然语言的检索方式又被称为“智能检索”(intelligentsearch),特别适合不太熟悉网络信息检索技术的人士使用。(8)多语种检索(multilingualsearch)提供多种语言的检索环境供用户选择,系统按用户选
15、取的语种进行检索并反馈结果.(9)模糊检索(fuzzysearch)又称概念检索。当我们输入一个检索词时,搜索引擎不仅反馈包括了该关键词的网址,同时也发来与关键词意义相近的内容。例如,我们查找“查询”一词时,模糊检索会反馈来包含了“查询”、“查找”、“查一查”、“寻找”、“搜索”等内容的网址。(10)区分大小写的检索(case-sensitive)输入时,如果用户的检索式用小写字母表示,搜索工具既匹配大写又区配小写,如china,将检索出china(瓷器),China(中国);但如果用大写字母表示,搜索工具认为用户指定了只要大写,就只会查找那些与用户键入的输入形式完全相同的结果,如China,
16、只检索出China。AltaVista等搜索引擎支持区分大小写的检索。l在实际检索中,往往将上述多种检索技术混合使用,如要查找标题中含有“网络营销”的资料,可以利用布尔逻辑运算符AND、OR和截词检索、区分大小写检索,并将检索结果限定在题名字段:ti(WebORInternetORWWW)ANDmarket*。四、搜索引擎的检索步骤第一步,选择合适的搜索引擎。收录范围。数据库容量。检索界面。更新周期。准确性。全面性。第二步,选择合适的检索入口实施检索。l搜索引擎的检索途径通常有分类和关键词两种五、搜索引擎的检索策略与技巧1.分析限定检索的主题l即要确切了解所查询的目的和要求,确定需要的信息类型
17、、查询方式、查询范围、查询时间等。2.选择合适的检索工具l选择合适的检索工具主要从工具的类型、收录范围、检索问题的类型、检索具体要求等方面综合考虑。3.抽取适当的关键词应尽量选专指词、特定概念或专业术语作关键词,避免普遍词和太泛指的词。像计算机、互联网、中国、世界等词,太多太泛,用于作关键词,会反馈数以万计的检索结果,失去检索意义,被称为“禁用词”,现对关键词的选择提出以下建议:(1)使用名词或物体做关键词:(2)检索式中使用2-3个关键词;(3)使用截词检索(可检索出词根相同的词或同一词的单复数形式),如film;(4)通过OR连接同义词、近义词、相关词或同一术语的不同表达方式,如Inter
18、netORWebORwwwOR;(5)对专有名词,如人名、地名、机构名,使用大写字母指定检索如UnitedStates;(6)对固定短语,用“”括起进行短语检索,如“WorldWideWeb”,以提高检索的精度;(7)用括号将各个概念分开,如(internetORWeb)AND(search*ORretrieval*)。4.正确构造检索式构造检索式时,要充分利用搜索工具支持的检索运算(网上一流的搜索引擎几乎都支持布尔逻辑检索)、允许使用的检索标识、各种限定,这是进行有效检索的基础。5.及时调整检索策略(1)扩大检索范围l使用同义词、近义词或相关词。l使用截断技术。l利用某些搜索引擎的自动扩检功
19、能进行相关检索。l使用多个搜索引擎。l使用元搜索引擎。(2)缩小检索范围使用逻辑“与”。用布尔逻辑操作符AND(+)连接几个关键词或增加概念词。使用逻辑“非”。用布尔逻辑操作符NOT把不需要查找的关键词排除在检索结果之外。位置算符。使用邻近操作符把检索范围缩小到网页的某个部分。固定词组检索(短语检索)。使用缩写与全称。利用某些搜索引擎的进阶检索功能(Refine,Revise,Searchagain,二次检索),限制查询范围。6.加快检索速度,节省检索时间与费用(1)直接进入相关站点(2)多开几个窗口(3)只利用文本方式传输(4)使用脱机工作方式阅读(5)使用网络复制,进行适时拷贝或打印(6)
20、就近选择站点(7)择时检索7.灵活解决检索中出现的问题(1)域或服务器查找失败(Domainnameserverlookupfailed)表示浏览器不能与该域或服务器连接,或服务器找不到这个网址。应确保域名没有拼错。(2)没有反应(Noresponse)URL不正确。(3)文件找不到(Filenotfound)该页不存在,或已移到另一地址。(4)服务器出错或服务器太忙(Servererrororserverbusyerror)试图连接的计算机处于脱机状态,或毁坏、或太忙。可稍后再试。(5)不能连接站点(Canntconnectthewebsite)站点不存在或URL不正确。将URL中字母大小写
21、互换,或将URL中第一个斜线后面的部分去掉。(6)没有命中文献(NoHits)需要调整检索签略(扩大检索范围或减少检索限制)。六、常用搜索引擎简介1.Google概述(http:/)(1)功能与特点采用了先进的网页级别技术。在同一个界面下,可以定制语言和到何种网站中进行搜索。搜索结果通常会比其他搜索引擎来得更准确。在查询时,Google能够通过多个关键字,将只提供包含所有关键字的网页,其正文或指向它的链接包含所输入的所有关键字。Google是目前收集亚洲网站最多的搜索引擎之一,对中文的支持性强。Google的“手气不错”、“网页快照”和“类似网页”等功能。l(2)检索方式l在地址栏里输入WWW
22、,打开Google首页,它会根据所使用的浏览器自动出现简体中文界面,分为基本查询和高级搜索两种。3.常用中外文搜索引擎(1)中文搜索引擎l搜狐http:/l网易http:/l雅虎中文http:/l百度http:/l新浪http:/l天网http:/(2)西文搜索引擎lhttp:/lhttp:/lhttp:/lhttp:/lhttp:/lhttp:/lhttp:/第四节Internet数据库资源检索概述一、中国高等教育文献保障体系(CALIS)1.简介l中国高等教育文献保障系统(ChinaAcademicLibrary&InformationSystem,简称CALIS,http:/),是经国务
23、院批准的我国高等教育“211工程”总体规划中两个公共服务体系之一。lCALIS的宗旨是,在教育部的领导下,把国家的投资、现代图书馆理念、先进的技术手段、高校丰富的文献资源和人力资源整合起来,建设以中国高等教育数字图书馆为核心的教育文献联合保障体系,实现信息资源共建、共知、共享,以发挥最大的社会效益和经济效益,为中国的高等教育服务。l“九五”期间设在北京大学的CALIS项目管理中心联合各参建单位,建设了文理、工程、农学、医学四个全国文献信息中心,华东北、华东南、华中、华南、西北、西南、东北七个地区中心和一个东北地区国防信息中心,发展了152个高校成员馆,建立了一系列国内外文献数据库,包括联合目录数据库、中文现刊目次库等自建数据库和引进的国外数据库,采用独立自主开发与引用消化相结合的道路,开发了联机合作编目系统、联机公共检索(OPAC)系统、馆际互借与文献传递系统等,形成了较为完整的CALIS文献信息资源服务网络。2.CALIS的服务功能CALIS对读者的服务l公共检索l馆际互借l文献传递l电子资源导航CALIS对图书馆的服务l联机合作编目l文献采购协作l培训服务。l数据库服务及存档服务l技术支持3CALIS数据库提供简单查询与复杂查询两种方式。二、网上专利信息的检索二、网上专利信息的检索1.中国专利信息网(http:/)2.中国专利说明书全文检索流览(http:/
限制150内