《第2章网络信息资源.ppt》由会员分享,可在线阅读,更多相关《第2章网络信息资源.ppt(75页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第2章章 网络信息资源网络信息资源 网络信息资源极其丰富,包罗万象,其内容涉及到所有专业领域,它是知识、信息的巨大集合,是人类的资源宝库。同时,网络的开放性与交互性使其成为全球范围内传播和交流科研信息、教育信息、商业信息和社会信息的最主要渠道。2.1网络信息资源的概念网络信息资源的概念 2.1.1 网络信息资源含义 随着互联网发展进程的加快,信息资源网络化成为一大潮流。与传统的信息资源相比,网络信息资源在数量、结构、分布和传播范围、载体形态、内涵、传递手段等方面都显示出新的特点。这些新的特点赋予了网络信息资源新的内涵。作为知识经济时代的产物,网络信息资源也称虚拟信息资源,它是以数字化形式将文
2、字、图像、声音、动画等多种形式的信息存储在光盘、磁盘等非纸张载体中,并通过网络和计算机等方式再现出来的信息资源。从信息资源建设的角度出发,网络信息资源不再是一个物理概念,也不是独立存在的实体,而是一个跨国家、跨地区的信息空间,一个网络信息资源库。2.1.1 网络信息资源含义 网络信息资源含义,从广义上说,是指网络信息活动中所有要素的总和,包括与网络相关的信息内容、信息网络、信息人才、信息系统、信息技术等资源;从狭义上说,是指以数字化形式记录的,以多媒体形式表达的,存贮在网络计算机磁介质、光介质以及各类通讯介质上的,并通过计算机网络通讯方式进行传递的信息内容的集合。2.1.2网络信息资源的特点
3、网络信息资源是一种新型数字化资源,它与传统文献信息资源相比有较大的区别,了解网络信息资源的特点,有助于人们对其利用。从信息资源检索的角度来讲,网络信息资源具有以下特点 1. 信息数量巨大而庞杂2.1.2网络信息资源的特点 据不完全统计,目前国际互联网已拥有186个国家的5万余个注册网络,2500多个数据库,而且正在以每年高于25的速度激增。网络每天发布14万件新的信息(总量约450MB),全网提供的信息总量超过20TB。无论是政府部门、专业机构、企业、研究所、社会团体,还是个人,都可以随时随地在国际互联网上发布信息。因此,成为无所不有的庞杂信息源,并具有跨地区、分布广、多语种、高度共享的特点。
4、形成了一个纷繁复杂的信息世界,给用户选择、利用网络信息带来了障碍。 2.1.2网络信息资源的特点 2. 信息无序、质量良莠不齐 由于网络的开放性、松散性,使得网络信息发布具有很大的自由度和随意性,缺少必要的质量控制和管理机制。造成网上的信息分散、无序、不规范,各种不良和无用的信息大量充斥在网络上,信息污染程度加深,信息内容繁杂、混乱,质量良莠不齐,安全存在隐患,导致网络信息来源的可靠性和检索质量受到影响,给用户选择、利用网络资源带来了障碍。2.1.2网络信息资源的特点 3. 信息类型多、范围广 网上信息资源在内容上可以说是包罗万象,覆盖了不同学科、不同领域、不同语言等。如,学术信息、商业信息、
5、政府信息、个人信息等。它一方面给用户选择提供了较大余地。在形式上可以说是种类繁多,包括文本、图像、声音、软件、数据库等,堪称多媒体、多语种、多类型的混合体。2.1.2网络信息资源的特点 4. 信息动态性高 网络环境下,信息具有高度动态性,不但各种信息处在不断生产、更新、不断淘汰的状态,它连接的网络,网站、网页也都处在变化之中,任何网站资源都有可能在短时间内建立、更新、更换地址甚至消失的可能,使得网上的信息资源瞬息万变。2.1.2网络信息资源的特点 5. 分布式、非线性 网络信息资源是以分布式数据库的形式存放在不同国家、不同地区的各种服务器上,同时利用超文本链接,按知识单元及其关系建立起来的知识
6、结构网络,而通过各种搜索引擎及检索系统使信息检索变得方便快捷。2.1.2网络信息资源的特点 6. 信息使用成本低 网络信息资源绝大部分可免费使用,用户所需支付的主要是市话费和网络费用。低费用的网络信息资源有效地刺激了用户的信息需要,从信息需要的角度也拉动了网络信息资源的有效、合理的配置。2.1.2网络信息资源的特点 7. 信息共享程度高 由于信息存储形式及数据结构具有通用性、开放性和标准化的特点,它在网络环境下,时间和空间范围得到了最大程度的延伸和扩展,用户不需排队等候就可以共享同一份信息资源。2.1.3 网络信息资源的类型 网络信息资源类型繁杂、形式多样,由于划分依据不同,其类型也就不同。下
7、面我们按照信息资源传播的范围、信息加工层次、开发主体和检索角度来对网络信息资源分别进行划分。 1. 按网络信息资源传播范围划分2.1.3 网络信息资源的类型 根据网络信息资源传播范围,可以分成光盘局域网信息、联机网络信息和Internet网络信息。 (1)光盘局域网信息资源 20世纪80年代以来,在计算机技术、激光技术和精密电子技术等现代科技成果的基础上发展起来一种新型点子出版物光盘。光盘以其存储信息密度高、容量大、读取速度快、存储的信息类型多等显著特点,深受用户的欢迎。1984年世界上第一个商品化的CD-ROM光盘数据库BIBLIOFILE(美国国会图书馆的MARC机读目录)问世。之后随着网
8、络技 2.1.3 网络信息资源的类型 术发展,特别是大容量的硬盘、光盘塔和光盘网络系统的出现和广泛应用,使光盘的多用户检索和共享成为现实。供单机使用的光盘数据库,也可以实现局域网、广域网、Internet上共享,还可以与远程联机系统联网,光盘的利用率被大大提高。 2.1.3 网络信息资源的类型 近几年来,光盘技术与光盘产品发展相当迅速,光盘数据库资源覆盖自然科学、社会科学和工程技术各个学科,其信息量巨大。利用这些数据库光盘局域网,实现局域网内共享十分有效。而且这些数据库光盘在Internet 上共享涉及版权等问题,所以在有限范围内光盘资源共享仍然是不可替代的。2.1.3 网络信息资源的类型我国
9、在光盘数据库方面的研究和开发起步较晚,但近几年发展十分迅速。1992年重庆微普公司推出我国第一张中文CD-ROM光盘版数据库中文科技期刊数据库,它突破了传统中文信息的存储介质,在国内图书、情报界引起巨大反响。同年4月,我国第一家开发制作多媒体光盘电子图书的专业公司北京金盘电子有限公司诞生。目前,国内以有一定规模的电子出版物制作企业大100多家,生产了大量的光盘资源产品,如:中国法律法规检索系统、中国企事业单位名录大全、人大报刊复印资料、人民日报、中国学术期刊(光盘版)收录我国各学科核心和有专业特色的3500多种期刊,开了我国电子期刊全文光盘的先河,同时它还开发出先进的检索软件,建成全文电子期刊
10、检索系统,在单机或局域网环境下提供给用户使用。1999年利用大型存储设备,开展在各地设立光盘镜像站点,为注册用户提供服务,方便了用户检索,提高了检索效率。 2.1.3 网络信息资源的类型 (2)传统的联机检索信息资源 20世纪60至70年代,世界上发达国家和地区相继建立起计算机联机信息服务系统,如美国的Dialog、德国的STN系统,均向世界范围内有限的用户提供信息检索服务。2.1.3 网络信息资源的类型 这种传统的联机检索是一种集中式的网络系统,它由联机检索中心、通讯网络和检索终端组成。联机检索中心主要包括中央计算机、联机数据库、数据库检索软件等,是联机检索网络的中心部分;通讯网络是连接检索
11、终端与检索中心的桥梁,其作用是保障信息传递的畅通;而检索终端是用户与系统进行人机对话的设备。当用户通过检索终端,将一定的信息需求转化为特定的检索语言和检索表达式经由通讯网络传至系统的主机时,主机将其与系统数据库中存储数据进行匹配运算,并将检索结果按用户需求传至终端设备,再由终端设备显示或打印。在整个联机检索过程中,大部分工作都是在主机上完成的,因此联机检索对主机的处理速度和功能的要求相当高。2.1.3 网络信息资源的类型 这种联机检索系统的优点和缺陷都十分明显。优点是整个系统都在系统管理员集中管理下,安全可靠。缺点是主机负担重,一旦出现故障,整个网络将瘫痪;网络扩展困难;由于所采用技术标准不公
12、开,因此相关技术缺乏发展动力,灵活性差。 由于Internet网络的发展和冲击,传统的联机网络的局限性日益明显,并严重制约其发展,大有不进而亡之势。经过近几年的努力,世界知名的联机系统如Dialog, STN, Compuserve Amercian Online纷纷建立自己的WWW服务器,开发Internet接口,改善用户界面,增加服务项目与内容,将其服务对象从原来有限的用户扩大到世界各地,大大增加了数据库的使用率。2.1.3 网络信息资源的类型 由于这些联机检索系统在信息加工上的优势和在信息服务方面的独到之处,使得联机网络信息资源以其加工标引规范、检准率高、数据库涉及学科范围广、专业性强而
13、逐渐成为Internet网上不可忽视的一种重要信息资源。由此看来,传统的联机检索系统面对Internet的冲击而进行的战略调整是十分成功的。2.1.3 网络信息资源的类型 ternet是近年发展最迅速的信息资源,由于操作简便,检索界面友好,资源丰富多彩,其信息不仅包括目录、索引、全文等,还包括程序、声音、图像和多媒体信息。 这里所指的Internet信息资源是一个狭义的概念,是针对传统的联机网络资源而言的。这类资源大多是由机构、团体、协会、公司甚至个人提供。提供上网的信息并没有一个传统的信息过滤机制,信息质量参差不齐,而且这类信息在网络上的产生和消亡都十分频繁。正是由于这种松散的管理模式,使得
14、Internet信息成为近年来异军突起的信息资源,其发展速度远远超出了人们的相象。 2.1.3 网络信息资源的类型 总的来看,光盘局域网信息、传统的联机网络信息和狭义的Internet信息资源共同构建了Internet上的网络信息资源,它们的共同特点是都需通过计算机网络才能获取 2.1.3 网络信息资源的类型 2. 按照信息加工层次划分 网络信息按照信息加工层次,可以分为网络资源指南和搜索引擎、联机馆藏目录、网络数据库、电子期刊、电子图书、电子报纸、参考工具书和其他动态信息。 (1)网络资源指南和搜索引擎。各种各样的Internet网络信息检索工具有数千个,根据提供检索与否,有资源指南和搜索引
15、擎之分。2.1.3 网络信息资源的类型 资源指南是按主题的等级排列的主题类目索引,类别目录按一定的主题分类体系组织,排列方法有字顺法、时序法、地序法、主题法等或是各种方法综合使用。用户通过逐层浏览类别目录、逐步细化的方式来寻找合适的类别直至具体资源。资源指南是人工编制和维护的,在信息的收集、编排、HTML编码以及信息注解上要花大量的人力物力。常见的有美国国会图书馆编辑的WWW Meta Index and Search Tools、美国伊利诺大学的国家超级电脑应用中心编辑的Internet Resources Meta Index。2.1.3 网络信息资源的类型 搜索引擎则是强调的是它的检索功
16、能,能提供布尔逻辑检索、短语或邻近检索、模糊检索、自然语言检索等方式查询信息。搜索引擎的数据库主要是由机器人自动建立的,不需人工干预。常见的搜索引擎有Alta Vista, Yahoo!。2.1.3 网络信息资源的类型 (2)联机馆藏目录。网络上有许多机构提供的馆藏书目信息、中外文期刊联合目录信息。其中包括各图书馆和信息机构提供的公共联机检索(OPAC)馆藏目录、地区或行业的图书馆的联合目录等。如中国国家图书馆(原北京图书馆)、中科院图书馆和许多高校图书馆都有自己的OPAC。中国国家图书馆在网上提供图书目录在线检索,有题名、责任者、关键词、标准书刊号、分类号、出版地、出版国等10个检索途径。在
17、四川大学图书馆文理分馆主页上也可以检索该馆的图书目录,用户可以从责任者、题名、主题、分类号、ISBN、ISSN、索取号七个检索入口进行检索,并且可以利用出版时间和其他限制条件对检索结果进行限制,以缩小检索范围。另外,全国高等教育文献保障体系(CALIS)(http:/)提供61所高校的馆藏期刊、书目和学位论文联合查询。2.1.3 网络信息资源的类型 (3)网络数据库。网络数据库包括综合性和专业性期刊数据库、专利数据库等信息资源。这类信息资源可分为商业性和非商业性的数据库。 许多著名的国际联机数据库检索系统(Dialog,STN,OCLC)都开设了与 Internet 的接口,用户可通过远程登陆
18、或WWW 方式进行付费检索。另外,有许多从事传统信息服务的机构开发了网络数据库,如ISI公司推出的Web of Science、美国工程信息公司开发的EI Village、英国的INSPEC数据库、中国科技信息所与万方数据公司开发的万方数据资源系统等。这些数据库由专门的信息机构或公司专业制作和维护,信息质量高,是专业领域内常用数据库。2.1.3 网络信息资源的类型 商业性数据库因为免费使用,用户以较低的成本可获得所需的信息,所以也有很高的吸引力。如:IBM公司的免费专利文献数据库,提供大量专利的免费检索,用户可检索到1971年以来的美国专利说明书的内容,包括专利书目和专利项,浏览1974年以来
19、的专利文献中的附图。美国SPO(http:/ 2.1.3 网络信息资源的类型 (4)电子出版物。由于网上信息传播速度快,越来越多的出版商注重网上报刊发行。目前国内外已有很多出版商和信息服务中介入电子出版行业。电子出版物有电子图书、电子期刊和电子报纸。 (5)参考工具书。网络中许多参考资料是可以免费使用的,如英国大不列颠百科全书、汉语词典、学校或企业名录、中国国家统计局统计资料等大型工具书已加入因特网。 2.1.3 网络信息资源的类型 (6)软件资源。Internet上的软件资源十分丰富,大部分可供免费下载使用,还有许多的共享软件,在一定时期内或一个软件的某些功能的试用,也有很多在线注册购买的软
20、件,还有很多的程序代码供用户使用或二次开发,对广大的计算机用户有较大的吸引力。 (7)其他动态信息。各级政府机构、高等院校、团体、公司在网上发布的消息、政策法规、会议消息、研究成果、产品目录、出版目录和广告等。2.1.3 网络信息资源的类型 3.按网络信息资源的开发主体划分 按网络信息资源的开发主体划分,网络信息资源分为:科研院所、学校站点资源、企业公司站点资源、政府机构站点资源和服务机构站点资源等。 (1)学校、科研院所站点信息资源。这类站点一般以edu或ac为一级或二级域名注册,如:http:/ 网络信息资源的类型 2)企业站点信息资源。这类资源站点一般以COM为一级或二级域名注册。如:h
21、ttp:/(海尔集团),其信息资源一般以初始信息为主,如提供公司总体概况,各类产品信息、商业服务信息等,更新及时,动态性强。 (3)信息服务机构站点信息资源。这类站点一般以net、com、gov,或行政区域为一级或二级域名注册,如:http:/(中国水利国际合作与科技网),http:/ 网络信息资源的类型 (4)行业机构站点信息资源。这类站点一般以所属上级部门为域名注册,有com、ac、gov等,如http:/(中国汽车行业经济技术信息网)。它们一般是再现行业信息,系统性、完整性较好。主要信息内容有企业名录、市场行情、行业论坛、政策和法规、统计信息等。2.1.3 网络信息资源的类型 4. 按信
22、息检索角度划分 按信息检索角度划分,网络信息资源分为:网上图书信息、网上电子期刊信息、网上专利信息、网上数据库信息和网上其它科技信息等。 (1)网上图书信息。Internet上提供的图书信息主要包括书目信息和电子图书这些信息我们可从以下几个方面来获取:2.1.3 网络信息资源的类型 出版商提供的书目信息。国内外许多出版社都有自己的网站, 如:中国铁道出版社网址(http:/)通过Internet发布其出版物的目录、最新图书内容简介、价格等信息。 图书馆、文献情报中心提供的联机图书馆馆藏目录。目前全球至少有15000个大型图书馆的联机目录24小时对外开放,通过OPAC我们可以查询到大量的书目信息
23、,确定某本书是否在馆,能否通过馆际互借加以利用等,有些联机目录不但提供书目及摘要, 还提供其它的信息资源。2.1.3 网络信息资源的类型 数字图书馆提供的电子图书。数字图书馆是数字化生存时代的重要文化基础设施。利用这些图书馆,记载人类文明成果的图书资料就会方便地进入人们的生活 (2)网上电子期刊信息。电子期刊是非常重要的网络资源。网上电子期刊时效性强、内容丰富、检索途径多样,已成为利用率非常高的网络信息源,特别是免费的电子期刊。网上电子期刊包括与印刷版同时发行和仅在网上发行的两种,其主要来源渠道有:2.1.3 网络信息资源的类型 出版商和文摘索引服务商提供的期刊检索服务。目前,国际上大多数主要
24、的期刊出版都建立了全文数字化期刊数据库,并通过Internet提供其服务。 网络数据库信息服务商提供的服务。存储在网络服务器上的网络数据库品种多、质量高、大多由信息服务商或大型图书馆机构创建维护。2.1.3 网络信息资源的类型 供期刊或其它类型文献的网上检索服务,用户在有的网站检索二次文献信息的同时,还可以订购原始文献,原文可通过E-mail、传真、浏览、下载和联机打印等方式获取。 网络版期刊提供的服务。目前,许多期刊正在网上建立自已的网站,便于读者上网检索或提供免费的电子邮件现刊目录服务。2.1.3 网络信息资源的类型 (3)网上专利信息。网上的专利信息资源可从以下几个方面来获取: 利用专利
25、管理机构网站提供的信息。专利管理机构网站主要是指各国(地区)或地方专利局的主页或者由它们及其下属机构开发的网站。这类网站提供的专利信息全面、权威、新颖。例如美国、加拿大、日本等国的专利数据库在INTERNET上均可得到免费使用。 利用联机检索系统中的专利数据库。一些知名的联机检索系统中都包含与专利有关的数据库。如Dialog系统(http:/)、STN (www.cas.org/stn.html)系统等。2.1.3 网络信息资源的类型 利用数据库出版机构提供的信息。主要有Derwent公司、英国IEE公司(INSPEC)。(4)网上数据库信息。这是最有价值的信息资源之一,一般以商业性数据库或政
26、务数据库的形式出现,需要通过购买或用户授权才能使用。网上数据库有全文型、文摘型、题录型、事实和数值型、多媒体型等。Internet上也有大量、有价值的免费数据库,只要我们要善于发现、搜集,往往会得到意外的惊喜。2.1.3 网络信息资源的类型 (5)网上其它科技信息。Internet上除了网上图书信息、电子期刊、专利信息、数据库信息外,还有大量的会议信息、科技政策法规、学位论文、技术标准、产品样本目录、科技报告、统计数据、科技新闻、组织机构、电子论坛、通讯讨论组和数据库等,这些资源的实用性也很强。2.2 网络信息资源检索网络信息资源检索 随着计算机、网络、高密度存储、多媒体和现代通讯等高新技术的
27、发展,因特网正在深刻地改变着人们的生活方式,海量信息涌人因特网,使我们陷人信息检索的困境,如何检索和获取所需要的网络信息资源是我们急需解决的问题。2.2.1 网络信息资源检索概述 1. 网络信息检索的定义 网络信息检索,是利用Internet的网络资源,通过交互式的图形界面,为检索者提供友好的信息查询入口,由系统自动向适应的服务器提出请求,获取用户特定需求信息的技术。简单的说就是网络环境下的信息检索。网络信息检索它与传统信息环境下的检索有很大的不同,网络信息检索具有多样性、灵活性也远远超出了传统的信息检索。原来传统途径可获得的信息,现在几乎全部可以通过网络检索得到,而且更快、更新、更准确。 2
28、.2.1 网络信息资源检索概述 2. 网络信息检索的一般方法和途径 要获取网络信息资源,用户必须首先找到网址( URL ),然后通过网址去访问网页所提供的信息。一般检索方法有以下几种: 2.2.1 网络信息资源检索概述 (1).浏览 偶然发现:即在日常的网络阅读、漫游过程中,意外发现一些有用信息。这种方式的目的性不是很强,有不可预见性、偶然性。有时会充满乐趣,有时也可能一无所获。 顺链而行:指用户在阅读超文本文档时,利用文档中的链接从一个网页转向另一相关网页。有些类似传统文献检索中的“追溯检索”,即根据文献后所附的参考文献目录去追溯相关文献,一轮一轮地不断扩大检索范围。这种方法可以在短时间内获
29、得大量相关信息,但也有可能在顺链而行的过程中偏离检索目标,或迷失于网络信息空间中。 2.2.1 网络信息资源检索概述 (2)通过网络资源指南来查找信息。网络资源指南即指前面所讲的目录式搜索引擎,或网络资源目录。 Yahoo! 就是典型的综合性网络资源指南。此外,还有各种专业性的网络资源指南,几乎每一个学科专业、重要课题、研究领域的网络资源指南都可在因特网上找到。对于有目的网络信息发现有重要的指导、导引作用。但由于管理、维护跟不上网络信息的增长速度,导致收录范围不够全面,新颖性、及时性可能不够强。 2.2.1 网络信息资源检索概述 (3)利用搜索引擎。这是较为常规的网络信息检索方式。用户以关键词
30、、词组或自然语言构成检索表达式,提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果提供给用户。它一般支持支持布尔检索、词组检索、截词检索、字段检索等功能。利用搜索引擎进行检索的优点是:省时省力, 简单方便,检索速度快、范围广,能及时获取新增信息。其缺点在于检索准确性不是很高,与人们的检索需求及对检索效率的期望有一定的差距。 2.2.1 网络信息资源检索概述 4)检索策略。所谓检索策略是在分析情报提问实质的基础上,确定检索途径与检索用词,并明确各词之间的逻辑关系与科学的查找步骤。构造良好的检索策略是查准与查全的关键。用户能否构造一个最佳的检索策略,将直接影响到检索的查全率、查准率。
31、2.2.2 网络信息资源选择的必要性和原则 网络的迅猛发展,信息资源的无限、无序及优劣混杂已成为人们有效利用网络信息资源的主要障碍,如何从浩如烟海的网络资源中筛选出高质量信息显得日益重要,它直接影响图书馆及其信息用户对网络信息资源的开发和利用。 2.2.2 网络信息资源选择的必要性和原则 1. 网络信息资源选择的必要性 所谓信息选择,是指对大量的原始信息以及经过加工的信息材料进行筛选和判别,有效地排除其他不需要的信息,选择所需要的信息。现代信息社会已从提供信息发展到选择信息的阶段。信息选择能力不仅是决定人们创造性和应变能力的重要因素,也是衡量一个社会文明程度的重要标志之一。 2.2.2 网络信
32、息资源选择的必要性和原则 随着网络的普及与信息科技的进步,人类正不停地将现实世界上所有的信息,诸如报纸、杂志、书籍和政府文件事,采用网络技术进行生产和传输。同时,图书馆及其他文献情报机构也在采用现代化手段将积累的传统型文献信息数字化。整个人类世界已经或正在通过网络建设成一个前所未有的超级大数据库。今后,在网络环境下,越来越多的人面临的将不再是任凭选择的良机,而是过多选择的困境。对于信息用户来说,网络信息资源选择意味着如何在海量信息空间里快速合理地选择所需的信息资源,避免不必要的人力、物力浪费;对于图书情报机构来说,网络信息资源的选择就是帮助用户决定是否取用该资源,为用户和用户所需的网络信息资源
33、之间架起一座桥梁。2.2.2 网络信息资源选择的必要性和原则 2.网络信息资源选择的原则 由于网络是个高度自由的领域,网络资源并无统一的命名规则,利用网络的不同群体所采用的网络资源标识又是有差异的,因而给网络资源的识别、组织和整理带来了一定的难度和不便。网络信息资源的位置经常变化,内容变动也轻而易举。因此,网络信息资源的选择应遵循以下原则。2.2.2 网络信息资源选择的必要性和原则 (1)计划性原则。对网络信息的选择要统筹规划,制定长远目标和近期目标,不能一味地跟着流行的话题。尤其是对国外网络资源的引进利用方面,虽然从形式上看,网络信息的获取和下载是畅通无阻的,实际上重要而有价值的信息都有严格
34、的限制,必须投入大量的经费。只有科学统筹的管理和规划,才能建立高效而丰富的网络信息资源。2.2.2 网络信息资源选择的必要性和原则 (2)针对性原则。针对自己或所在机构的主要任务、服务用户的需求等进行信息的选择,信息的专业化程度要适应用户水平,既要在主题的切入角度、内容的组织筛选等方面有的放矢,又要将那些过于肤浅的、过于深奥晦涩的、普及型的、趣味性的等等不适合用户需求的信息排除在外。 2.2.2 网络信息资源选择的必要性和原则 (3)连续性原则。由于网络的动态性,对已选择的资源要注意维护,还要不断增加新的资源。网络资源包含大量的有用信息,也有很多信息噪音和信息垃圾,各种网站、网页开放的时间、更
35、新的速度有信息质量处在无序而不均衡的状态中。因此,必须有目的地跟踪网络信息的出版发布情况,不断提出调研结果报告,为网络信息资源的选择提供指导性意见。2.2.2 网络信息资源选择的必要性和原则 (4)科学性原则。网络技术方面的软件工具很多,涉及信息系统管理、信息下载与获取、网络互联、信息利用等各个层面。因此,网络信息资源的选择需要采用科学的方法,在现代高科技技术的基础上,选择质量高的网络资源。高质量的信息资源意味着它已经过质量控制的加工,已经得到组织并以一种系统而统一的方式存储,在一个可靠的、用户友好的检索系统中提供对它们的存取。2.2.2 网络信息资源选择的必要性和原则 (5)预见性原则。在网
36、络环境下,用户及其信息需求日益个人化和专门化,由选择检索点转向最相关信息;从以文献、信息利用为中心转为以知识利用为中心。因此,进行网络信息资源选择时要注意用户潜在的、未来的信息需求 2.2.3 网络信息资源检索的意义21世纪是一个高度信息化的社会,信息就是商品、信息就是财富、信息就是资源、信息就是机会,因此人人都渴望及时获得有用的信息。如果说搜集信息是人类赖以生存、发展的一种本能,那么信息检索则是每个大学生和科研人员必须具备的一种基本技能。在计算机、网络通信技术日新月异,互联网遍及世界各个角落的今天,我们正身置于广袤无垠的信息海洋中。面对这样一个新知识、新技术不断涌现、知识新陈代谢频繁的世界,
37、想要一劳永逸地获取知识是不可能的。我们只有终身学习,不断地获取、更新知识,才能不被社会所淘汰。要有效、快速地获取和利用最新信息,就必须掌握信息检索的技能。大学生在校求学期间所获得的不应该仅仅是“黄金”,更重要的是应获得“点金术”,其中之一就是信息检索的能力。通过检索和利用各种信息,不仅可以深化所学的知识;而且可以开阔视野,拓宽知识面;也为自学前人的知识、不断更新知识以及从事科学研究和发明创造奠定基础。 2.2.4 网络信息资源检索工具的类型 随着因特网的飞速发展,网上资源日新月异,呈爆炸性增长。面对浩如烟海的数字化、多媒体、非规范、跨时空、跨行业、跨语种的信息资源,如何快速地找到所需信息渐变得
38、重要起来,这就非常需要有效的信息查询(检索)工具,使用户能够方便地从Internet上获取有用信息。目前因特网上已有许多信息空间的工具,如yahoo、Lycos、openfind搜索WWW网页网址、新闻论坛、BBS文章的工具等。网络信息检索工具大致可分为三大类型。2.2.4 网络信息资源检索工具的类型 1. 字典型查询工具 字典型查询工具主要用于查询网上用户名、电子信箱(E-mail)、网址(URL)、服务器地址等,如white Directory,Internet Yellow Pages,whois,DdjaNews FAQ Archive等。 2. 索引型查询工具 索引型查询工具为网上信
39、息资源建立索引。如FTP资源的索引Archive;Gopher资源的索引Verronica、Jughead;网上服务器的索引wais等。 2.2.4 网络信息资源检索工具的类型 3. 交互式查询工具 交互式查询工具提供类似商用联机检索的网络信息查询服务,包括Gopher和WWW两类。2.2.4 网络信息资源检索工具的类型 1)Gopher。Gopher是地鼠之意,地鼠是一种钻地非常迅速的动物)。Gopher是一种嵌套菜单式搜索网络资源的快速查询工具,它把Internet上的信息源联成一体,以简单的菜单式提供全球性的Gopher信息资源查询。缺点是不能传送声音、图像等多媒体信息。 (2) 万维网
40、(WWW)。万维网是Intenet上发展最快,信息最丰富的一种检索服务工具。具有联网简单、格式标准、多媒体信息浏览、界面友好等诸多优点。WWW检索工具按其性质可分为两大类:搜索索引和搜索目录。搜索索引又搜索引擎,详细内容在后面章节讲解。2.3 网络信息资源的组织网络信息资源的组织 2.3.1 网络信息资源的组织方式 信息组织是指采用一定的方式,将某一方面的大量的、分散的、杂乱的信息经过整序、优化,形成一个便于有效利用的系统的过程。网络信息资源的“量”与“质”都发生了巨大变化,信息组织的方式也随之发生了根本性的变化。信息组织的对象从各种类型的数据发展到具有丰富内容的知识,组织形式从数据结构发展到
41、知识表示,组织方式从手工单一发展到网络群体,组织的结果从静态的文本格式发展到动态的多模式的链接。 2.3.1 网络信息资源的组织方式 1. 网上一次信息资源的组织方式 (1)主页、页面方式:这种方式通过页面对某机构、个人或专题作全面介绍,用主页将这些信息集中组织到一起,相当于网上的档案全宗。 (2)文件方式:以文件系统来管理和组织网络信息资源简单方便,是存贮图形、图象、图表、音频、视频等非结构化信息的天然单位,但对于结构化信息则难以实现有效的控制和管理。2.3.1 网络信息资源的组织方式 (3)自由文本方式:这种方式主要是对非结构化的文本信息进行组织和管理,它不是对文献特征的格式化描述,而是用
42、自然语言深入揭示文献中的知识单元,主要用于全文数据库建造。 (4)超文本方式:这种方式将网络上相关文本的信息有机地编织在一起,以节点为基本单位,节点间以链路相连,将文本信息组织为网状结构。2.3.1 网络信息资源的组织方式 2. 网上二次信息资源的组织方式 大量的一次信息入网后,为快速、高效地找到用户所需的信息,必须构建网上一次信息检索工具,将一次信息经过替代、重组、综合、浓缩后形成二次信息,那么这些二次信息又是如何组织的呢,从信息的查询方式来看主要有以下形式: 2.3.1 网络信息资源的组织方式 (1)搜索引擎方式:搜索引擎是指因特网上专门提供查询服务的一类检索工具,实质是存贮、报导网上一次
43、信息。由用户输入自己的检索式,搜索引擎自动将其与存贮在网上的一次信息特征进行比较匹配,将符合用户要求的一次信息的描述记录以超文本方式显示出来。搜索引擎方式是目前因特网上对二次信息进行组织的主要方式之一。 (2)目录指南方式:这种方式将信息资源按照事先确定的概念体系分门别类地逐层加以组织,用户先通过浏览的方式层层遍历,直到找到所需信息的线索,再通过信息线索联接到相应的网络信息资源,它的优点是专指性较强,能较好地满足族性检索的要求。2.3.1 网络信息资源的组织方式 (3)指示数据库方式:在对网上的信息资源进行分类编目除了提供详细的书目信息外,还要对其存储位置URL或IP地址这样的信息资源线索或链
44、接点进行描述,指示数据库便是存贮有关网上一次信息的网址以及相关信息的描述信息。通过这种方式进行检索首先在数据库中获得地址,再在浏览器的地址栏中输入地址进行查找,而不像搜索引擎那样一次检索的结果就是超文本方式,只须直接点击链接便可获得所需的一次信息。它的优点是入库记录要经过严格选择,具有较强的针对性和可靠性,检索结果适用性强,常用来组织专题性的或专用的网上二次信息。2.3.2 信息资源的检索方式 在这个多元化的、交互式的、动态的网络信息环境中,为有效地利用信息,除了良好的信息组织方式外,还需要符合网络信息资源本身特点和网络信息资源组织特征的恰当的检索方式。 1. 检索策略2.3.2 信息资源的检
45、索方式 (1)分类检索与主题检索相结合。传统的信息检索主要分为分类与主题两种。网络信息资源的大规模、多样化和快速增长使网络信息的检索策略应同时具备分类的族性检索特征和主题的特性检索特征,利用分类主题一体化充分揭示网络信息资源。 (2)基于内容的检索。随着计算机和多媒体技术的发展,图象、图形、音频、视频信息在网络信息资源中所占比例越来越大,但对它们的检索方法却发展较慢,必须加强对多媒体信息检索的研究。目前基于内容的检索较好地解决了这个问题。它通过多媒体信息的内容特征,而不是传统的形式特征实施检索。2.3.2 信息资源的检索方式 (3)全文本、超文本检索技术。可以根据文本中任何单词或语句进行检索,
46、还能灵活地输出全文、章节、段落。常用的方法是位置间隔和相邻检索、字符串匹配等。超文本检索是将文本、声音、图象等媒体数据的内容信息分隔为若干可独立利用的节点,节点间以链路相连接,构成网状层次结构,检索由指令激活某一节点,通过链路查询所有相关信息。2.3.2 信息资源的检索方式 2.检索工具 (1)人工分类方式。与目录指南的信息组织方式相对的检索方式是人工分类方式。利用人工或机器搜寻,但用人工分类并制作索引数据库。由于采用人工筛选和分类,这种方式的优点是信息质量高、查准率高。 2.3.2 信息资源的检索方式 (2)自动搜寻方式。与搜索引擎的信息组织方式相对应的检索方式是自动搜寻方式。自动搜寻工具主
47、要有自动搜寻网络资源、自动索引、自动摘要、提供检索方法和用户界面等功能。由于是自动搜寻,这种方式的不足之处是收录的信息良莠不齐,耗费大量的计算机资源,查全率高但查准率低等。2.3.2 信息资源的检索方式 (3)混合搜寻方式。这种方式既可以通过类目浏览查询,又可以键入一个句子、一个短语或一个姓名进行自由查询,兼有自动搜寻与人工分类两种方式的优点。 网络信息检索与手工检索相比,有省时、省力,获取信息的时效性、新颖性、广泛性强的优点,在浩如烟海的网络信息资源中起到了一定导航作用。但这还远远不够,还需作更深入的研究,探寻更适应网络环境的信息资源检索方式。此外,对于高性能、简单易用的友好用户界面的需要越来越迫切;对于获得的信息资源的质量、深度、范围、准确性和时效性要求也越来越高。 2.3.2 信息资源的检索方式 思考与练习 : 1.理解信息和信息检索的基本概念。 2.简述网络信息检索工具有哪些? 3.信息资源选择的有哪些原则? 4.你愿意学习网络信息检索吗?简要阐述其理由。
限制150内