计算机与数据库检索.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《计算机与数据库检索.ppt》由会员分享,可在线阅读,更多相关《计算机与数据库检索.ppt(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第7章计算机与数据库检索7.1计算机检索概述计算机检索概述7.2 光盘数据库检索光盘数据库检索7.3 联机数据库检索联机数据库检索7.1计算机检索概述计算机信息检索就是指人们在计算机检索网络或者终端上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需的信息,然后再由终端设备显示和打印的过程。为实现这种信息检索,必须事先将大量的原始信息加工处理、存储在各种信息载体上待用,所以计算机信息检索广义上讲包括信息的存贮和检索两个方面。信息存贮的过程就是将所选中的一次文献进行主题分析、标引和著录,按一定格式输入计算机,构成机读数据库记录以及文献特征标识,这相当于编制手工检索用的文
2、摘索引等检索工具。信息检索则是存储的逆过程。用户在对检索课题加以分析,明确检索范围,弄清主题概念,然后用系统语言来表示主题概念,形成检索标识及检索策略,输入到计算机进行查找。这一查找过程实际上是计算机自动比较、匹配的过程,当检索标识、检索策略与数据库中的信息的特征标志及其逻辑组配关系相一致时,则属“检索命中”,即找到了符合要求的信息。检索结果可以联机或脱机打印输出。计算机检索的历史计算机文献检索的发展历程大致可以概括为批量处理、联机检索与网络系统三个阶段。第一阶段:批量处理1954年,美国海军武器实验站图书馆在一台电子管计算机上建立了世界上第一个计算机检索系统。1950年代末,IBM公司利用一
3、台IBM650计算机成功地编制出关键词索引,并建立了世界上第一个定题情报检索(SDI,SelectiveDisseminationofinformation)系统,为用户定期检索和提供一定主题的新到文献,并很快得到了推广应用。计算机检索的历史(续)第二阶段:联机检索196080年代,数据通讯网络出现,大容量计算机分时系统和强功能检索软件研制成功,使脱机检索发展到联机检索并迅速得到了推广。1970-80年代,联机检索得到迅速发展,一些联机检索系统开始向公众提供商业性服务,如DIALOG、ESA、ORBIT、BRS等许多世界著名的联机检索系统相继投入商业性运营。第三阶段:网络系统1990年代,随着
4、互联网的迅速发展及超文本技术的出现,基于客户/服务器的检索软件的开发,使客户/服务器网络检索模式开始取代以往的终端/主机结构,成为联机检索的发展趋势,使联机检索进入一个崭新的时期。信息检索技术正向两个方向发展:(1)传统信息检索向全文文本、多媒体、多载体、跨平台等新型信息检索的发展,在深度上提高管理和组织信息的能力,如探索自动抽词、自动索引、自动检索、自动文摘、自动分类、Web检索智能代理、数据挖掘、自动翻译等。(2)信息资源的网络化存储和分布式存储,在广度上提高管理和组织信息的能力。计算机检索系统的分类一计算机信息检索系统的组成一计算机信息检索系统的组成计算机信息检索系统由信息检索系统的文件
5、人,人机接口,信息通道,存储检索用计算机和数据库组成。其中计算机信息检索系统中的人指信息系统设计人员,信息存储与管理人员和利用信息的人。人机接口包括检索终端和人机界面两个部分。检索终端是用户与信息检索系统之间交换信息的装置,一般采用智能终端或微机。人机界面指人机进行信息交换的方式方法,主要有以下几种:字符界面(Characterbasedinterface)是使用字符的操作系统或应用程序的用户界面。如DOS等。图形用户界面(Graphicaluserinterface)简写为GUI,读作“gooey”,是指使用基于图形的用户界面,用户不必敲入又长又复杂的命令,而只需指向屏幕上代表文件,程序或命
6、令的图标即可。社会化界面(Socialinterface)GUI的一种,是用实体图像取代图标的一种用户界面。微软的Boh程序采用的就是这种界面。数据库系统数据库系统可以看作为一个电子的文件盒,里面储藏着计算机可读的文件。一个数据库系统包含四个组成部分:数据、硬件、软件和用户数据数据(DATA):是数据库中的物理记录,其所代表的含义就是信息,数据在按约定表达了一定的信息后,就可以认为数据就是信息。现在的数据库所含的信息可以为任何形式的,例如:杂志订户名单,宇宙飞船口宇航员的个人资料或一组图像或视频素材。数据库系统(续)硬件:硬件包括存储器,I/O设备,I/O通道等。软件:软件是数据库(数据的实际
7、存贮)与用户之间的桥梁,主要功能是数据库的管理,或称为数据库管理系统(DBMSDatabaseManagementSystem)。DBMS提供给用户一个数据库的窗口。一般说来,DBMS具有建库,自动维护,保护数据库,方便查询,保证独立性等功能。即生成文件,插入,检索,修改,删除等操作都由DBMS提供。用户:主要包括应用程序员,终端用户和数据库管理员(DBA)二计算机信息检索系统的分类联机信息检索系统联机检索系统就是由一台主机带多个终端的信息检索系统。这种系统具有分时的操作能力。能够使许多相互独立的终端同时进行检索。通过采用实时操作技术,用户可以使用终端设备直接与计算机“对话”,计算机对用户的提
8、问能及时处理、即刻回答。用户还可以浏览有关信息,随时修改提问,直至得到满意的结果。我国主要与国际上比较著名的四大联机检索系统联机:DIALOG系统;STN系统;DATA-STAR系统;OCLC系统。国际联机检索系统的文献资源丰富,一般都拥有几十至上百个数据库,涉及各个学科和领域,近年来,全文数据库和电子期刊在联机检索数据库中所占比例迅速增大。联机检索系统信息更新快,检索技术成熟,检索速度快,检索质量高,使用同一检索式,可以一次性地将上百个数据库的有关文献检索出来。但联机检索系统的开放性和信息可获得性较差,检索费用高,对检索人员的检索技术要求高的缺点正面临着光盘检索和网络检索的挑战。光盘信息检索
9、系统光盘检索是光盘数据库与微机结合,将信息存贮在光盘(主要是CD-ROM)等载体上,采用微型计算机进行检索。光盘检索具有以下优点:光盘体积小,信息存贮量大,一张直径8cm的光盘可存储550MB的信息。检索不受机时限制,检索费用低。检索使用方便、快捷,检索途径多,检索结果输出方式多样化。光盘数据库类型多,品种全,学科覆盖面广,时间跨度大。目前我国引进的光盘全文数据库有:AcademicSearchFullTextElite(学术研究全文精萃);IEEE/IEE全文数据库检索系统;AppliedScience&TechnologyPlus全文数据库;Uncover数据库等。我国自己开发的全文光盘数
10、据库有中国学术期刊(光盘版),CD-ROM中文期刊光盘数据库,中国化学文献数据库,中国医学文献数据库等。光盘检索其信息资源在专业化强、准确可靠、检查使用方便快速、高效、费用低等方面有诸多优点,但光盘检索也有文献资源有限,收录文献的时效性不强等缺点。网络化信息检索系统网络化信息检索是指用户使用自己的计算机通过电信系统与网络相连获取信息的一种检索方式,网络化信息检索系统与联机信息检索系统所不同的是用户和服务器之间是同等关系而不是主从关系,在遵守共同的通信协议的前提下同一个客户可以访问多个服务器,一个服务器也可被多个客户访问。客户既是网络信息的检索者,也是网络信息的提供者。网络环境下的学术资源极其丰
11、富,目前已有3000多种数据库在网上为用户提供文献信息检索服务;国内外许多期刊社和报社均在网上建立了专门站点,不仅提供现刊的全文浏览,有的还提供过刊的检索和全文浏览;国内外一些大型文献机构也提供规模化的网络版电子期刊;许多图书馆在其主页上都提供馆藏图书目录及期刊目次的查询服务;因特网上成千上万个各种主题的电子论坛,提供了各个专业领域的最新信息,可以查询到在正式出版物中无法得到的“灰色文献”。因特网上有许多检索工具,如:AltaVista、Excite、Infoseek、Lycos、openText、Yahoo等。三种检索系统的比较使用联机检索可直接利用国内外大量规范化的专业数据库进行科技信息、
12、经济信息以及商业信息的检索,迅速地检索到相关的信息,由于检索分辨率高,有较高的查全率和查准率。但联机费用较高,需要较高和较熟练的检索技术。使用光盘信息检索最大的好处是:用户可以反复进行检索、筛选直至达到最佳检索效果为止,而不必担心检索时间过常,花费大量费用,光盘检索操作方便,凡是有电脑操作知识的人,都能够通过光盘检索获得自己所需要的信息。与联机检索和网络化相比,光盘内容的更新时间稍长一点。使用网络化信息检索,信息资源丰富,可以得到最新的大量数据、动态以及多媒体技术信息,是目前人们最乐意接受的检索方式,通过网络人们不仅能得到自己所需要的文学、体育、娱乐、商品、企业等等大量的全新的信息;还可以免费
13、得到很多科技、经济、商业等方面信息;还可以通过注册的形式,进入多个专业联机数据库进行检索,可检索到各个方面的综合性信息,通讯费用也低,但检索速度慢,查全率和查准率底下,检索效果差,信息污染也没有得到应有控制。联机检索、光盘检索、网络检索服务系统正向着逐步融合的方向发展。许多联机检索系统将旧的数据库转化为万维网数据库,某些新的专业科技数据库则直接以万维网的形式出现,在万维网上提供检索界面。某些联机检索数据库同时制成光盘发行。而利用光盘塔及网络技术,可以将光盘数据库安装在网络服务器中,实现光盘的网络检索。联机检索、光盘检索和网络检索各有优势和不足,编辑人员应综合使用这三种检索方式,达到满意的检索效
14、果。7.1.3数据库系统1数据库系统的一般特征自1964年世界上第一个计算机可读形式的数据库MEDLARS诞生以来,数据库技术已广泛普及。如今,数据库已成为重要的信息源,在美国就有近万个公开的数据库可以通过各种远程网络提供信息服务。归纳起来,数据库系统具有一下特征:(1)数据独立性数据独立性是指数据与应用之间的相互独立性。数据不必像文件系统管理方式那样从属于某一应用程序,打破了程序与数据一一对应的关系。因为数据库本身仅仅是数据结构的有穷集合,不包含应用问题。此外,数据库管理系统保证了数据的逻辑结构与物理结构相对独立,用户不必关心数据的物理结构。当数据的存储结构和读取方法改变时,并不影响数据的逻
15、辑结构。当追加新记录时,也不用改变应用程序。7.1.3数据库系统(续)(2)数据共享性数据共享是指数据被多个用户所共用。数据共享是建立数据库最突出的优点。文件系统中,文件通常为某一应用目的而设计的,而数据库是一次建立为多次、多种应用而设计的。多个用户可以通过一个职能化的接口即一个共同的存取方式共享数据库中的数据,而不必每个用户事先建立自己的数据文件,从而减轻了用户的负担,产生了专门生产和提供数据的“厂家”,以及专门提供信息共享的信息检索系统和信息服务机构。人们可以通过直接购买或租用数据库、依靠信息服务中心、通过地区或国际网络系统等等方式共享信息,从而推动信息的交流和应用。7.1.3数据库系统(
16、续)(3)数据冗余度小冗余是指相同的数据在某一存储空间中多次出现。数据的冗余会防碍数据的完整性,浪费存储空间,增加用户查找时间。数据库系统使得数据独立于具体的应用程序,使相同的数据不必多处存储,从而减少数据的冗余度。但为了提高检索速度,也会保留部分冗余数据,只不过限制在尽可能小的范围内。7.1.3数据库系统(续)(4)数据的保存和移植文件系统管理方式不便于数据的长期保留和移植,数据往往随着应用程序的删除而消亡,或由于计算机系统不同而对于移植来的数据不能进行处理。而数据库是独立于应用程序的,所以它可以长久保留数据,并可以存储多个副本,如存储在磁带上,特别是对于过时的信息,可以进行追溯检索。同时,
17、由于数据库管理系统具有良好的独立性、灵活性和完整性,可以与数据库一起移植于不同的计算机系统中,构成新的数据库系统。更由于数据库生产趋于专业化和规范化,促使数据库的应用越来越广泛。2数据库的组成(1)文档从数据库内部结构来看,文档的概念是指数据库内容的组成的基本形式,是由若干个逻辑记录构成的信息集合。一般来说,一个数据库至少包括一个顺排文档和一个到排文档。(2)记录记录是文档的基本单元。它是对某一个实体的全部属性进行描述的结果。在全文数据库中,一个记录相当于一篇完整的文献;在书目数据库中,一个记录相当于一条文摘或题录,或者相当于图书目录的一个款目。(3)字段字段是记录的基本单元。它是对实体的具体
18、属性进行描述的结果。在各类数据库中字段的内容都是不相同的。一般字段与信息的著录项目相对应。如在OPAC中,记录中含有题名、著者、出版年、主题词、文摘等字段。另外,根据与文献内容相关与否,信息数据库的字段通常分为基本字段和辅助字段两类。7.2光盘数据库检索光盘数据库检索系统是指以CDROM为数据库存储介质的检索系统。光盘检索系统在问世的十几年里,发展速度很快。目前,国内为光盘数据库产品已达几千种,国外许多大型信息服务公司均开发和使用方便、功能齐全的检索软件,适用于该公司所出版的所有光盘数据库。这样对于用户来说,只需掌握了该公司的光盘检索系统的使用方法,便可有效利用该公司的所有光盘数据库产品。相对
19、于网络检索系统而言,光盘检索系统是一个独立的计算机系统,不受远程服务器是否开机、网络是否畅通等问题的困扰,用户可以随时进行检索。另外,由于光盘检索系统软件功能比较齐全、操作比较简单,用户可以在屏幕提示或系统帮助的情况下直接进行检索操作。再者,由于光盘可以重复使用,可以从容不迫地通过反复试验,最终达到最佳检索效果。概述1光盘种类及其特点光盘是继纸张、缩微胶片、磁存贮器之后的一种用激光束记录和再现信息的存贮载体。光盘片的光学表面是由一些凹凸不平的刻槽构成的螺旋线型光道。这些凹面或凸面,对光线具有不同的反射率。当激光束照射到这些凹面或凸面上时,其反射的光线的强弱与该点所记录的数字信号相对应。光盘就是
20、依靠这些凹凸不平的刻槽来记录数据的。光盘信号的读出过程,是利用光盘上凹凸面结构的不同部位对入射的激光束有不同的反射光强,将其变化值转化成电信号,经处理后变成EFM通道码,然后经解调(反变换)变成与写入光盘时相同的输出信息。按读取数据的性能来分,可分为:只读光盘(CompactDisc-ReadOnlyMemory)这种光盘中的信息是制造商事先写入和复制好的,用户只能读取或再现其中的信息。目前这类光盘的技术比较成熟,信息存储密度比磁盘等介质高得多,是国内外市场上CD产品的主流。它的特点是将数据先写到母盘上,然后大量复制拷贝供发行。由于采用工业化生产方式大批量生产,价格低廉,且标准统一,用户使用光
21、盘驱动器或播放机即可读出不同厂家生产的光盘上的信息。写一次光盘这种光盘不仅可以读出信息,还能记录新的信息。它的存密度比CD-ROM小,适用于现场记录数据,盘片和驱动器价格较高,且尚未标准化。目前市场上可见的有:一写多读光盘(WriteOnceReadManyWORM),随录随写数字数据光盘(DirectReadAfterWriteDRAW),光卡式光盘(OpticalCardOC)。可擦写光盘这种光盘不仅可多次读,而且可多次写信息写入后可以擦掉,并重写新的信息。其容量为10MB-1GB不等,可代替磁带、磁盘,目前已进入实用化阶段。主要类型有可擦式光盘(Erasable)和编程式可擦光盘(CD-
22、ErasableProgrammableReadOnlyMemory,即CD-EPROM)。2光盘检索系统(1)微机及输出设备:微机设备的要求一般很低(2)CDROM驱动器或光盘塔:读取光盘信息的设备,目前有单机驱动器,适于单机运行。多机驱动器光盘系统则是目前市场上推出的一种最新驱动器,适于网络环境中运行,同时可运行多张光盘。(3)计算机及相应的软件:与特定的光盘数据库相配合使用,使计算机能对特定的光盘数据库进行检索、转存、打印等操作。检索软件即可放在CDROM数据库盘上,也可以独立的加密软盘方式提供给用户,不同的CDROM厂商会提供不同的光盘数据库,其相应检索软件也不同,因此,用户只有熟悉检
23、索软件所提供的检索模式和用户界面,才能对光盘数据库进行顺利的检索操作。(4)光盘数据库:它是光盘检索系统的信息源,是光盘技术与数据库技术结合的产物,用于检索和阅读的光盘通常为只读光盘,因此,简称CDROM数据库。光盘数据库与联机数据库相比,尽管存在着更新速度慢、数据容量小,专业范围窄等缺点,但它使用时操作方便、易学易用、费用低廉,而且检索效果优于联机检索。3光盘检索的发展趋势目前在光盘检索的应用中单机版和网络版并存,但光盘检索的网络化是光盘检索系统的发展趋势,它将光盘技术与通讯技术相结合,实现光盘数据库同时为多用户共享,缩短信息传递的时空距离。光盘网络能极大地提高对光盘资源的利用率,具有联机检
24、索方便、资源共享等特点。其实现方式有两种:软件方式。在局域网中增设光盘服务器,置于光盘驱动器与文件服务器之间通过专用的光盘网络软件来实现。或者使用全新的局域网管理软件,可支持多个CD-ROM光盘的检索。硬件方式。将专用的CD-ROM网络软件中的文件服务器、光盘服务器合并成一个内装式的综合服务器,上面有一块带处理机的网络系统板,将有关软件固化在该板上。此服务器还可装入检索软件。4光盘数据库检索的一般过程(1)单机光盘检索程序安装并启动光盘数据库;输入检索词或检索式;检索对话,浏览检索结果;调整检索词或检索式再检;选择检索结果并答应;结束检索。(2)光盘网络检索程序接通光盘网络系统:首先用户终端与
25、光盘网络系统的线路接通,然后键入用户密码及口令登陆,验证用户合法身份。检索对话:选择数据库,输入检索词或检索式,根据系统反馈修改检索策略,最终获取所需文献信息。检索结果处理:将检索命中文献打印输出。退出光盘网络系统。国内光盘数据库检索中文科技期刊数据库该光盘检索系统由重庆维普公司开发,收录了1989年以来7000余种国内自然科学、工程技术领域的期刊和部分社会科学(如经济、文化、教育、图书情报等领域)期刊(其中包括港台核心期刊200余种)上发表的文章,数据按季度更新。它是国内较早出现的、规模较大的综合性文献数据库,它的出版改变了长期以来国内文献检索手段落后、检索效率低的局面。该系统有单机版(Wi
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 数据库 检索
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内