0905《计算机信息检索》2015年06月期末考试指导.pdf
《0905《计算机信息检索》2015年06月期末考试指导.pdf》由会员分享,可在线阅读,更多相关《0905《计算机信息检索》2015年06月期末考试指导.pdf(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、0905计算机信息检索2015 年 06 月期末考试指导 一、考试说明(一)说明 满分为 100分,考试时间为 90 分钟,考试形式为闭卷。(二)题型及各题型所占分数和相应的答题技巧 1 单项选择(每题 3 分,共 10 题,总计 30 分)答题技巧:选择最正确的那个选项,可以考虑排除法等选择技巧。2.简答题(每题 7 分,共 14 分)答题技巧:需要答出与问题相关的重要知识点(即讲义与课件中的知识点),如需要,可对相关内容展开阐述。3 论述题(每题 14 分,总计 56 分)答题技巧:除了结合题目给出重要的知识点外,还要在此基础上对知识点加以扩展阐述。回答要有条理,注意答案的完整性。二、复习
2、重点内容 第 1 章 信息资源 1.信息资源的基本概念 信息资源就其本意来讲,就是信息的资源化或资源化的信息,是经过人类主观处理或加工的,能够传输或传播的,可以对社会生活发挥作用的信息。关于与信息有关的几个概念 知识:是指人类对客观事物规律性的认识,是人的大脑通过思维重新组合的系统化的信息集合。文献:是指记录知识的一切载体。情报:是指为一定目的而搜集和传递的有特定效用的知识。2.信息资源的基本特征 信息资源的普遍性 信息资源的传递性 信息资源的时效性 信息资源的价值性 信息资源的可转换性 信息资源的可利用性 信息的共享性 3.电子信息资源的特征 电子信息资源是以数字化形式(即二进制代码 0、1
3、),把文字、图像、声音、动画等多种形式的信息存储在非印刷型介质上,以光信号、电信号的形式传输,并通过相应的计算机和其他外部设备再现出来的信息资源。电子信息资源具有如下的特点:存储形式多样化 资源数字化 交流程度高 提高了利用效率 内容丰富 载体容量大 4.电子信息资源的类型 (1)按照网络传输协议不同,可将电子信息资源分为:Web 信息资源 Telnet 信息资源 FTP 信息资源 用户服务组信息资源 Gopher 信息资源 (2)按照存取方式的不同,可以将电子信息资源分为:邮件型信息资源 电话型信息资源 揭示板型信息资源 广播型信息资源 图书馆型信息资源 书目型信息资源 交互型信息资源 (3
4、)按照信息传播与交流过程,可将电子信息资源分为:稳定的电子信息资源 不稳定的电子信息资源 (4)按照正式出版物类型的不同,可将电子信息资源分为:电子图书(E-book,Electronic book)电子期刊(Electronic Journal)电子报纸(Electronic Newspaper)中国博客网电子期刊 北京青年报的电子报纸 第 2 章 信息检索的基本原理 1.信息检索的基本原理 信息检索就是把检索提问与存储在检索工具中的标引、标识进行比较,两者一致或信息标引的标识包含着检索提问的标识。则具有该标识的信息就从检索工具输出,输出的信息就是检索命中的信息。实际上,信息检索的过程涉及信
5、息的存储和检索两个过程。信息检索可以按照广义和狭义的信息检索来进行定义:广义的信息检索包括信息存储与查询两个部分:信息的存储即对信息的本质特征与形式特征进行记录和描述的过程。信息的查询则首先要将信息提问转换成信息系统可以接受的检索式,然后将检索提问与系统标识进行比较与匹配。狭义的信息检索是以信息系统为基础的单纯的检索过程。狭义的信息检索有许多类型 (1)按检索活动的执行主体可划分为手工检索和计算机检索 (2)按查询信息的特征可划分为全文检索、多媒体信息检索、事实检索、书目检索、图像检索、数据检索等。2.信息检索语言的概念 信息检索语言是一种专门的人工书面语言,它是信息检索系统存储和检索所使用的
6、共同语言。3.信息检索语言的类型 检索语言是用于文献信息的存储和检索的。对于非文献信息,若运用检索语言,就要把非文献信息转换为文献信息后再使用。文献检索语言主要反映的是文献信息的内容特征和表象特征。按检索语言的结构原理可以划分为分类语言、主题语言、代码语言。分类语言,如中图分类法中,以大写字母表示一级类目,以数字表示二级和二级以下的类目。二级类目,如工业技术(T)类下进行的细分,双字母。分类语言还包括:体系分类语言,组面分类语言,混合分类语言等。主题语言:一种规范化的自然语言,揭示文献信息的主题特征,用主题词汇表达各种概念,并按字顺排列。包括标题词语言,单元词语言,序词语言以及关键词语言等。代
7、码语言:针对事物的某种特征,用代码加以标引和排列,如学科代码等。按组配方式可划分为先组式检索语言和后组式检索语言。4.信息检索的过程 (一)分析研究课题,明确查找要求。(二)选择检索工具 (三)确定检索途径及检索方法 (四)查阅原始文献 信息检索的基本方法 (1)追溯法。是利用文献末尾所附的参考文献进行追溯查找的方法。(2)常用法。是利用各种检索工具进行查找文献资源的方法。(3)循环法。是常用法和追溯法的结合,先利用检索工具查找出一批有用的文献,然后利用这些文献所附的参考文献进行追溯查找。第 3 章 计算机信息检索系统 1.计算机检索系统的组成 (一)计算机检索系统由以下几部分组成:1)信息源
8、 信息源是计算机检索系统信息或数据的来源。信息检索系统中的数据主要来自各种公开文献。2)信息组织管理 信息组织管理关键要注意信息标引的方法、组织方式、更新周期这几方面。3)系统功能 信息检索系统的功能取决于系统所能提供的检索途径、检索方式和检索方法。4)用户接口 用户结构主要研究用户模型、信息显示、命令语言、反馈机制这几点 5)系统支持技术 信息技术支持关系系统及其软、硬件平台的通用性、兼容性、可靠性和稳定性。(二)计算机信息检索系统的基本结构 1)硬件部分:以计算机主机为中心的一系列机器设备 2)软件部分:信息检索系统中的有关程序和各种文件资料的总称。3)数据库:将数据按一定格式存储在计算机
9、内的数据的仓库,即存储在计算机内的相关数据的集合。2.计算机信息检索系统的工作流程与功能 (1)输入环节 针对系统建设的目标,搜集和选择特定范围内的信息资源;把收集的信息资源按照所规定的格式进行登载与记录。(2)处理环节 处理经过选择的数据和信息。(3)存储环节 存储子系统的功能是将加工处理后的信息,按照某种规则和程序聚积在存储载体上,构成可检索的文档。存储的对象由三个方面的内容构成:计算机需要执行的各种程序、数据和文档。(4)传输环节 传输子系统的功能主要是通过计算机与通信线路的连接,完成信息编码的传递、转接、接收与处理等工作。(5)输出环节 根据用户需求,输出各类有关信息。(6)控制环节
10、控制子系统的功能是根据存取系统内部状态和外部环境的变化,进行管理与调节,来保证系统的有效输入、有效存储、有效输出等环节的协调运行。对信息系统进行控制的方式主要有三种,即:集中控制、分散控制和多层控制。3.五种联机检索的检索策略 (1)最专指面优先(most specific facet first)(2)最低登录量的面优先(lowest posting facet first),其中登录量是指索引词在标引中的使用次数。(3)积木型(build-block),形成若干个概念面,分别进行检索。(4)引文珠形增长(citation pearl-growing)指的是依据一两篇最专指面文献逐步扩展,越
11、找越多。(5)逐次分馏(successive fractions),指的是确定一个较大的初始信息集合,再慢慢提高检索的专指度。第 4 章 联机检索系统 1.联机检索系统的基本结构 联机存取系统由用户检索终端、通信网络、联机存取中心等三个部分组成。1)联机存取中心包括中央计算机(服务器)及其外部设备、数据库检索与管理软件、联机数据库;2)通信网络,联机存取系统的通信网络是指通信子网通过分组交换技术,来完成用户联机检索终端和联机存取中心之间的数据传输。3)用户检索终端及用户接口软件 用户检索终端是每个联机信息检索用户必需的设备,用户通过接口软件发送请求和接受结果。2.国外主要联机检索系统 (1)D
12、IALOG 系统数据库 DIALOG 系统数据库是目前世界上规模最大的、检索功能最完善、用户总数最多的联机存取系统。它拥有各种数据库 600 多个,记录量超过 3 亿条,为全球 100 多个国家和地区的 15 万用户提供各种类型的联机存取服务。DIALOG 拥有大量的检索符号和完备的索引系统,能够进行广度和深度检索。(2)OCLC 系统数据库 OCLC(Online Computer Library Center),即联机计算机图书中心,OCLC 创建于 1967年,是世界上最大的文献信息服务机构之一。使用OCLC产品和服务的用户已有70多个国家和地区的38000多个图书馆和教育科研机构。3.
13、光盘检索的原理和特点 光盘的工作原理:用激光读写信息 光盘检索具有以下特点:检索速度快、检索效果好、检索成本低、安全性能高。4.国内主要光盘数据库检索系统 (1)中国学术期刊(光盘版)的全文检索管理系统(简称 CAJ)有检索网站版、专业版、普通版三种类型。其基本检索功能包括:全文检索,篇名检索,作者检索,机构检索,关键词检索,摘要检索,引文检索,基金检索,分类检索,二次检索和位置检索。高级检索功能包括:组合检索,检索表达式检索,词频检索。输出功能:提供中文、英文、中英文对照 3 种显示方式,其输出方式如下:输出题录,输出题录摘要,网上浏览全文,下载全文,打印全文,摘录功能。辅助功能:检索词索引
14、,保存检索结果,保存检索表达式,取出检索表达式,设定检索结果顺序。(2)中文科技期刊光盘数据库 收录了国内出版的中文科技期刊 6000 多种(包括部分港台期刊),数据每半年更新一次,内容涉及 16 个专业大类。(3)中国人民大学报刊复印资料索引光盘数据库 由中国人民大学书报资料中心编选的,因其覆盖面广,信息量大,分类科学,筛选严谨,结构合理完备,成为国内最有权威的具有大型、集中、系统、连续和灵活五大特点的社会科学、人文科学专题文献资料库。1995 年开始发行光盘版。5.国外著名光盘数据库系统 (1)SPIRS 检索系统与 GREADLINE 数据库 1984 年美国银盘公司开发了 Silver
15、Platter Information Retrieval System(SPIRS)光盘存取系统。银盘公司出版的光盘数据库范围涉及社会科学、人文科学、医学与生命科学、科学技术、综合参考、商业、健康与卫生、产品与服务指南等领域。(2)ProQuest 检索系统与 INSPEC 光盘数据库 ProQuest 是由 UMI 公司开发的信息存取系统。UMI 公司生产多种光盘数据库,尽管内容、形式各异,但其检索方法、记录格式等基本相同,所采用的检索系统也都是 ProQuest。INSPEC 数据库由 UMI 公司制作。收录了约 42000 种期刊、2000 多个会议录及大量书籍、技术报告及学位论文等书
16、目资料。第 5 章 网络信息资源 1.网络信息组织的方式 1)文件方式:网络信息系统的最基本方式,可以分为三种形式:顺排文档,倒排文档,索引文档。具有简单、方便的特点,但容易增加网络负载。2)数据库方式:以字段为最小存储单位,可以降低网络传输负载。重复的数据较少,以最优的方式为用户服务,安全性高,操作方便。3)主题树方式:按照一定的主题组织和存放,系统性很强,可扩充性好。但不适应于大型的综合性信息系统,一般用于专业性、示范性数据。4)超媒体方式:超文本与多媒体技术的结合,是网络发展的新趋势。但容易导致用户迷失。5)元数据方式:meta-data,关于数据的数据,即对数据信息所进行的描述。6)网
17、络信息系统新的重要组织方式。可以为各种信息资源提供规范的描述语言,便于用户了解和共享网络信息。2.网络信息资源的特征 以网络为传播媒体;数量巨大,增长迅速;信息共享程度高;传播方式具有多样性、交互性;以多媒体为内容特征;使用成本低;动态性强,管理难度较大;3.网络信息检索的特征 存取范围覆盖 Internet 上的几乎所有资源;传统检索方法与全新检索技术相结合;用户界面友好且操作方便;具备良好的导航和编辑功能;网络透明度高;4.网络信息检索的方法 信息检索建立在信息的存储和有序化基础之上,包括两方面内容:前期数据准备(信息的标引),后期用户检索。常用的检索方法包括:浏览 通过资源指南来查找相应
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机信息检索 0905 计算机信息 检索 2015 06 期末考试 指导
限制150内