信息检索 复习资料.doc
《信息检索 复习资料.doc》由会员分享,可在线阅读,更多相关《信息检索 复习资料.doc(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第1章 文献信息概论 1.1 信息时代与信息文化课文献课是知识时代培养学生终身所需的信息意识与获取文献信息能力的重要课程,是一门科学方法课。在社会信息化的进程中,文献信息检索的意义日益变得重要: 1、文献信息数量激增。 2、知识的更新速度在加快,信息知识的有效期在缩短。 3、信息获取成为一门专门的技术。 4、信息检索是过去、现在,更是未来研究人员的一项基本功。 5、把文献信息检索作为课程的核心内容的信息文化课已被看成大学生和研究生信息素养教育的重要形式。 文献信息检索的两个基本要求:n 1、要求学生掌握主要检索工具的使用方法,能够选择数据库、制定检索策略、分析检索结果;能够独立地完成检索课题;
2、掌握获取原始文献的主要方法。n 2、要求学生培养信息意识。具体来说是要求形成信息就是价值、就是效益、就是生存权的自觉意识。n 1.2 文献信息的基本概念 n 1.1信息的定义 信息(Information) 信息是客观世界的一切事物(包括自然界和人类社会)发出的消息,信号及信号中所包含的指令、数据及其它内容的总称。 信息可分为三种: 一是被人类所认识的,被利用来为人类自身服务的自然信息。 二是反映社会历史发展过程中的具体事件、事实、数据、情况等事实性信息。 三是在实践活动中产生的反映自然界和社会规律的理性信息,它呈现为系统化形式,并表现为概念、判断、推理和理论,也称为科学信息。 物质、能量和信
3、息是构成世界的三大基本要素。知识(Knowledge) 知识是人类在改造客观世界的实践过程中获得的认识和经验的总结 情报(Intelligence, Information) 情报是知识的传递并起作用的部分。情报有三个基本属性: 1、情报的知识性:一般地讲,情报是一种新的知识。科学技术的发展意味着新的知识的产生和陈旧知识的更替。 2、情报的传递性:也就是说,情报的本质是知识,而这些知识如不进行传递,仍不能称其为情报。 3、情报的效用性:也就是说,情报是一种有价值、有效用的知识。 文献的定义 “是记录有知识的一切载体”。这是我国国家标准中所下的定义。文献的构成包括四个要素: 1、知识内容,即文献
4、的内容。 2、物质载体,如甲骨、竹简、纸张、胶卷、磁盘、光盘等。 3、记录符号,如文字、图表、声音、图像等。 4、记录手段,如刀刻、书写、印刷、录音、录像等。 1.2.2 文献的级别和载体类型 根据对文献加工程度的深浅和文献内容性质,可将文献划分为:1. 零次文献 (non-printed sources) 把不见诸于文件的面谈、开会等情报信息知识的交流形式,称之为“0次文献”。2. 一次文献 (primary sources) 一次文献(也称原始文献)是指作者以自己的科学实验、生产实践的成果而撰写的文献,它是报导新发明、新创造、新技术、新知识的原始创作。 一次文献是科技工作者的重点参考文献。
5、 3. 二次文献 (secondary sources) 也称为检索工具。它是将分散的、无组织的一次文献,经过筛选后,按其内容特征(例如主题、分类等)和外表特征(例如著者、序号等)进行加工、编辑而成有系统的文献,如文摘、索引、书目、题录、简介等检索工具。 它专供检索一次文献而用。一般是一次文献发表在先,二次文献发表在后。 特点:系统性、报道性、浓缩性、易检性。 4. 三次文献 (tertiary sources) 在合理利用二次文献的基础上,选用一次文献的内容,根据一定的需要和目的,进行分析、综合、评论而编写出来的文献。 如专题述评、动态综述、学科年度总结、学科进展、辞典、手册、百科全书等。
6、特点:在于综述性、资料性、总结性和先导性。 文献举例 一次文献是文献的基础,是文献检索的对象; 二次文献是一次文献的简略和有序化,是文献检索的工具; 三次文献是按知识门类或专题进行综合加工的产物,也是科技信息的重要来源。以载体的物理形态区分的文献类型11、按物质载体和记录形式划分 按物质载体和记录形式不同,可分为印刷型、缩微型、声像型、机读型(也可称电子型)、等四种类型。 n 印刷型(printed form)文献 是通过铅印、油印和胶印等手段,将知识固化在纸张上而形成的一类文献。n 缩微型(microforms)文献 以感光材料为载体,通过光学摄影方式将文献的影像固化在感光材料上形成的一类文
7、献。n 声像型(audio-visual form)文献, 也称视听型文献,是指通过特定设备,使用声、光、磁、电等技术将信息转换为声音、图像、影视和动画等形式,给人以直观、形象感受的知识载体。n 电子型(electronic form)文献 原称机读型(machine readable form )文献。它通过计算机对电子格式的信息进行存取和处理。 上述的缩微型、声像型和电子型文献都属于非书出版物。 1.2.3 印刷型文献的出版类型按出版形式和内容的不同,可分为: 图书、期刊、报纸、科技报告、会议文献、专利文献、标准文献、学位论文、政府出版物、产品样本资料和技术档案等。 n 1.图书(book
8、) 图书是指论述或介绍某一学科或领域知识的出版物。 一般有完整、定型的装帧形式,是比较成熟、定型的出版物。 根据国际标准(ISO0690-1987),图书在附于原始文献的参考文献著录格式为: Etten V W. Fundamentals of optical fiber communication. London: Prentice-Hall ,1991 是作者的姓名;是书名;是出版社所在地的城市;是出版社名;是出版的年份。 图书的著录特点: 有著者、书名、编号; 有出版地、出版社名和出版年份。 有时有表示主编(edited.eds)和版次的信息 (edition); 有时还给国际标准书号(
9、ISBN)书号 一般图书的标准著录格式: Fundamentals of optical fiber communication. Prentice-Hall,London, 1991,564p, (1-5013-1289-3) 书名;出版社;出版地;出版年;图书总页数;国际标准(ISBN)。n 国际标准书号的识别: 如:ISBN 7-5013-1289-3其定长为10位数字,分4个部分 ISBN 7-5013-1289-3ISBN (International Standard Book Number)2. 期刊(journal, Periodic)期刊是指有固定名称、统一出版形式和一定出版
10、规律的定期或不定期的连续出版物。 期刊论文在参考文献中的标准著录格式如下例所示: Tohyama H.A plasma Image bar for an electro-photo-graphic printer. Journal of the Imaging Science, 1991, vol.35 no.5330-3 (OR: J. Imag. Sci., 1991, 35(5), 330-3) 在上例中是作者的姓名;是篇名;是期刊名称;, 是期刊出版的年份;是期刊的卷、期数;是文章所在的页数。 期刊论文著录的特点: 有作者,有时有篇名; 常常有表示期刊的单词,如Journal、acta
11、、annales、bulletin、transactions、proceedings、review、progress/advances in、communication、letters、news等。期刊名称常常缩写,有的还以斜体给出; 必定有卷号,有的有期号。其中后两点是判断是否属于期刊论文的主要依据。期刊的标准著录格式 Journal of the Imaging Science,vol.35,no.5,1991,P.330-3,ISSN3645-8102 刊名; 该刊的卷; 该刊的期数; 该刊的出版年;,该刊的页码;为国际标准连续出版物号3. 会议文献(conference paper)
12、会议文献是指在国际和国内重要的学术或专业性会议上宣读发表的论文、报告。 它的特点是:传递信息及时,针对性强;内容新颖,学术水平较高;出版形式多样;一般都标有会议名称、会议时间、会议地点及主办单位等。 会议文献在参考文献中的标准著录形式如下例所示: Sellis T. Performance of DBMS implementation of production systems. Proceedings of the 2nd International IEEE Conference on Tools for Artificial Intelligence Herndon, VA USA, 6
13、-9 Nov.1990, (Alamitors, CA, USA:IEEE Computer Society Press 1990), 393-9 在上例中, 是作者的姓名, 是文章的篇名, 是会议录名称, 分别是会议的举办地点和举办时间,分别是会议录出版地、出版社和出版时间。 会议文献著录的特点: 有表示会议的专门用词如:Conference, Workshop, Meeting, Convention, Congress,Genenal Assembly,Seminar,group or Expert group meeting,Committee, Symposium, 有时有表示会议录
14、的一些词,如Proceedings of,Collection of; 有时有会议召开的地点、时间以及会议录的出版地、出版社、出版年份等。 这三点中第一点是判断是否属于会议文献的最重要的依据。4. 报告(report) 报告是指国家政府部门或科研生产单位关于某项研究成果的总结报告,或是研究过程中的阶段进展报告。它大致可以分为两大类: 基础理论研究; 实践生产技术。 科技报告在参考文献中的标准著录形式如下例所示: Bumes J S. Application of approximationtheory in antenna design, signal processing and filte
15、ring. Final report.AD-A244,725, Promethe-Sus Inc.,1991 科技报告著录的特点是: 有著者、篇名、报告号和报告完成单位名称; 有表示报告的词,如report等; 有报告号,如本例中的AD-A244,725。这三点中后两点是判断是否属于科技报告的重要依据。5. 标准文献(Standard) 标准文献指标准化工作的文件,是经过公认的权威当局批准的标准化工作成果。其中主要为有关工业产品和工程建设的质量、规格和检验方法的技术规定文件。 标准文献著录的特点是: 有标准制定单位名称和标准题目。 通常有表示标准的词,如:recommendation等。 有标
16、准号。 这三点中第二点是判断是否属于标准文献的重要依据。7. 学位论文(thesis, dissertation) 学位论文是指高等院校、科研单位的研究生为申请硕士、博士等学位而提交的学术论文。8. 档案(archives) 1.3.4 电子文献的类型 按照载体的形态,电子文献可以有软磁盘(FD)、只读光盘(CD-ROM)、可擦写光盘(CD-RW)等之分; 按照文献的电子格式,电子文献有文本格式的txt文件、doc文件、pdf文件,图像格式的gif文件、jpg文件以及标记或标置文件格式的html文件和xml文件之分; 按照出版周期和内容特点,电子文献可以有电子期刊、电子图书、电子报纸以及数据库
17、等之分;1.电子图书(electronic book,e-book) 电子图书是指以数字化方式发行的、有ISBN编号的单卷本正式出版。电子图书因载体不同,或使用光驱或从网上下载阅读。2. 电子期刊(electronic journal, e-journal) 电子期刊是指以数字化方式发行的、有ISSN编号的系列正式出版物。1.4、国内文献信息系统包括: 科技信息系统 社会科学院系统、 高校系统 公共图书馆系统。 CALIS的含义和作用1.4.4 文献信息的学科分布规律 根据相对利用率的多少,我们把与一个学科有关的文献分成核心文献、相关文献和边缘文献三类。核心期刊的概念:指刊载该专业论文数量较大
18、(信息量较大),学术水平较高的,能反映本学科最新研究成果及本学科前沿研究状况与发展趋势的,倍受该学科专业读者重视的期刊。属性:布拉德福定律: 如果将科技期刊按其刊载某专业论文数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个领域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2.的关系。 第章 信息检索原理 2.1.1信息检索的定义和类型 1信息检索的定义 检索的含义 “检索就是查找”,这仅仅是一种狭义的解释。从广义的角度讲,检索包括“存贮”和“查找”两个过程。没有存贮就没有查找,存贮是为了查找,但查找必须有存贮,两者缺一不可。 “检索”(Retrieval)一词是一个
19、外来词,来源于英语“Information Retrieval”(信息检索) 信息检索 是指从任何信息集合中查出所需信息的活动、过程与方法。广义的信息检索还包括信息存贮,两者又往往合并称为信息存贮与检索(Information storage and retrieval)。1.2.3文献的内部特征和外部特征文献的内容特征: 就是可以从某种角度反映文献内容的特征。文献的内部特征包括文献的题目、摘要、由著者或图书情报人员给出的主题词及其分类号。文献的外部特征: 是与内容特征关系不是十分密切的一些特征,包括文献的作者姓名、作者所在的工作单位名称,期刊刊名、会议录名称、专利说明书的专利号和科技报告的报
20、告号等。这些特征通常在文献的封面或扉页出现。 2.2.1信息检索的一般原理 无论是手工检索,还计算机检索,各种检索系统的检索原理基本相同。 简单地讲,就是检索提问标识与存贮在检索工具中的标引标识进行比较,两者一致或信息标引的标识包含着检索提问标识,则具有该标识的信息就从检索工具输出,输出的信息就是检索命中的信息。 存贮过程就是按照检索语言(主题词表或分类表)及其使用原则对原始信息进行处理,形成信息特征标识,为检索提供经过整序(即形成检索途径)的信息集合的过程。 信息检索同样包括存储和检索两个过程。 信息检索原理示意图:存贮过程 检索过程 (1)信息检索根据检索对象不同,可分为:文献检索、数据检
21、索、事实检索 A.文献检索 (Document Retrieval)。 文献检索是以文献为检索对象的信息检索。也就是说文献检索是以图书、期刊、资料、数据库中的篇章或全书刊为检索对象的一种检索。 如:检索有关“我国关于教育产业化研究” 或着检索“花卉组织培养技术”的文献。 文献检索是一种相关性检索,检索结果不直接回答用户提出的技术问题,只是提供与之相关的文献供用户参考。 B.数据检索 (Data Retrieval)。 数据检索是以数据为检索对象的一种检索,其检索结果是可供直接使用的科学数据,包括数值、公式、图表等。查找科学技术参数、统计数字、财政信息数据、市场行情数据等都属于数据检索。 检索结
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息检索 复习资料 信息 检索
限制150内