文献检索复习资料.pdf
第一章 文献信息概论 一信息素养:人们在工作中运用信息解决问题的能力。它包括:(1)信息意识教育(2)信息道德教育(3)信息能力教育(信息素养教育内容)二信息、知识和文献关系(信息 知识 文献)三1.文献的定义为“记录有知识的一切载体”。2.文献的四个基本要素:知识内容、信息符号、载体材料和记录方式和手段(看课本 p5 了解相关四个基本要素所指内容)3.文献的级别(仔细看书 P5):按照加工深度不同区分,文献可分为零次、一次、二次和三次文献四个级别。4.零次文献:私人笔记、底稿、手稿、个人通信、新闻稿、工程图稿、考察记录、实验记录、调查稿、技术档案、e-mail通信、BBS公告板文章、BLOG和讨论组文章。一次文献:期刊论文、学位论文、科技报告、会议论文、专利说明、技术标准。(量大分散,了解举例)。二次文献:各种目录、题录、简介、文摘和索引(二次文献包括目录、题录和文献三种类型)。三次文献:综述研究类(专题评述、总结报告、动态综述、进展通讯、信息预测、未来展望),参考工具类(年鉴、手册、百科全书、词典、大全);例如:动态研究进展(报刊类)、动态综述都是属于三次文献。注意:原始文献是一次文献的另称,不是零次文献。二次文献是检索工具书 四印刷型、缩微型、声像型和电子型文献是以载体的物理形态区分的四种文献类型。(印刷型又叫纸质型;有缩微胶卷、缩微平片,以感光材料为载体这是缩微型;声像型也叫视听型,如唱片等;电子型又叫机读型,如磁盘、磁带、光盘。)注意:多媒体是声像型与电子型的结合。五P7-P10 有关文献的著录特征(看书上,能对上号,判断各种文献的类型)主要会写:图书著录格式:序号,主要责任者.书名M.版本(第一版可不写).出版地:出版者,出版年。(如:3曹志梅,范亚芳.信息检索问题集萃与实用案例M.北京:北京图书馆出版社,2008 期刊著录格式:如:14 叶志明.如何阅读学术论文(这是作者写的题目)、聆听学术报告J.学位与研究生教育,2004(11):5-6 (会议文献 Conference、Convention、Meetion、Seminar等特征词,科技报告有 report,且有 sec、ret等词,有 AD-A244725类例报告号,专利有 Patent 特征词,标准文献有 Standard特证词,学位论文有 thesis、discertantiorr特证词)六,按照交流渠道是否社会化,文献信息交流有直接交流和间接交流两种方式。七,(P13)如果按照文献类型分析我国文献信息资源的分布,除政府出版物外的九种文献,专利、标准、技术档案由国家的专业部门管理,他们是国家专利局、国家技术监督局和国家档案局以及各地的相应机构。学位论文由国家图书馆和中国科技信息研究所和毕业院校共同收藏。而图书、期刊、会议记录和科技报告等面广量大的文献主要是由国家文献信息系统提供。国家文献信息系统包括科技信息系统,中国科学院文献信息系统、高等学校图书馆系统和公共图书馆系统四个系统。八1.布拉德福文献分散定律:核心期刊区:相关期刊区:边缘期刊区 的比值大概为 1:a:a2 2.核心期刊是指经过专门机构研究认定的某一学科中水平和影响较高的期刊。(有三个特征:学科性、学术性、时间性)3.影响因子(IF):某一种期刊在第三年得到的前两年论文的引文数与该期刊前两年的总论文数之比。(可横向比较,但不是唯一的依据)4.H指数是指在一定期间内某位专家或群体发表的论文至少有H 篇的被引频次数不低于 H 次。第二章 信息检索原理 一,信息检索过程的实质是将检索提问标识与存储在检索系统(检索工具)中的检索标识(标引标识)进行比较,含有两者一致或信息存储的标识包含着检索提问标识的信息就是检索命中的信息。这就是信息检索原理。二,1.检索语言是用来描述文献的内容特征、外表特征和表达情报提问的一种人工语言。2.检索语言主要有以代码语言为特征的分类语言和以事物名称术语为特征的主题语言两大类。其中主题语言分为叙词语言和关键词语言。3.所谓分类法就是按照文献信息的内容、形式、体裁和读者用途等,根据科学学科之间的逻辑归属关系,采用层次型或树杈型结构,列举人类所有的知识类别,并对每一种知识门类分别标以相对固定的分类号,从而形成的分类表。4.国内通用分类法有:中国图书馆图书分类法(简称中图法)中国科学院图书分类法(简称科图法)5.叙词语言是以规范化科学名词为基础的一种主题法检索语言。所谓叙词是从自然语言中优选出来的经过规范化操作的名称术语。6.所谓关键词是指那些出现在文献的标题以及摘要、正文中,对表征文献主题内容有实质意义的语词。7.数据库是指至少由一种文档组成、能满足特定目的或特定功能数据处理系统需要的数据集合。8.文献信息数据库主要是文档记录字段,三个层次构成。一个数据库至少包括一个顺排文档和一个倒排文档。9.所谓检索效果是指检测结果的有效程度。常用的检索效果评价指标有收录范围、查全率、查准率、响应时间、用户负担和输出形式等。其中最主要的指标是查全率和查准率。10.主要概念即核心概念,是指课题研究的主演对象。11.扩展概念的方法:同一概念的检索词的扩展,基于内容分析的概念扩展法 基于检索结果的概念扩展法 12.按照功能和层次不同信息检索系统有目录、题录、文摘和全文系统。13.(P40)分类途径是按文献信息所属的学科类型来查找文献的一种方法。主题途径是根据文献的主体特征,利用各类主题索引进行检索的途径。检索方法:(1)直接检索法(2)间接检索法追溯法(回溯法)常用法综合法 14.(P43)1、逻辑运算符:或(or+)与(and*)非(not)2、优先算符:(若同时使用 OR、AND时)“()”不能单独使用 3、位置算符:N(near)、W(with)(看课本 P46表示含义)检索策略调整:对于输出篇数过多时,应该分析是否是如下原因造成:选用了多义性的检索词;截词截的过短输出的检索词太少应该使用逻辑与的使用了逻辑或优先运算符“()”使用错误。针对这些情况。需要减少检索结果。提高查准率的策略调整方法有:减少同义词或同族相关词增加限制概念,用逻辑与将他们连接起来使用字段限制,或者限制检索词在指定的基本字段出现,或者指定辅助字段,限制结果的文献类型、语种或出版国家使用适当的位置算符使用“非”算符,排除无关概念等。对于输出篇数过少的情况,应分析是否是如下原因造成:检索词拼写错误造漏重要的同义词或隐含概念检索词过于冷僻具体没有使用截词算符位置算符和字段算符使用的过多使用过多的“与”算符。针对这些情况。需要扩大检索范围。提高查准率的策略调整方法有减少“与”算符,增加同义词或同族相关词用逻辑式或将他们连接起来;在词干相同的单词使用截词算符去除已有字段限制,位置算符限制。第三章 互联网信息利用原理 一,1,统一资源定位器(URL)又称网址,是由域名加文件地址构成。2.互联网协议(IP)地址,一般为四段数字,中间用圆点隔开,IP 地址要唯一。3.域名一般由代表通信协议、主机名、机构性质和国家地区域名四段字母构成。4.(P54)按照是否具有原创性,网上信息资源有一次资源和二次资源的区分。一次资源是指首次发表的原创性信息。二次资源是转载已有的信息或从原创信息中提取的部分信息。5,(P61)搜索引擎按工作方式区分,可分为主题引擎,目录引擎和多元引擎。(P63)注意看一下主题引擎和目录引擎的主要区别 二,搜索引擎检索方法(以百度、谷歌为例 P64-67)三,网上学术网站资源的评价方法:(1)内容评价法 (2)网址评价法(3)形式评价法 (4)稳定性评价法 第四章 事实与数据检索原理 一、工具书:参考工具书、检索工具书(与普通图书和文献数据库相比,参考工书有科学性、规范性、实用性等特点)参考工具书:字词典、百科全书和年鉴和资料性工具 资料性工具可分为名录、数据汇编、图表汇编和产品资料汇编四类 查找事实数据的一般步骤:使用参考性工具书可以遵循查找准备、实施查找和归纳查找结果三个步骤。外文法:letter by letter word by word 字顺法:形序 号码 音序 参考工具书的排检法 分类法:学科体系排查法 事物性质排查法 主题法 时序法 地序法 第五七章 1.描述文献著作、题目和文献来源的信息称为文献的书目信息,2.SCI 科学引文索引 EI 工程索引 CA 化学文摘 3.专利的含义有三种:一是指专利权,二是指专利发明;三是指专利文献。4.专利文献是指与专利有关的所有文件,包括专利申请文件、专利公报、专利文献、专利法规定与专利诉讼文件等。5.按照信息交流渠道的不同,科技信息的收集方法分为非正式渠道和正式渠道。以上为个人总结的老师说的重点,由于时间仓促,肯定会有漏洞,望见谅。希望会对大家的考试有所帮助!希望大家取得好成绩!