第2章文献信息检索基础.ppt
《第2章文献信息检索基础.ppt》由会员分享,可在线阅读,更多相关《第2章文献信息检索基础.ppt(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第2章 文献信息检索基础第第2章章 文献信息检索基础文献信息检索基础2.1 文献信息概述文献信息概述2.2 文献信息检索文献信息检索第2章 文献信息检索基础作为人类所特有的,承载和传递文明的载体,文献记录着人类在漫长的历史长河中逐渐积累的经验和创造的知识,成为人类不断发展进步的智慧源泉。在浩如烟海的文献信息资源中,检索所需要的特定文献,需要借助科学的检索方法和策略,需要熟悉和掌握文献信息检索的基本原理和知识。第2章 文献信息检索基础2.1 文献信息概述文献信息概述第2章 文献信息检索基础2.1.1 信息、知识、情报、文献1. 信息信息(information)一词原意是通知、报道或消息。作为一
2、个科学概念,信息在19世纪末最早出现在通信领域,是指通信系统传输和处理的对象。根据近年来人们对信息的研究成果,科学的信息概念可以概括为:信息是对客观世界中各种事物的运动状态和变化的反映,是客观事物之间相互联系和相互作用的表征,表现的是客观事物运动状态和变化的实质内容。利用文字、符号、声音、图形、图像等形式,通过各种渠道传播的信号、消息、情报或报道等内容,都可以称之为信息。一般认为,信息具有如下特点:(1) 普遍性和客观性。信息广泛存在于自然界、人类社会及思维领域中。只要有事物存在,有事物的运动,就会有信息存在。而且,信息是不以人的意志为转移的。(2) 存储性、传递性与依附性。信息是可以被存储和
3、传递的。信息在空间上的传递称为通信,在时间上的传递称为存储。存储和传递是信息的两种基本状态,存储是静态的(相对),而传递则是动态的。信息的存储与传递都离不开物质作为“载体”和“媒体”,即信息必须依附在一定的载体上才能被传递和利用。(3) 共享性。同物质与能量的传递不同,信息源在发出信息后其自身信息并不减少,而且同一信息可以同时被不同的人共同享用。(4) 时效性。信息是有价值的,但是信息的价值又会随时间的推移而改变甚至消失。第2章 文献信息检索基础(5) 价值相对性。相同的信息对不同的人会产生不同的效果和结局。这就是信息价值的相对性。2. 知识知识是与信息相联系又有区别的概念。知识是主体获得的系
4、统化、组织化了的信息。知识反映了主体对客观事物存在及变化的内在规定性的认识,是主体获得的与事物存在及变化内在规定性有关的结构化、系统化的信息,是信息的高级表现形式。3. 情报情报是指被传递的知识或事实,是知识的激活,是通过一定的载体,越过空间和时间传递给特定用户,解决科研和生产中的具体问题所需要的特定知识和信息。情报既不等同于知识也不等同于信息,它是为实现主体某种特定目的,有意识地对有关的事实、数据、信息、知识等要素进行劳动加工的产物。目的性、传递性和效用性是情报最基本的属性。4. 文献我们可理解为,文献就是将知识、信息用文字、符号、图像、音频等记录在一定的固态载体上的结合体。可以说,文献是信
5、息的有形载体,是将游离流动的信息固化在物质载体上而形成的。文献由四个要素构成:(1) 信息内容,即文献所记录的知识和信息,这是文献的灵魂。第2章 文献信息检索基础(2) 符号系统,记录知识和信息的符号。文献中的知识和信息是借助于文字、图表、声音、图像等记录下来并为人们所感知的。(3) 物质载体,用于记录知识和信息的物质载体,如竹简、纸张、胶卷、胶片等,它们是文献的外在形式。(4) 记录方式,如铸刻、书写、印刷、复制、录音、录像等,它们是知识、信息与载体的联系方式。2.1.2 文献分类文献信息的形式多种多样,人们为了便于学习和利用,将它根据不同标准进行了归类和划分。1. 根据存储载体和记录形式划
6、分1) 手写型 手写型文献是指以手工方式将知识信息记录在各种载体上的一种文献形式。2) 印刷型 印刷型文献是以纸张为载体,以印刷技术为记录手段形成的文献形式。它的主要优点是便于阅读和携带、易于长期保存;缺点是体积大、信息密度低。第2章 文献信息检索基础3) 缩微型 缩微型文献是以感光材料为载体,利用光学技术将文字、图形、影像等信息符号按比例缩小的文献形式。缩微型文献阅读时需要较复杂的设备支持,具有体积小、信息密度高、便于收藏和保存、价格便宜等优点。4) 声像型 声像型文献是以磁性材料或感光材料为存储介质,以磁记录或光学技术为记录手段直接记录声音、视频图像的一种文献形式,故又可称为视听材料或直感
7、材料。声像型文献具有直观、生动、易于理解的优点;缺点是成本高、不易检索和更新。5) 数字型 数字型文献是通过编码和程序设计将信息转换成机读语言,存储到计算机外存设备上而形成的文献。数字型文献具有存储密度高、存取速度快、数据易修改、删除、更新并能实现自动检索等特点。2. 根据内容性质和加工程度来划分1) 零次文献 零次文献是指未经出版发行的文献,主要包括手稿、个人通信和原始记录等。零次文献内容比较客观,但具有不成熟、零散、不公开交流等缺点。第2章 文献信息检索基础2) 一次文献 一次文献又称为原始文献,是人们对研究或创造性活动成果的直接记录,一般指公开出版的著作、期刊论文、科技报告、会议文献、学
8、位论文、发明专利等。3) 二次文献 二次文献是指通过科学的方法,将分散无序的一次文献经过筛选、分析、整理,按其内容特征和外部特征进行提炼、浓缩,编制而成的有系统的文献,主要包括目录、文摘、索引等。4) 三次文献 三次文献是通过二次文献提供的线索,对某一范围的一次文献进行分析、综合研究、归纳、整理等深加工所生成的文献。三次文献具有资料性和实用性等特点,是对一次文献进行浓缩、提炼和重新组织的结果。 三次文献是按知识门类或专题将一次文献信息重新组织、高度浓缩而成的,是人们查考数据信息和事实信息的主要信息源。3. 根据出版形式划分根据出版形式,文献通常划分为图书、连续出版物、特种文献三大类。1) 图书
9、 图书是对已有研究成果、生产技术知识、实践经验的论述和概括。按其内容性质和作用,图书可分为普及读物、教科书、丛书、专著、论文集、参考工具书等。第2章 文献信息检索基础2) 连续出版物 连续出版物一般是指定期或不定期连续出版的刊物,包括期刊、报纸、年度出版物(年鉴、指南等)以及成系列的报告、学会会刊和会议录等。连续出版物内容新颖,出版周期短、速度快,能及时反映最新知识、最新科研成果和最新时事。期刊(也称杂志)通常有连续的数字编号和发行的顺序时间,是一种以印刷或其他形式逐次出版发行的出版物。期刊出版周期短,报道速度快,内容新颖广泛,信息量大,发行面广。报纸是一种以刊载新闻和评论为主的定期出版物。它
10、比期刊时间性更强,出版周期更短,报道信息更快。3) 特种文献 特种文献通常指那些出版发行方式或获取途径比较特殊的文献。类型复杂多样,主要包括专利文献、标准文献、会议文献、学位论文、科技报告、政府出版物、产品样本和档案文献等。专利文献蕴含着大量的技术、法律和经济信息,是记录有关发明创造信息的文献。专利说明书是主体。与一般文献相比,专利文献具有及时性、新颖性、详尽性、系统性、实用性、可靠性等特征。标准文献是对工农业产品和工程建设的质量、规格、检验方法及其技术要求等方面做出统一规定的规范性文献,具有一定的法律约束力。第2章 文献信息检索基础会议文献是在各种会议上宣读和交流的论文、报告和其他有关资料,
11、其特点是传递情报比较及时,内容新颖,专业性和针对性强。会议文献质量较高,能及时反映科学技术中的新发现、新成果、新成就以及学科发展趋势。学位论文是高等院校或研究机构的学生为取得学位,在导师指导下完成的科学研究、科学试验的书面报告。科技报告是对科学、技术研究结果的报告或研究进展的记录。科技报告注重详细记录科研进展的全过程,是科技人员交流其研究活动及成果的重要手段。科技报告的特点是较快反映新技术、新学科,内容新颖详尽,专业程度较高,数据翔实可靠,保密性较强,大部分属于保密和控制发行的文献。科技报告在一定程度上反映了一个国家或某一个学科的科研水平,是不可多得的信息源。政府出版物是由政府部门及其设立的专
12、门机构发布出版的文献信息资料,主要包括政府报告、政策法令、规章制度、会议纪要、调查统计资料等。政府出版物的主要特点是正式、权威,材料充实,数据可靠。它们是了解各国政治、经济、科学技术的方针政策及其发展状况的权威性信息来源。产品样本是对定型产品的性能、构造和原理、用途、使用方法和操作规程、产品规格等所作的具体说明,是进行技术革新、设备改造、试制新产品的重要技术参考资料。产品样本一般图文并茂、形象直观、可靠性强。同时,产品样本出版发行迅速,更新及时。产品样本的产品和技术信息比较完整,但多不提供详细数据和理论依据。第2章 文献信息检索基础档案文献是国家机构、社会组织以及个人从事政治、军事、经济、科学
13、、技术、文化、宗教等活动形成的具有保存价值的各种文字、图表、声像等不同形式的历史记录,是完成传达、执行、使用或记录现行使命而备留查考的文件材料。档案文献集记录性和原始性于一体,具有特殊的使用价值。档案的内容广泛、形式多样、材料来源庞杂。4. 根据获得的难易程度划分1) 白色文献白色文献指一切正式出版并在社会上公开流通的文献,包括图书、报纸、期刊等。2) 灰色文献灰色文献指非公开发行的内部文献和限制流通的文献,包括社会公开传播的内部刊物、内部技术报告、内部教材和会议资料等。3) 黑色文献黑色文献包括两方面的文献,一是未破译和未辨识其中信息的文献,如考古发现的未经分析厘定的古老文字;二是处于保密状
14、态和不愿公布其内容的文献,如未解密的政府文件、内部档案、个人日记、私人信件等。第2章 文献信息检索基础2.1.3 文献信息服务系统 文献信息服务机构是文献信息资源的最大集散地,它们负责搜集、整理、存储、传递各种文献信息。我国的文献信息服务机构主要有图书馆系统、科技信息服务系统、专利文献服务系统、标准文献服务系统和档案馆系统。1. 图书馆系统 图书馆是对文献进行搜集、整理、保管并提供服务的科学、教育、文化机构,其主要任务是整理和传递科学信息,进行社会教育,搜集和保存人类文化遗产。随着数字化信息的应用深入到各个领域,数字图书馆已成为图书馆的发展趋势。目前,数字图书馆正在成为社会的公共信息中心和枢纽
15、。2. 科技信息服务系统科技信息服务系统主要负责搜集、整理、研究和传递各种专业性学术信息,收藏各种类型的专业性文献,为广大信息用户提供专业性信息资源。其服务内容十分丰富,如为各级领导提供调研及决策信息,为专利申请或科技成果申报进行查新服务,进行科技成果转让及推广服务,编译专题资料等。我国有一个庞大的科技信息服务系统,它们分别隶属于不同的部门。其中最高级别的是隶属国家科技部的中国科技信息研究所,其次是隶属于各省、市的科技信息研究所,以及隶属国务院各部委的专业性科技信息研究所。第2章 文献信息检索基础3. 专利文献服务系统专利文献系统是国家科技信息体系的重要组成部分。专利文献中心是从事专利文献的收
16、集、存储、加工、检索和服务的专门机构。另外,专利文献中心也开展专利信息研究工作,编辑、出版有关专利文献的专题目录、索引、文摘等。我国专利文献服务工作主要由中国专利文献服务中心(国家知识产权局专利局文献馆)以及各地的专利代理机构(通常挂靠在各省科技信息研究所)负责。4. 标准文献服务系统标准文献服务系统由中国标准化研究院国家标准馆和各省、市标准化研究院(所)下设的标准馆以及国内相关标准文献收藏机构组成。国家标准馆隶属中国标准化研究院,是我国唯一的国家级标准文献、图书、情报的馆藏、研究和服务机构,是国家标准化管理委员会的基础信息支撑机构。国家标准馆是国家标准文献中心,负责全面收集、整理、存储我国的
17、国家标准、行业标准和企业标准,收藏国际标准,有选择性地收藏世界各国的标准文献,并提供标准文献的信息服务。各省、市的科技情报所、各种专业图书馆和标准颁布单位一般均收藏有部分标准文献。5. 档案馆系统档案馆是档案史料的服务中心,负责档案资料的收集、整理、保管并提供社会使用。我国档案馆大致可分为国家档案馆、地方档案馆、专门性档案馆和基层单位档案室等。第2章 文献信息检索基础国家档案馆主要负责收集、保管党和国家需要长久保存的档案和有关资料,并对其进行研究和利用。地方档案馆负责收集和保管各省、市、区档案资料。专门性档案馆负责保管各种专门性的档案。档案室作为各机关、企业、事业单位的一个部门,负责管理本单位
18、内部的全部档案资料。档案馆向全社会或本系统的用户提供服务,而档案室主要为本单位用户提供服务。第2章 文献信息检索基础2.2 文献信息检索文献信息检索第2章 文献信息检索基础2.2.1 文献信息检索概念广义的文献信息检索,包括信息的组织和查找两个过程,即将信息按照一定的方式组织和存储起来,并根据用户的需要找出有关信息的全过程。信息检索是根据需要,借助检索工具,从信息集合中找出所需信息的过程。文献信息的组织过程包括信息的描述、标引、整序等过程。信息描述就是对文献信息的外部特征进行分析提取,然后对这些特征加以规范化记录。信息标引就是对信息内容进行分析,并充分而有效地提炼标示的过程。信息整序,就是把获
19、得的信息的外部特征和内容特征按照一定的规则有顺序地组织起来。文献信息的查找过程包括:用户对所需信息内容进行特征描述;构成检索式或检索指令向信息检索系统进行提问;按照一定的检索技术将检索式与检索系统信息源单元进行比较匹配;以一定标准将匹配度较高者作为检索结果输出。文献信息的组织过程就是建立信息检索系统的过程,而查找的过程就是从信息集合中找出所需信息的过程。文献信息的组织和存储方式在一定程度上决定了信息查找技术和策略的运用以及检索的结果。信息查找的方法和所采取的检索策略则直接影响了信息检索的结果。组织是检索的前提,只有经过组织的有序的信息集合才能被检索利用,查找则是组织的反过程。组织与查找是相辅相
20、成、相互依存的辩证关系。第2章 文献信息检索基础文献信息检索的实质就是将用户的信息需求和文献信息的存储标识进行比较和选择,从中找出与用户需求一致或基本一致的信息。因此,文献信息检索是以文献信息的存储与查找所依据的规则基本一致为基础的,如果两个过程不能相符,信息检索就失去了基础,用户就查不到所需信息,存储也就失去了意义。2.2.2 文献信息检索语言信息检索语言又称情报语言、情报存储与检索语言、标引语言等,是根据检索的需要而创制的人工语言,是用于描述信息系统中信息的内部特征和外部特征及表达信息用户提问需求的一种专门语言。1. 检索语言的作用检索语言用于促成信息检索系统与检索用户的沟通。借助检索语言
21、,检索系统与检索用户所有的双向交流才能成为可能。一方面,检索语言可以在一定程度上规范用户的检索行为,使不同的检索用户遵循相同的检索规范。另一方面,参与信息检索系统建设的人员众多,尤其是信息标引,不同的标引人员必须依据统一的规则进行原始信息的标引。2. 检索语言的类型 (1) 根据检索语词的规范化程度,检索语言可分为人工语言和自然语言。 人工语言。人工语言又称规范化语言,即把检索语言中各种同义词、多义词、同形异义词作规范化处理,使每个词表达一个概念。第2章 文献信息检索基础人工语言采用特定词汇来指示宽度适当的概念,用户在检索时可省略该概念的全部同义词或近义词,避免了多次输入检索词的麻烦和出错的可
22、能。 自然语言。自然语言是直接从原始信息中抽取的未经规范化处理,用以揭示信息主题概念的自由词。自由词具有较大的灵活性,专指性强,能及时反映最新的概念和规范词难以表达的特定概念。(2) 按组配方式,检索语言可分为先组式语言和后组式语言。 先组式语言。先组式语言指在文献信息检索之前,表达文献信息内容的标识已经事先组配好了的信息检索语言。 后组式语言。后组式语言指表达文献主题概念的标识,在编制检索语言词表和标引文献时,不曾预先规定组配关系,而是在进行检索时,用户根据检索需要,按照组配规则临时组配起来的信息检索语言。(3) 按描述文献的特征,检索语言可分为描述文献外部特征的检索语言和描述文献内容特征的
23、检索语言。描述文献外部特征的检索语言。文献外部特征主要是指文献的题名、责任者(个人/团体)、出版者、报告号和专利号等。描述文献外部特征的检索语言将文献的这些不同特征按一定的顺序排列,形成文献的不同检索途径,来满足用户的检索需要。 描述文献内容特征的检索语言。该类检索语言指描述文献论述的主题、观点、见解和结论等的检索语言,如常用的分类语言、主题语言和引文语言都是描述文献内容特征的检索语言。第2章 文献信息检索基础分类语言是按学科范畴划分事物而构成的一种检索语言体系。分类语言以学科分类为基础,按照概念划分的原理,将知识概念从总体到个体,从一般到特殊、从全部到局部逐级划分,每划分一次就形成一批并列的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文献 信息 检索 基础
限制150内