《信息组织》知识点汇总.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《《信息组织》知识点汇总.docx》由会员分享,可在线阅读,更多相关《《信息组织》知识点汇总.docx(35页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、信息组织知识点汇总第一章第一节、信息组织的必要性1. 信息组织:依据信息检索的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等的分析、选择、标引、处理,使其有序化并以适当方式加以供给的活动。2. 信息检索:依据检索需要,从检索系统中检出相应信息资源的过程。 3信息资源:通常指一切以记录形式存在的信息载体,只是比较而言,更侧重于对型媒体形式的强调。可以是图书、期刊、报纸、论文,也可以是网络上的电子资源 4.信息组织与信息检索有什么关系?(1) 信息组织是信息检索的根底和前提,只有对信息资源进展处理和有序化信息系统之后,才能准确有效查找相关信息资源;(2) 信息检索则是信息组织动身点与归
2、宿,用户的检索需要是组织信息的主要依据。其次节、信息组织的形式和检索途径1. 文献组织的根本排列方式:一般有两种根本排列方式,其一为:固定排列法和按肯定意义的次序排列。固定排列法,如档案、博物馆的保藏、光盘、录音带、缩微品。按肯定意义的次序排列,如图书、期刊等2. 依据检索工具的对象和特点,可以分为文献名目、索引、机读数据库、网络搜寻引擎四种类型。3. 依据标识特征,检索工具可以分哪两种根本类型?(1) 以信息资源的外部特征形式特征为检索依据,供给以信息资源形式特征为标 识检索途径。常见的信息资源形式特征有责任者名即作者和与资源形成相关的人或机 构,如译者、改编者、修订者等、题名、机构名、标准
3、书号、专利号、文献登录号或挨次号等。(2) 以信息资源的主题内容特征为检索依据,供给从资源内容进展检索的途径,主要有分类法、主题法。4. 依据系统中所用的标识是否进展掌握,检索工具可以分为受控检索系统与自然语言检索系统。5. 依据系统中标识组配的特点,检索系统可以分为先组式和后组式两种。6. 检索工具还可以依据承受的形式,分为卡片式、书本式、缩微式、电子方式等。第三节信息组织的处理方式和争论内容1. 检索语言:一种由表达信息资源主题概念及其相互关系的词汇及规章组成的人工语言系统,也称情报检索语言。2. 学问组织系统:学问组织系统通常指经过组织的学问构造表达的工具,它试图包含组织信息和促进学问治
4、理的各种类型的词表,其范围从传统的地名表、同义表,到型的学问组织工具。3. 信息处理的根本做法:领悟1) 描述信息资源,以便识别与确认它,主要方法是着录、编写题录和资源形式特征的描述; 2浓缩信息资源内容,主要方法是编写内容提要或文摘,供用户了解、选择和推断信息资源; 3供给检索点。主要方法是确定特定资源的标索特征或标识与可检信息。信息资源的检索点有代表其内容特征和形式特征的各种标识,如题名、责任者、分类号、主题词或关键词等4. 信息组织活动的内容:领悟 信息组织活动包括两个根本方面:1信息组织的操作。指依据信息资源的内容和特征,对信息资源进展描述、标引、并将其组织进相应系统的过程。2信息资源
5、的组织标准。这是依据信息组织的需要,依据信息资源的特点预先确定的规章和方法系统,是进展信息组织操作的依据。其次章信息组织原理第一节对信息组织的要求1. 检全率:是指一次检索中检出的与提问相关的信息资源数量占系统中全部与提问相关的信息资源数量的比例,检全率=检出的相关信息资源量/系统中相关信息资源总量子数100%2. 检准率;是指检出的相关信息资源的数量,占检出的全部信息资源数量的比例。检准率=检出的相关信息资源数/检出的信息资源总数100%3. 简述对信息组织的要求。领悟(1) 检全率。略(2) 检准率。略(3) 检索速度和系统的准时性。检索速度是指用户从实施检索到得到结果化费的时间, 它是衡
6、量系统检索速度与使用效果的重要参数。它与系统响应检索的力量、检全率、检准率、资源组织的全理性等因素有关。系统的准时性是指检索工具处理信息和供给信息所用时间较短,能快速纳入、处理和供给信息。(4) 系统易用性。是指标引人员使用检索系统描述、标引资源是否便利和易用;用户使用系统的简易性、便利性与猎取信息的简洁程度。系统易用性是系统性能的主要因素, 打算系统设计改进和进展方向。(5) 检索的本钱效益。是指检索系统的本钱和效益之比。检索本钱包括系统设备费、标引处理费、检索运行费;检索效益指检索系统制造经济效益和社会效益。好的检索系统是低本钱高效益的系统。其次节信息组织中的掌握与标准1. 句法掌握的方法
7、主要有哪些?句法掌握是依据信息资源标引和检索的需要,依据肯定的组词造句规章,对检索词的组合方式做出的规定。常见的句法措施有确定引用次序、使用关心符号和句式转换。(1) 引用次序,是指复合主题标引和检索时,各个主题因素的组合次序。在分类法中引用次序是指类目划分标准使用的先后次序或各主题分面在组配时的先后次序;在主题法中是指字顺检索系统中主标题与各级子标题组合的次序。(2) 关心符号,是提醒主题概念之间的关系意义、进展检索操作的符号。常见的有: 关系符号:是一种用于提醒词语组配中形成的关系类型的符号,通过对组配中关系类型的表达,对标引词进展掌握,说明组配性质并有肯定的排序功能。联系符号:是一种提醒
8、同一文献主题之间联系强度的符号,可以防止主题词之间消灭误组配。职能符号:是一种表示主题标识在组配中的句法职能的符号,可以明确一个标识串句子中各主题因素的施动-受动作用,明确法含义,提高检准率。(3) 句式转换,是为了使检索句子各个有意义的词素能成为检索入口字,通过对语句中词语位置的变动来增加检索点。常见的有:轮排转换,将检索语句中每个有意义的词依次排在检索入口,其他词在保持相对位置的状况下移动。链式转换,以逐次折卸句子链环的方法,将每个有检索意义的的词语依次排在检索入口。分析转换,在一个检索词句中,每次抽取少量的词组配成标题,依次把每个有检索意义的词排在检索位置上。2. 词汇掌握的范围是什么?
9、领悟词汇掌握:即依据标引和检索的需要,对自然语言中的的词汇进展优选、标准、提醒相关性的过程。2词汇掌握的主要措施包括:同义掌握:是对字面形式不同而含义一样的词进展掌握,使检索系统中一个概念只有一个词语表达。包括对同义词、准同义词及局部专指词与泛指词进展的掌握。同义掌握常用的方法是在几个词中选取一个作为标准词,在标准词和非标准词之间建立用代参照,便于用户从非标准词找到标准词。同义掌握的作用是可以抑制一义多词的自然语言现象,把一样内容或特征的信息资源集中在一起。如:自行车代脚踏车单车词义掌握:是对同形异义词和语义模糊的词进展掌握,使词义明确,一个词语只表示一个概念,以掌握一词多义现象。词义掌握常用
10、的方法是在词后加限义词,在词下增加含义注释和范围注释。疲乏生理;疲乏心理词间关系掌握:是提醒词汇之间的等级、等同、相关关系,使之成为语义相关的系统。在主题法中词间关系掌握承受设置参照、倒置标题、主标题-副标题以及编制词汇索引系统,如词族索引、范畴索引、轮排索引等。分类语言主要通过类目体系显示词语间的附属、并列、相关关系,用类目参照显示语词概念的横向联系。3. 相关因素掌握的主要内容领悟常用的相关掌握包括引用关系、链接关系和用户需求等。引用关系:这是科学文献中通过相互引用建立的一种关系,通过它,可以依据相互引证关系,提示文献之间内容上的联系。链接关系:是基于超文本链接技术建立的对象之间的联系。用
11、户需求:信息组织是为用户效劳的,因此用户的检索需求是信息组织的目标和推断信息组织使用效果的重要指标。第三节标准掌握的依据1. 概念之间的关系类型。同一关系:“自行车”与“脚踏车”、“电子计算机”与“电脑”。包含关系:“哺乳动物”与“熊猫”、“图书馆”与“公共图书馆”。穿插关系:“妇女”与“科学家”、“中等教育”与“业余教育”。冲突关系:?“核国家”与“非核国家”。两者之和等于上位概念“国家”。“脊椎动物”与“无脊椎动物”反对关系:中医学与西医学。两者之和小于上位概念“医学”。 “无产阶级”与“资产阶级”、“有机肥料”与“无机肥料”并列关系:“人造棉”与“锦纶”、“维纶”、“腈纶”2. 学问分类
12、:依据学问组织的不同对象和层次,现有的学问组织体系包括:科学分类体系、学科分类体系、事物分类体系、行业分类体系等。见P24-25 页表3. 阐述文献保证原则和用户保证原则。文献保证原则:亦称文献依据,指信息资源组织应依据信息资源类型、数量等因素进展相应掌握。信息检索系统处理的对象是各种类型信息资源,因此要有效进展信息描述及主题内容的组织和提示,离不开对信息资源的内容、特征以及分布状况等的了解。信息资源的数量、特点,往往是影响检索语言详略程序、确定类目或标识设置的重要依据。用户保证原则:指依据用户需要进展描述掌握和词汇掌握。检索系统是为用户效劳的, 各种掌握和组织措施如不符合用户的检索要求和使用
13、习惯,必定会影响其使用效果。因此对信息检索系统在进展标准掌握时,应当有意识地从用户的使用需要动身。4. 信息资源组织对分类的借鉴。信息资源组织以学问分类为根底,可以较好的提醒各个领域学问之间的关系和规律性, 准时反映各学问领域的进展。可以包括多种层次和方面,如:作为信息资源分类的根底,用于建立合理的信息组织的构造。作为根底类目门类的设置依据。作为主题系统中范畴处理的依据。作为特地领域下具体类目的设置依据。作为类目之间关系、词间关系处理的依据等。第三章信息描述第一节、信息描述的含义1. 信息描述的信含义:亦称信息资源描述,是指依据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进
14、展分析、选择、记录的活动。2. 元数据:是关于数据的数据,或关于数据的构造化的数据。其作用主要包括:识别:确认并对要进展组织的信息资源进展个别化描述,使用户能识别该组织的资源对象。定位:供给信息资源位置的信息,以便供用户访问时使用。检索,通过在描述数据中供给检索点,便利用户对资源的检索和利用。选择,通过记录信息资源的各种特征,供用户对信息资源的使用价值进展推断,并作出选择。3. 信息描述的主要标准:ISBD 是国际标准书目着录的英文缩写,由国际图联IFLA1969 年制定的供各类信息资源描述用的国际标准。文献着录总则我国于 1983 年 7 月发表的全国文献着录总则。DC:是都柏林元素集的简称
15、,1995 年 3 月在美国小镇都柏林创立的元数据描述方法,是对网络资源描述最着名、最有代表性的标准。其次节信息资源描述工程、标识和描述级次1. 信息描述工程:亦称着录工程,是用以提醒文献内容和特征的记录事项。2. 根本描述工程的内容:我国国家标准文献着录总则规定根本描述工程分为9 个大工程,依次为:题名和责任者工程;版本项;文献特别细节项;出版发行项;载体形式项;丛编项;附注项; 文献标准编号及有关记载项;提要项。都柏林核心集分 15 个大项:题名;创作者;主题;描述;出版者;参与者;日期;资源类型;格式;资源标识; 来源;语言;关联;掩盖范围;权限治理。3. 把握文献着录格式,描述各工程内
16、容:如以下图:正题名:说明题名文字/第一责任者;其他责任者.版次及其他版本形式/与本版有关的责任者.出版发行地:出版者或发行者,出版发行日期印制地:印刷者,印刷日期页数或卷册数:图;尺寸或开本+附件.丛书名/编者, 国际标准连续出版物编号;丛编编号.附属丛编附注国际标准书号装订:价格提要.书名.责任者.主题.分类号图:文献着录格式4. 着录详略级次参见P41 图 3-3,图 3-4,图 3-5简要级次:仅记录主要工程的级次,一般为小型文献单位; 根本级次:记录主要工程的同时,记录局部选择工程。最常见具体级次:记录主要工程和全部选择工程上。适合国家书或集中编目使用。描述信息源:又称着录信息源、着
17、录依据,指进展信息资源描述时描述信息的来源和出处。第三节检索点和标准文档1. 检索点是指检索信息资源使用的题名、责任者、分类号、主题词等供检索使用的各种数据。2. 标目的含义及作用。标目即手检系统中的检索点,是记录中用来作为排检依据的资特征。标目有两个作用:作为排检的依据,确定一款目在检索系统中的位置,供检索查找。打算款目的性质,供组织相应检索工具使用。3. 参照法的含义和类型。参照法是指引用户从检索工具中的一个标目或款目去查找另一个标目或款目的方法, 其作用是指引检索系统中检索对象之间的联系,说明检索系统的编制和使用方法。分为: 单纯参照,又称直接参照,从不用作标目的标识去查找用作标目的标识
18、。相关参照,又称兼互参照,从一个使用的标目去参考另一条或几条相关标目的参考。一般参照,又称一般参照,是供给关于肯定编目事项的说明,介绍用户使用系统的方法。4. 名称标准文档:是一种对描述记录中的名称标目进展标准掌握的工具。其处理的范围, 包括人名、机构团体名、着作题名等。P455. 题名检索点的选择方法:P43文献描述中着录的正题名一般直接选作标目。适中选择副题名和附注项中的合辑题名作标目。并列题名在我国中文手工检索工具中一般不选作标目。一文献的题名检索点一般不宜超过两个,但题名分析款目不受此限制,可依据需要设置。6. 个人责任者检索点的选择方法:描述记录中第一责任者、两人合着中的其次个责任者
19、名称均可以作标目。但3 人以上合着时只以第一责任者名称作标目。如可能,文献责任者中记录的其他责任方式的责任者亦可选择作为标目。附注项着录的责任者,以及其他有关责任者,一般不作标目,但在必要时,着名学者或着名着作的责任者也可作标目。以书名命名的编写组不作检索点、临时性写作团体如无检索价值,也不做检索点。丛书综合款目的责任者选择与单书一样;分散着录时,单书作者可选为第一责任者。假设编者为出版社则不编制责任者综合款目。当分析出来的材料的责任者与原书责任者不同时,应选其为分析款目的责任者检索点。 一文献责任者检索点的数量一般不超过 4 个为宜。7. 标准文档:是信息组织的一种需要,它是对元数据记录的标
20、目进展掌握、跟踪、维护工具。包括名称标准档、主题标准档等。其中,名称标准掌握是依据确定标目的需要, 规定统一使用名称的活动,范围包括人名、团体名、题名等。标准掌握的作用是:(1) 有利于以统一的方式加以记录。(2) 以标准、通用的形式加以记录。(3) 便利标引和检索。(4) 有助于实现国际书目共享。第四节计算机编码1.MARC-Machinereadablecataloging,机读编目格式是依据文献特点和文献机构之间信息交换的需要建立的标准化的计算机可读形式。MARC 中一个编目记录的构造四个局部 2.分隔符:P52 页分隔符用于分隔不同数据集合,分为字段分隔符和记录分隔符两种。字段分隔符以
21、“*” 表示,用于标志字段结尾。记录分隔符用于标志记录的完毕,以“#”表示。3. 计算机编码的作用。P50(1) 用以显示。(2) 供给检索点。(3) 可以对数据进展一体化处理,促进资源共享。第四章信息描述工作第一节信息描述工作概述1. 信息描述工作:依据描述规章,对信息资源的特征进展分析、选择、记录的操作过程。2. 元数据在检索系统中的作用: 向用户供给信息资源的名目学信息,供使用者确认信息资源,进展选择 元数据的各种特征也是进展组织和检索的依据,是建立检索工具的根底和前提3. 信息描述工作的方式类型分类依据工作方式类型描述的资源对象文献编目、档案编目、博物馆藏品编目、网络资源编目操作的设备
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息组织 信息 组织 知识点 汇总
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内