信息组织知识点.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《信息组织知识点.docx》由会员分享,可在线阅读,更多相关《信息组织知识点.docx(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、主题法的含义主题,主要指信息资源论述的主题对象,包括事物、问题、现象等。 经过选择,用来表达信息资源主题的语词,称为主题词。所谓主题法,一般是指直接以表达主题内容的语词作检索标识、以字顺为主要检索途径、 并通过参照系统等方法提醒词间关系的标引和检索信息资源的方法。主题法一般都具有下述特征:1、直接以语词作为检索标识。 主题法不像分类法那样,以一种抽象的号码系统作检索标识,而是直接选用自然语言中的语词进展标引和检索。2、以字顺作为主要检索途径。虽然主题法往往也承受按范畴、 词族等方式组织主题词,但字顺方式始终是它的主要排检依据。我国的主题检索系统通常是依据汉字特点,依据拼音 或笔画笔顺进展排检的
2、;因此在使用主题法检索时,只要知道检索对象的名称,就可以按相应的排检方式进展查找。 在机检系统中,一般可以直接输入语词,由计算机进展查找,通用性好。以特定的事物、问题、现象,即主题为中心 集中信息资源。 分类法由于受学科体系的限制,从不同学科角度争论,同一对象的信息资源是分散在各学问门类中的, 主题法则是直接从主题对象的角度提醒信息资源。 4、往往是通过详尽的参照系统等方式提醒主题词之间关系。依据字顺排列不能必定提醒主题概念之间的联系,为了抑制这一局限,主题法进展了完备的参照系统,通过在主题词 下设置用、代、属、分、参等多种参照项,建立起“隐蔽的分类体系”。与分类法相比,主题法的特点是可以集中
3、与一 个主题有关的各个方面的信息资源,检索的直接性、通用性好,适合于进展各种专指检索,在性能上具有与分类法相 互补充的特点。 主题法通常不用于组织图书,只广泛用于组织各种检索工具,不仅可以利用它编制各类供手检使用的书目索引,同时也可以用来建立计算机检索系统,进展机检。依据主题法的选词方式,可以分为标题法、元词法、叙词法、关键词法;1、标题法 标题词,亦称标题,并非指文献“标题”中的词,是指经过词汇掌握,用来标引文献的词或词组,通常为比较定型的事物名称。如“图书”“信息资源”“信息组织”等。标题法是一种以标题词作为主题标识,以词表预先确定的组配方式标引和检索的主题法,是最早的一种主题法 。标题法
4、除了直接选取自然语言中的单词和词组作标识外,还大量承受复分标题,如:水果病虫害,;音乐奥地利;参考书书目;倒置标题如:化学,有机;化学,无机等,通过这些形式,对一个主题对象的各个方面及其特称进展专指标 引,并集中相关信息资源。标题法对标题词之间联系的提醒主要通过参照进展。标题法特点:承受列举式词表,形 式直观; 定组式标题构造固定,含义明确;依据词表列举的标题和副标题进展标引,操作便利; 主要通过以参照方式对词汇进展掌握,并提醒标题之间的相关性。标题法的缺乏是:由于承受列举方式,往往造成收词量巨大、 专指度相对缺乏、修订量大等问题; 大量承受定组式标题,在手索工具中使用时只能从规定的组配挨次入
5、手进展查 找,无法从多个因素、角度检索,必定会影响检索效果。作为一种传统的主题法类型,标题法开创了主题法的最初形 式,探究了标题法词汇掌握的一系列方法,包括:制订了标题的选择和确定的准则、规定了标题的形式、标题之间关 系的提醒、标题标引过程中组配的使用方法等。2、元词法所谓元词,是指用来标引文献主题的、最根本的、字面上不能再分的语词。 元词承受自然语言的形式,在由元词组成的检索系统(元词索引)中,各元词按字顺排列。元词具有概念的独立性与概念的单元性。概念的独立性系指 元词所表现的概念具有独立而完整的含义;概念的单元性系指元词所表现的概念是一个最根本的概念单元,即无论在 含义上还是在字面上都不能
6、再拆分。例如,“数学”是一个元词,它表现了一个独立的概念,又是一个单元概念,不能再拆分为“数”与“学”;“数学模型”则不是一个元词,它虽然表现了一个独立的概念,但可以进一步拆分为“数学”与“模型”两个元词。 元词法是为抑制标题法的缺乏进展起来的一种主题法类型,以元词作为主题标识,通过字面组配的方式表达文献主题的主题法。与标题法相比,元词法的特点是:词表体积小;标引专指度高; 便于从不同主题词角度检索适合对专指主题进展标引。 元词法的缺乏是: 直接性差; 不适宜用于查找论述根本主题的文献。 如:不适宜对论述“经济”、“化学”等根本主题的文献进展查找;承受字面组配方法,在字面分解与语义分解不全都时
7、,简洁造成误差。早期的元词法未建立参照系统,无法进展相关资料的检索。元词法在主题法进展中的 主要奉献是领先探究了后组式检索方法。 此外,元词法还广泛探究了后组式检索中的规律和问题,包括属于自然语言系统联号、职号等关心符号的使用方法以及对各种检索系统的适应性,为叙词法的进展和使用开拓了道路。叙词法 叙词,国内亦称主题词,是经过标准化处理的,以根本概念为根底的表达文献主题的词和词组。所谓叙词法, 是以从自然语言中精选出来的、经过严格处理的语词作为文献主题标识,通过概念组配方式表达文献主题的主题法类 型。 叙词法是在吸取元词法、标题法及分面组配式分类法等的优点的根底上进展起来的一个的检索语言语种。叙
8、词语言与元词语言的不同是,将分面分类中的概念组配引入主题法,在承受词汇标识进展组配的同时,以概念组配 代替了元词法的字面组配。叙词语言的概念组配虽然与字面组配一样,都是通过语词标识的组配表达文献主题的,但 两者存在着以下不同:其一、语词单元不同:元词法严格承受字面上不能再分的语词为标识单元,有时会影响对主题 内容的精准表达;叙词法改为以表达根本概念为根底,既收元词,又收词组,对主题的表达更加准确。其二、组配的 依据不同:元词法依据字面组配的方式对复合主题分拆和组配,方法简便,但往往会影响对主题对象的准确提醒;叙 词法依据概念关系对复合主题进展分解和组配,对主题的提醒比较精准。上述的改进使叙词法
9、抑制了元词法因字面组 配造成的语义误差,可以使标引结果更加准确。除上述特点外,叙词法的最显著的特点是,它是在综合多种检索语言检索方法的优点根底上进展起来的检索语言。根 据标引和检索需要,结合计算机的使用,叙词法广泛吸取多种检索语言的特点,用以构造叙词法的构造和方法体系, 不仅参照系统完善,同时还进展了多种形式索引,包括范畴索引、词族索引、轮排索引,直至编制各种形式的分类主 题一体化词表等,使其成为一种构造完备、功能丰富的检索语言。叙词法其特点如下: 构造完备,词汇掌握严格, 可以依据检索系统的需要对词汇进展有效掌握。组配准确,标引力量强,能够准确、专指地标引和提醒各种主题内 容;检索效率高,可
10、以通过敏捷组配方式进展多途径检索,到达较好的检索效果;对检索系统适应力量强,既能 较好适应计算机检索系统的要求,又能适应手工检索系统的需要。叙词法的缺乏主要是:由于词汇掌握要求严格, 词表编制和治理的难度大,需要花费较多人力、物力;文献标引须在概念分析的根底上进展,标引难度大,要求高。 关键词法 先组定组式主题法(编表时全部组配好)是指简单主题的标识,在词表中就已经组配好了的,使用时,可以直接从词表的标识中选取。标题法属于这一类型,分类法中的等级列举法也属于这一类型。 先组散组式(编表时局部组配好)是指简单主题的标识,在词表中并未组配,而是在标引阶段依据标引文献资源的主题需要进展组配。如叙词法
11、。 后组式主题法是指读者检索前,主题检索系统中的主题词是单立的,读者实施检索后,才依据检索需要进展组配。例 如:在读者检素“湖泊水污染”这一主题前,检索系统中只有“湖泊”、“水污染”等单立的标引词。读者输入检索要 求后,检索系统经过匹配,才形成“湖泊-水污染”的组配标识。元词法、叙词法就属于这一类型。数据:一般是指经过直接观看获得的对客观对象的记录事实。如图形符号、数字、字母等。信息: 信息是事物存在的方式和运动状态的表现形式本体论,不是物质也不是能量。主体所感知的表述的事物存在的方式和运动状态生疏论。本书认为信息是人类共享的一切学问、学问以及客观现象加工提炼出来的各种消息之 和。是经过人类处
12、理的数据。信息组织亦称为信息资源组织,它是依据信息资源检索的需要,以各种媒体、类型的资源为对象,通过对其内容特征等 的分析、选择、标引、处理,使其成为有序化集合的活动。信息组织与信息检索的关系 (1) 信息组织是依据信息资源的主题内容或特征,将无序的信息资源组织为有序集合的过程。信息组织是信息检索的根底,通常是依据检索的需要,以信息资源的肯定单元为单位,记录信息资源的特征, 并依据需要对局部信息资源进展必要的相关处理,然后将这些信息资源、记录或条目,按规定的方法输入系统,组成 文献资源库或信息检索系统。 (2) 信息检索则是依据需要,从检索系统中检出相应信息资源的过程。信息检索是信息组织的目的
13、和归宿,是信息组织的反向过程。 (3) 信息组织和检索中使用的、用以描述检索特征的掌握语言及规章,则是依据文献或信息资源组织和提醒的需要制订的组织标准。包括信息资源描述标准,情报检索语言等。前者如 文献的编目规章及各种元数据标准等,后者则是一种作为主题内容标引依据的人工语言系统,包括各种分类表或标题 表、叙词表以及分类标引和主题标引的规章系统等.(4) 信息标识选择和组织的标准是保证信息组织过程中处理的质量有全都性的重要依据,是信息组织和检索的重要工具。也有一些系统对信息资源主题内容的标引不依据词表,但这 类系统一般仍需要遵守肯定的标引和处理标准。信息组织的目的是组织各种类型的信息资源检索工具
14、,同时也在必要时对文献单位的信息资源进展有序化组织。直接 组织信息资源本身是信息组织一个重要任务之一。即依据肯定的方式,将信息资源本身直接纳入信息资源集合。这一 组织对传统文本文献的使用尤其重要,是文献单位信息组织的重要内容。主题法与分类法比较,分类法途径可以快速、准确地查找特定文献,但需要预先把握精准的数据,并且很难在此根底 上扩大对相关文献的查找;主题法途径则不必事先了解相应的数据,用户不仅可以依据使用需要直接检索特定主题内 容的文献,而且还可以通过系统中主题内容之间的联系,扩大或缩小检索范围,进展相关资源的查找,但对特定信息 资源的查找,不如前一种方法直接和准确,两者是相互补充的。各种检
15、索工具一般均供给这两类检索途径.传统文献单位对文献处理的根本目标主要包括:1识别、确认需要处理的全部的物理媒介的文献资源;2确认文献中或其局部中的著作;3 依据标准引文规章生成这些文献和著作的系统;4供给有价值的检索点,至少包括题名,责任者和主题等;5 在文献单位或其他检索集合中供给某种评论资源的方式。检索语言 是一种由表达信息资源主题概念及其相互关系的词汇及规章组成的人工语言系统,国内亦称为情报检索语言。它是依据检索系统的特点,依据使用需要和对学问关系的理解预先组织好的一种信息资源组织方法的体系,是信 息组织方法的具体表达。 检索语言由词汇和语法两局部组成。词汇是检索语言的主体,主要用于对所
16、使用的词汇及其相关性进展规定,是信息资源存储和检索的语言保障。其表现形式是各种词表,包括分类表或标题表、叙词表等,是 依据肯定的学问关系,预先建立的一个标识系统或组织标识系统的标准。语法,则是分类标引和主题标引的规章系统, 它们规定词集合的使用方法,是文献标引时必需遵守的标准。 自由标引与检索属于自然语言应用,但在肯定程度上仍 需要遵守肯定的语法标准。一般认为一个信息检索系统必需考虑的重要因素有“全、准、快、便、省。” 也是评价系统检索效率的几个重要指标.1 检全率亦称查全率、命中率,指系统实施检索时检出的与某一检索提问相关的文献数与检索系统中与该提问相关的实 有文献总数之比. 2检准率亦称查
17、准率、相关率,指系统实施检索时检出的与某一检索提问相关的文献数与检出的文献总数之比.一般而言,检索系统的检全率与检准率之间是一种互逆关系.检全率高,必定会检出一些内容关联程度较低 的文献,从而影响系统的检准率;反之,提高检准率,要求排解与检索提问相关程度较低的文献,从而影响检全率。 3、检索速度和系统的准时性 涉及组织时间和检索时间两个指标。 检索速度指用户实施检索时获得检索结果花费的时间。检索速度快,可以准时检出所需要的文献,直接影响检索系统使用效果。这一指标不仅与系统响应检索提问的速 度有关,同时也涉及查全、查准等因素,与文献的组织是否合理直接相关。系统的准时性指检索工具能否在较短时间 内
18、将文献纳入系统,尽快供给使用。为了提高信息组织的质量、缩短检索时间,检索系统通常需要花费肯定时间进展 标引处理。但处理时间过长,也会影响系统的时效。因此需要对信息组织方式加以改进或调整,力求在保证文献处理 和标引质量的同时,缩短处理时间。4、系统的易用性 包括标引者和检索者两个方面。对标引者而言,指系统是否便于进展描述和标引操作,是否需要把握简单的特地技能才能使用,在处理过程中为削减处理过失能否得到各种提示和 帮助等。 对检索用户而言,则是指系统检索是否易于使用,操作是否简单,是否需要预先学习才能实施检索;检索界面是否友好,是否配备有相应说明,并供给各种具有启发性的帮助等。 同时,易用性还包括
19、简洁获得信息的程度, 如:只能获得根本的描述信息或还可以获得文摘甚至获得文献如论文、期刊等本身,后者可以给用户带来更大的便利, 因而具有更大的易用性。5、检索的本钱效益指检索系统的本钱和效益之比。本钱一般指检索系统设备费用、标引处理 费用、检索运行费用。效益则是指检索系统的性能及因此产生的效益,包括猎取信息能取得的经济效益和社会效益。 本钱效益的目的是力求降低本钱、提高效益,改进价格性能比。关键是如何客观分析本钱与效益的实际状况,在合理 处理两者关系的根底上有效进展信息组织。检全率检出的相关文献量/系统相关文献总量x100%检准率=检出的相关文献数/检出文献总数Xl00检全率R (Recall
20、) =a/a + c = 检出的相关文献/检索系统中的相关文献; 检准率P ( Precision) =a/a + b =检出的相关文献/检出的文献.a 检出的相关文献; b 检出的不相关文献; c 未检出的相关文献;检全率与检准率的影响因素信息收录范围:信息收录范围, 主要指时间跨度、学科范围和文献信息档次等三方面。其中收录的文献数量的多少、年限的长短, 对检全率有重大影响。信息的质量:信息质量的好坏, 主要表达在两个方面: 一方面对原始文献(一次文献) 或是信息来说, 收录到文献数据库中的内容是否准确反映了源信息, 如篇名、刊名、卷期、页码等是否有错、漏、重复等; 其次方面是对标引来说,
21、是否正确反映原始文献的内容, 如分类号、标引词等是否恰当。数据的更周期:信息更周期越长, 最信息利用的时滞就越大, 在科技进展日月异的今日, 给系统的检索效率造成了很大障碍。如何缩短数据更的周期, 对提高文献的检全率有至关重要的意义。标引人员的素养:高素养的标引人 员对文献所涉及到的专业或是主题有比较深入的了解, 同时, 对标引学问及工具比较生疏的把握,对诸如分类法、主题词表,等有较丰富的阅历。能够深入分析文献主题并做出网罗性、专指性方面较适当的标引。标引策略:是对标引工作的 总的指导方针。如网罗性方面标引词的多少, 专指性方面分类分到几级类目,还有诸如承受何种检索语言进展标引, 是受控词还是
22、非受控词等, 这些对检全率与检准率提高有着打算性的影响。检索人员的素养:检索人员的素养表现在专业学问与检索学问两方面。治理系统软件功能:它主要包括了能够给用户供给检索途径或手段及用户的界面。词汇掌握指依据文献标引和检索的需要,对自然语言中的词汇进展选择、标准并提醒其相关性的过程.对词汇的掌握主 要包括: 词形掌握也叫同义词掌握多词一义 词义掌握 一词多义 词间关系掌握 词量掌握词类掌握 专指度掌握美国联机图书馆中心(OCLC)的协作联机资源编目系统(cooperative online resource catalog,简称CORC)明确规定,其文献入选标准应包括:1权威性:文献是否由图书馆、
23、档案馆、政府机构建立或有学会的背景,著者是否有声望.2时效性 现有的网址是否有编辑人员定期更.3长久性 网址的制作机构是否长久,该文献是否为闻性、时效性较强的文献,是否为个人主页。4广泛性 是否有用户推举过此类资源,是否具有广泛使用价值,该文献是否曾为书目工具或文章引用。句法掌握是指依据文献标引和检索的需要,通过肯定的组词造句的规章,对检索语词的组合方式作出规定。检索语句 中语词之间形成的关系,称为句法关系。通常应在肯定组配方式的根底上,承受相应的句法措施实现。常见的形式包 括: 组配次序,使用关心符号,轮排等。承受明确的组配次序的作用是 可以依据用户使用需要组织检索系统,提高检索系统的通用性
24、; 保证复合主题处理的全都性,不会因组配次序的不同造成主题文献资源的分散; 可以使标引结果含义明确,易于理解,避开错误的、无价值的组配关系消灭,提高标引的准确性。 使用统一的引用次序还有助于促进检索系统的全都性和可预见性概念是表达事物对象的特有属性或本质属性的思维形式,是检索系统沟通的内容。依据形式规律,一个概念一般包括 内涵和外延两个方面。 内涵指概念的含义,即概念所反映对象的本质属性的总和。 外延则是指具有该属性的事物对象,即所包括的范围。信息描述,亦称信息资源描述,是指依据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进 行分析、选择、记录的活动。在传统文献检索系统的编
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 组织 知识点
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内