信息组织—第二章信息组织原理.ppt





《信息组织—第二章信息组织原理.ppt》由会员分享,可在线阅读,更多相关《信息组织—第二章信息组织原理.ppt(47页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章 信息组织原理本章提示本章提示1、对信息组织的要求、对信息组织的要求2、信息组织中的控制与规范、信息组织中的控制与规范3、规范控制的依据、规范控制的依据一、对信息组织的要求1、检全率(查全率)、检全率(查全率)系统实施检索时检出的与某一检索提问相系统实施检索时检出的与某一检索提问相关的信息资源数与检索系统中与该提问相关的关的信息资源数与检索系统中与该提问相关的实有信息资源总数之比。实有信息资源总数之比。检全率检全率=检出相关信息资源量检出相关信息资源量系统相关信息资源总量系统相关信息资源总量100%表示系统检出相关信息资源的能力。表示系统检出相关信息资源的能力。一、对信息组织的要求2、检
2、准率(查准率)、检准率(查准率)系统实施检索时检出的与某一检索提问相系统实施检索时检出的与某一检索提问相关的信息资源数与检出的信息资源总数之比。关的信息资源数与检出的信息资源总数之比。检准率检准率=检出相关信息资源量检出相关信息资源量检出信息资源总量检出信息资源总量100%表示检索系统排除与检索提问无关信息表示检索系统排除与检索提问无关信息资源的能力。资源的能力。一、对信息组织的要求检全率与检准率的关系检全率与检准率的关系检全率与检准率之间呈互逆检全率与检准率之间呈互逆关系关系检检全全率率%检准率检准率%检索系统对检全率与检准率检索系统对检全率与检准率的权衡,应考虑检索系统的任的权衡,应考虑检
3、索系统的任务、服务对象的需求、信息资务、服务对象的需求、信息资源集合的规模等多种因素,并源集合的规模等多种因素,并根据使用需要提供选择的可能根据使用需要提供选择的可能性。性。一、对信息组织的要求3、检索速度和系统的及时性、检索速度和系统的及时性 检索速度指用户实施检索时获得检索结果检索速度指用户实施检索时获得检索结果花费的时间。这一指标不仅与系统响应检索提花费的时间。这一指标不仅与系统响应检索提问的速度有关,同时也涉及查全、查准等因素,问的速度有关,同时也涉及查全、查准等因素,与信息资源的组织是否合理直接相关。与信息资源的组织是否合理直接相关。系统的及时性指检索工具能否在较短时系统的及时性指检
4、索工具能否在较短时间内将信息资源纳入系统,尽快提供使用。间内将信息资源纳入系统,尽快提供使用。一、对信息组织的要求4、系统的易用性、系统的易用性 对标引者而言,指系统是否便于进行描述对标引者而言,指系统是否便于进行描述和标引操作,是否需要掌握复杂的专门技能才和标引操作,是否需要掌握复杂的专门技能才能使用,在处理过程中为减少处理差错能否得能使用,在处理过程中为减少处理差错能否得到各种提示和帮助等。到各种提示和帮助等。对广大检索用户而言,则是指系统检索是对广大检索用户而言,则是指系统检索是否易于使用,操作是否复杂,是否需要预先学否易于使用,操作是否复杂,是否需要预先学习才能实施检索习才能实施检索;
5、检索界面是否友好,是否配备检索界面是否友好,是否配备有相应说明,并提供各种具有启发性的帮助等。有相应说明,并提供各种具有启发性的帮助等。一、对信息组织的要求5、检索的成本效益、检索的成本效益 指检索系统的成本和效益之比。指检索系统的成本和效益之比。成本一般指检索系统设备费用、标引处理成本一般指检索系统设备费用、标引处理费用、检索运行费用。费用、检索运行费用。效益则是指检索系统的性能及因此产生的效益则是指检索系统的性能及因此产生的效益,包括获取信息能取得的经济效益和社会效益,包括获取信息能取得的经济效益和社会效益。效益。二、信息组织中的控制与规范信信息息组组织织的的控控制制对信息资源的描述控制对
6、信息资源的描述控制标引和检索的词汇控制标引和检索的词汇控制标引和检索的句法控制标引和检索的句法控制二、信息组织中的控制与规范描述控制描述控制 描述记录一般概要记录资源各种基本特征描述记录一般概要记录资源各种基本特征的数据,可以以浓缩的方式集中反映资源的特的数据,可以以浓缩的方式集中反映资源的特征和内容。征和内容。(1)描述项目的控制)描述项目的控制 根据资源特点选择具有组织和揭示价值的资源特征根据资源特点选择具有组织和揭示价值的资源特征作为描述的项目。描述项目应该充分反映信息资源的基作为描述的项目。描述项目应该充分反映信息资源的基本特征和数据。本特征和数据。二、信息组织中的控制与规范(2)描述
7、文字的控制)描述文字的控制 规定描述信息资源时所采用的文字,应当准确、精规定描述信息资源时所采用的文字,应当准确、精炼、统一、规范。炼、统一、规范。二、信息组织中的控制与规范(3)描述级别的控制)描述级别的控制 规定对信息资源进行描述的详略程度。应根据不同规定对信息资源进行描述的详略程度。应根据不同的使用对象和需求,信息资源的特点、设备条件加以确的使用对象和需求,信息资源的特点、设备条件加以确定。定。二、信息组织中的控制与规范(4)描述格式的控制)描述格式的控制 包括各种描述项目的次序、描述的标识、描述项目包括各种描述项目的次序、描述的标识、描述项目的表达形式等。对此做统一规定的目的是方便不同
8、类型的表达形式等。对此做统一规定的目的是方便不同类型信息系统之间的交流。信息系统之间的交流。二、信息组织中的控制与规范描述控制描述控制 根据上述各项控制要求做具体的规定,就根据上述各项控制要求做具体的规定,就形成了各种信息描述规范。形成了各种信息描述规范。分类法和主题法也可以说是从主题角度提分类法和主题法也可以说是从主题角度提出的信息描述规范。出的信息描述规范。二、信息组织中的控制与规范词汇控制词汇控制 词汇控制是根据信息资源标引和检索的需词汇控制是根据信息资源标引和检索的需要,对自然语言中的词汇进行选择、规范并揭要,对自然语言中的词汇进行选择、规范并揭示其相关性的过程。示其相关性的过程。二、
9、信息组织中的控制与规范词汇控制词汇控制为什么要进行词汇控制?为什么要进行词汇控制?因为对信息的描述离不开自然语言。但是自然因为对信息的描述离不开自然语言。但是自然语言做为日常交流的语言,存在很多问题:语言做为日常交流的语言,存在很多问题:v表达不够精确一致,语词与概念不是一一对应表达不够精确一致,语词与概念不是一一对应 一词多义:一词多义:e.g.疲劳一词,在医学和物理学领域各自疲劳一词,在医学和物理学领域各自有不同的含义有不同的含义 一义多词:一义多词:e.g.土豆土豆&马铃薯;电脑马铃薯;电脑&计算机计算机 词义含糊:词义含糊:e.g.笔记本(本子?便携式电脑?)笔记本(本子?便携式电脑?
10、)二、信息组织中的控制与规范词汇控制词汇控制为什么要进行词汇控制?为什么要进行词汇控制?v自然语言词汇没有明确地表达词间关系,很难自然语言词汇没有明确地表达词间关系,很难适合检索系统显示概念间联系的要求。适合检索系统显示概念间联系的要求。e.g.浮游生物与水生生物是包含与被包含的关浮游生物与水生生物是包含与被包含的关系;浮游生物与水底生物是并列关系等。系;浮游生物与水底生物是并列关系等。e.g.“湖广熟,天下足湖广熟,天下足”二、信息组织中的控制与规范词汇控制词汇控制为什么要进行词汇控制?为什么要进行词汇控制?v词汇量过大,给词汇的加工、管理增加困难,在词汇量过大,给词汇的加工、管理增加困难,
11、在描述信息的选词和检索时确定检索用词时都造成困描述信息的选词和检索时确定检索用词时都造成困难。难。鉴于上述原因,一般必须根据检索系统的需要,对词汇鉴于上述原因,一般必须根据检索系统的需要,对词汇进行必要的选择和处理。进行必要的选择和处理。二、信息组织中的控制与规范词汇控制词汇控制词汇控制包括下述内容:词汇控制包括下述内容:v同义控制同义控制v词义控制词义控制v词间关系控制词间关系控制二、信息组织中的控制与规范词汇控制词汇控制词汇控制包括下述内容:词汇控制包括下述内容:v同义控制同义控制目的:克服一义多词现象,将同一内容、特目的:克服一义多词现象,将同一内容、特征的资源集中在相同的标识下。征的资
12、源集中在相同的标识下。方法:选定一个规范词,建立用代参照方法:选定一个规范词,建立用代参照举例:电脑举例:电脑 Y 计算机计算机 计算机计算机 D 电脑电脑二、信息组织中的控制与规范词汇控制词汇控制词汇控制包括下述内容:词汇控制包括下述内容:v词义控制词义控制目的:克服一词多义现象目的:克服一词多义现象方法:加限义词、增设含义注释和范围注释方法:加限义词、增设含义注释和范围注释举例:疲劳(生理);疲劳(物理)举例:疲劳(生理);疲劳(物理)举例:举例:“下次你跟着出租车跑回来,还可以下次你跟着出租车跑回来,还可以省掉十块钱省掉十块钱”二、信息组织中的控制与规范词汇控制词汇控制词汇控制包括下述内
13、容:词汇控制包括下述内容:v词间关系控制词间关系控制目的:用于扩检、缩检、改变检索方向目的:用于扩检、缩检、改变检索方向方法:设置参照、倒置标题、使用副标题、方法:设置参照、倒置标题、使用副标题、通过类目体系揭示词间关系通过类目体系揭示词间关系举例:害虫举例:害虫 S 杀虫剂杀虫剂 无损检验无损检验 S 无损探伤仪无损探伤仪 血管血管 F 动脉动脉二、信息组织中的控制与规范句法控制句法控制 句法控制是指根据信息资源标引和检索的句法控制是指根据信息资源标引和检索的需要,所作出的组词造句的规则,是对检索语需要,所作出的组词造句的规则,是对检索语词的组合方式的规定。词的组合方式的规定。二、信息组织中
14、的控制与规范句法控制句法控制为什么要进行句法控制?为什么要进行句法控制?因为仅有规范的语词是不够的,语词只能表达简单因为仅有规范的语词是不够的,语词只能表达简单的概念。语词的组合才能表达复杂的概念。特别是信息的概念。语词的组合才能表达复杂的概念。特别是信息组织的一种重要方法组织的一种重要方法主题法,就是通过对相应语词主题法,就是通过对相应语词的组配来实现对复杂概念的表达的。但是汉语非常灵活,的组配来实现对复杂概念的表达的。但是汉语非常灵活,语词之间的组合方式多种多样,如下例。语词之间的组合方式多种多样,如下例。v计算机控制遥感系统对大地测量计算机控制遥感系统对大地测量v遥感系统在计算机控制下对
15、大地测量遥感系统在计算机控制下对大地测量v大地测量在计算机控制下通过遥感系统进行大地测量在计算机控制下通过遥感系统进行v遥感系统对大地测量在计算机控制下进行遥感系统对大地测量在计算机控制下进行 为了以明确、统一的方式对信息资源进行组织,需为了以明确、统一的方式对信息资源进行组织,需要对语词之间的组合方式,即句法进行控制。要对语词之间的组合方式,即句法进行控制。二、信息组织中的控制与规范句法控制句法控制句法控制的内容:句法控制的内容:v引用次序引用次序v辅助符号辅助符号v句式转换句式转换二、信息组织中的控制与规范句法控制句法控制v引用次序引用次序亦称组配次序,指复合主题标引和检索时,各个亦称组配
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 组织 第二 原理

限制150内