信息组织期末复习要点-(1).docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《信息组织期末复习要点-(1).docx》由会员分享,可在线阅读,更多相关《信息组织期末复习要点-(1).docx(19页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、信息组织期末复习要点第一章 信息组织导论信息组织的环境与背景一、信息检索工具的变化1.手工检索时代:目录、题录、索引等2.计算机检索时代:各种检索系统,核心是数据库3.网络检索时代:检索型、目录型、混合型检索工具4.各种检索工具的涌现,目前互联网上运行的搜索引擎至少有几千种之多。二、信息检索技术的进步1.按照信息存储的载体和实现查找的技术手段,信息检索可以分为手工检索、机械检索、光电检索、计算机检索。2.网络信息检索采用的检索技术包括:布尔逻辑检索、自然语言检索、多语种检索、字段检索、区分大小写检索、限制检索、二次检索、自然语言检索、多语种检索、加权检索、模糊检索、概念检索、相关反应检索等1.
2、2 信息组织的相关概念与内容一、组织与组织系统1.组织:组织是一种有意识地行为;其目的是为了创造次序与构造2.组织系统:资源与交互3.组织系统的三层体系:用户界面、业务逻辑、数据4.组织对象的种类:物理实体、关于物理实体的信息、数字资源、关于数字资源的信息5. 资源、文献与馆藏1资源:资源具有一般意义上的任何价值, 可以支持面向目标的活动,如实体、对象等。资源在网络体系构造中具有特殊的意义。通常, 描述网页、图像、视频等资源, 以及访问它们的协议, 超文本传输协议 ( ), 使用统一资源标识符 (URI)。2文献:文献通常用于数字或物理格式的信息资源; 工件是指由人创造的资源, 以及具有经济价
3、值的资源的资产。3馆藏:馆藏是已为某一目的选择的一组资源。相似的期限被设置 (数学), 聚合 (数据建模), 数据集 (科学和商业) 和语料库 (语言学和文艺分析)。6.元数据:描述或与其他资源相关联的数据1挑战1:决定哪一个资源是主要的2挑战2:用于描述一个人或过程的元数据再用于描述其他资源7.信息组织:为了方便人们检索、获取信息而奖庞杂、无序的信息进展系统化和有序化的过程。从广义上来说,包括信息搜集与选择、信息分析与提醒、信息描述与加工、信息整理与存储。1.3 组织活动决策的6个方面一、组织活动决策的6个方面1.组织对象:不同组织系统的组织对象存在不同,如图书馆、博物馆、档案馆。越来越多的
4、组织系统处理和组织的资源是原生数字资源,如音乐、照片、视频和其他非文本内容如传感器数据。2.组织原因:发现,识别,选择,建立分类体系,类分,整合,分割,推荐,交互等。3.组织数量:并非所有的资源都应享有同等程度的组织。受控词汇可以产生更一致的组织,如果正在组织一个固定的资源集合, 那么可能会比需要一个能够容纳将来可能拥有的资源的组织系统来组织它。4.组织时间5.如何组织:组织活动从资源产生时就开场发生,嵌入到资源的整个生命周期中。如当一个作者撰写一篇文档时,作者通过标题、章节标题、体例、页码和其他机制对该文档进展了一定程度的组织,用以区分和识别与其他局部的关系。数字形式的照片、视频和文档在创立
5、时往往被自动地赋予了相应的描述,如时间和位置。6.组织位置:可以在物理安排中组织资源,资源安排可以鼓励或劝阻人之间的交往, 创造自由、平安感或监禁的感觉。对于数字资源, 它们组织的位置通常是无形的或无关紧要的。第二章 信息组织导论信息组织系统中的4类活动一、 分别是什么?1.选择信息资源1选择是一个发现,识别,评估资源并纳入组织系统中某一集合的过程。选择的方法和标准因不同领域而异,但它们要确保资源能够实现“面向目标的活动“。2选择和保存所有资源:信息过载、弱组织原那么 选择在组织之前:独特或罕见资源需要被一个一个地评估 选择和组织并发:同质或可预测的资源 选择在组织之后:根据模式创立的资源3选
6、择标准:基于某些特定目的效用价值、内在价值、稀缺性或唯一性、最新、建立品牌或声誉、适于使用。4路径依赖5选择与采样:如果您的目标是对其进展推论而不必研究其所有实例,那么通过从大量群体中随机抽样来选择资源至关重要。基于统计的良好样本是指被选资源和未被选资源在重要方面没有不同。2.组织信息资源1几乎任何资源的属性都可以用来组织它们,但是最适当或有效的属性因资源类型和任务而异。在资源创立或被选择之前,就应当决定在组织中使用哪些资源属性。2组织物理资源3自动/预先注意:物理资源通常根据诸如它们的尺寸,颜色或形状的内在物理性质来组织,因为人类视觉系统快速且自动地对它们给予很多关注。相近性和相似性、即格式
7、塔原那么。4形状和颜色的预处理,当形状和颜色特性不相关时,预注意与处理并行是不可能的。5整体由一些相互作用的局部组成,这些局部可以在整体上分开,分析和重新排列。当视觉信息不明确时,存在将视野的一些局部视为前景而将其它局部视为背景的自然趋势。6连续性7伪装:类似于背景,反向阴影,阴影消除和破坏边缘检测的破坏性着色,颜色和图案证明了Gestalt处理的力量。3.支持交互1直接交互与中介交互:与资源的交互可以是直接的,中介的或间接的,或限于与资源副本、描述的交互。2交互与价值创造:物理操作,符号控制和人际交互,三者的交互有不同的地方。3物理资源的价值创造4数字资源的价值创造:交互的本质是对资源中包含
8、的信息进展信息交换或符号操纵。用于信息资源的数字资源描述可以促进查找,识别,选择和其他“价值创造交互,即使资源本身没有被数字化。5智慧资源的价值创造6符号交互和其它技术作用的分解7价值创造:功能可见性和交互设计8功能可见性:交互不同于那些通过有意识的描述、整理或技术之后产生的“被设计的交互.9数字化与交互:数字资源交互的种类和功能由编码中的构造和语义的数量“信息智能来确定。4.维护信息资源1维护包括任何活动, 其目的是确保资源在将来的某一时间使用或重用。2可维护性和扩展性设计/组织。3选择基于应用于资源的一些隐式或显式条件。4保存物质资源需要保持在防止其恶化的条件下,它还包括用于改良访问或恢复
9、资源的举措。5文档恢复6数字保护:副本、篡改杜绝等7法律:启用文档发现的民事诉讼规那么、政府问责、被遗忘权、强制披露数据泄露。8记录管理:保存要求、不保存要求、访问控制,特别是分类信息制止保存个人身份信息、去除要求和权限等。9计算治疗:众包数字化 /公民科学,许多博物馆或科学存储库正在寻求帮助将他们的藏品数字化,初步分类和稀缺专家。第三章 组织系统中的资源3.1什么是资源一、资源的粒度1.资源是其他资源的聚合或复合材料, 或具有内部构造, 对其“属性的粒度构成疑问。2.我们可能需要组织和管理粒状资源、复合资源以及它们之间的关系-同时也可以在不同级别的上下文/容器/集合中标识 零件。3.对于信息
10、资源而言, 物理资源的粒度更容易确定二、资源的标识符1. 标识符:是一种特殊命名,它通过规那么以受控的方式分配,规那么定义可能的值和命名原那么。例如,将一个数字资源的标识符输入到系统中,从而确定它的位置,这样它就可以被检索出来。三、资源的名称1. 名称:指的是对某一资源区别于其他资源的标签。2. 名称的选择往往受到多种因素的影响,如公众的可获取性、习惯,语言类型,机构政策,个人以及文化偏见等。如果一个资源有两个及以上的名称或者标识符,也就意味着有同义词或别名的出现。这种现象被称为“词汇问题。3. 受控词汇可用于来解决词汇问题。通过添加名称和标签,标准资源被分配的规那么,或通过自然语言定义映射,
11、使其转换为权威或受控的术语。需要注意的是,词汇控制不能消除所有歧义。3.2资源的属性一、四个可区分属性1.资源域1每个资源具有一定的区别于其他资源的本质或类型,称之为资源域。对于物理资源而言,域的区别较为容易,即可以粗略根据物质容易感知的属性做物质类型的区分。对于信息资源而言,容易被感知的属性往往不可靠和不相关,因此更多的是基于语义特征来进展域的区别。2信息资源可以被分类和分层,但有时候类别边界不清晰却更有益于从弱构造的叙事内容到高度构造化的事务性内容发现信息资源的域。由此,格鲁什科和麦格拉思提出了文档类型谱。3不同构造域或类型的文档可以根据被语义规定的内容区分,即通过其内部构造数量、呈现方式
12、和内容构造的相关性。2. 资源格式1物理环境还是数字环境,信息资源都能以各种格式存在。知道哪个是最原始或者最重要的信息资源十分的重要,特别对于独特的或有价值的信息资源而言。2数字信息资源的两个维度:内容表示显性化程度和内容表示的别离程度。信息智商,如扫描文档;数据库或XML文档;HTML文档。具有较高“智商格式的信息很容易和有效地用计算机处理。3编码构造的部件,如章,节或类似的语义组成。信息是否被编码为文本字符的序列,以使它是人类以及计算机可读也是十分重要的。3. 资源能动性1代理是在某种程度上促使资源可以自发引起自身的行动。被动型:组织系统中的被动型资源无处不在,这些资源通常是无形的,只有某
13、些行动的触发才能使得他们变得有价值。主动型:主动型资源通常依靠自己创造效益和价值,有时候也通过触发被动型资源产生。2智能性连续体感知与意识:资源媒介感知周围环境和其他资源的互动的根底,但是感知事物并不能为组织系统创造任何价值。刺激:当资源通过信息的感知采取行动时,才具备创造价值和影响的能力。驱动器:通常被用来描述可以控制物理机械或者系统的东西。关联:主动型资源要发挥自身的作用,就必须要与控制其他资源的驱动器相关联。计算或计算力:主动型资源通常可以通过阅读传感器的信息,然后分析信息的内容并不断去调整行动。可组合性与合作:智能的主动型资源不仅仅能够分析所搜集的信息和为之调整行为,还可以在共同遵守一
14、定格式和标准的根底上,会聚不同来源的信息来创造更大的价值。4. 资源格式与焦点1物理形式描述物理资源:描述性资源与物理资源的关系是通过将描述性资源以物理形式进展编码。2数字形式描述物理资源:典型就是通过图书馆在线目录定位实体图书馆资源的馆藏所在位置。3数字形式描述数字资源:描述数字资源的数字资源也就是对网络原生的信息资源进展描述。4物理形式描述数字资源:报纸广告、马路广告商品货架上的可以被手机扫描商品或效劳信息的二维码就是以物理形式描述数字资源。5识别资源所属的域,确定哪些属性是重要的或与人或者系统操作相关的,然后指定由其中哪些性质来定义的资源之间的关系的原理是构建组织系统最核心的任务。3.3
15、 命名资源一、为什么要给资源命名帮助我们寻找到资源、描述资源、复用资源、链接资源等。二、资源命名中存在的问题1词汇问题:人们描述事物中所选择的单词与他们的经历和语境有关系。2同义词、多义词、假同源词等:当资源有同义词或者多义词时容易被错误区分,难以用自动化的程序确定其正确的表示方式。3不恰当联系的命名:假同源,如在中国,4是不桔祥的数字,意味着死亡4通过假设常量属性的命名:通过假设常量属性来命名是建立在资源属性的根底上,但是随着资源本身的变化,其属性的含义也会跟着改变。5语义差距:指在命名和描述资源时,用自动化方式代替人为方式描述产生语义的差距。三、选择好的命名和标识符1需要让命名有富含信息量
16、2使用受控语言3允许别名4使标识唯一或者被限定5区分识别和解决第四章 资源描述与元数据4.1 资源描述一、为什么要描述一个资源1. 资源描述的目的是便于查阅、区分、检索这些资源,以及管理资源获取入口和保存这些资源。2. 不同的资源领域有特色的或标准的资源描述,但是不同类型的资源一定也有用于区分的属性, 或者不带偏见或有理由的区分他们。二、资源描述的框架或方法1.RDF1RDF是一种计算机可处理的网络资源描述的标准模型,是语义网构建的根底。资源是指带有URIUniform Resource Identifier的任何资源。2关键思想:使用URI识别在线资源,如网页,以及线下资源,如人和国家。3三
17、元组形式:资源,属性和属性值。RDF使用XML编写,它的设计编写目的不是为了显示给人看,而是设计为可被计算机阅读和理解。于是RDF信息会有假设干种序列化形式,即可使用三元组表示。2. MARC21:包括作者,标题,出版年,出版商和页码等。4.2 资源属性一、资源属性类型1. 内在属性:资源所固有的,局部是静态的,也有动态的,但是是从资源内部发生变化,而不是由于外部行动或努力而改变,有时可用于识别符。1物理属性:物理的或可感知的属性即外表可见的。对于自然事物,这些物理属性非常适合进展描述,这些属性具有一定的特色或一致性、可预测性和关联性。对于人造产品,外观属性预测性较差,重要的是外观下所具有的的
18、功能。对于物理形式的信息,外观与内容之间的关联因文档类型不同而不同。2.外在属性:外在属性是人为赋予的一种属性。局部是静态的,如名字或识别符,局部是动态的,如当前位置,受欢送程度,价格等。1文化属性:来源于传统语言的使用或文化,或者涉及到与此类似的方面。由于文化属性来源于文化或语言知识,因而对于缺少一样视角或经历的人来说是难以理解的。2情境属性:与事物被描述时所处的情景或情境相关。情境是指与用户、应用程度和周围环境之间交互相关的情景的特征化信息。随着情境的改变,可能基于情境的描述会变得不再使用。3构造属性:事物的内在或外在构造对于描述来说是有用。组成局部的数量或排列和与其他资源的关联的数量和类
19、型。4.3 资源描述的过程一、资源描述的六个环节1. 选择范围和焦点:1描述实例或馆藏:确定资源粒度之后,就是确定是否需要分别描述这些资源。2抽象化资源描述:一个应用于整个资源类型的描述方案如模型或元数据标准。2.确定目标1支持选择:发现、性能与兼容性、鉴别、评估2支持组织:组织是为描述和配置资源指定原那么或条例以便实现更好的交互能力。实体资源通常根据其有形或可感知的属性,如大小,颜色,组成材料,形状等。3支持交互:书目记录功能需求FRBR应用于组织系统的四个目的包括发现已经存在的资源识别所需资源从资源集中选择一个资源导航:当用户不清楚他们的信息需求时,使用关系性和构造化描述进展导航效果更好。
20、具体方式如: 概括,聚合和派生关系。4支持资源维护关于资源格式和技术的技术性信息,保持资源完整性的“保存元数据.版本信息,有效期或使用期限信息使用记录3.识别属性1任何资源都要从多角度描述,这些描述均与不同属性相关,取决于交互类型和所处情境。2不同类型资源需要包含不同的属性3资源描述中所使用的属性取决于描述的主体4概念层次一样的属性在实现层次可能不同。基于时间的资源的总结性描述具有非常大的挑战,如电影,歌曲等。5两个重要维度:属性的本质和属性持久性4.设计描述词表1原那么:用户便利性、表达性、充分性和必要性、标准化、整合2两大挑战:需要额外的和特定的情境原那么之间可能存在一定的冲突3资源描述利
21、用的主体:资源描述必须针对不同用户群体进展设计,如图书馆用户,企业员工,企业客户,科学家等群体。4受控词表和内容规那么:术语表、叙词表、上位词、下位词、本体 。5降维:目标是减少描述资源的术语数量,通过一些方法减少资源描述的维度,如特征抽取,主成份分析,正交分解,潜在语义分析,多维标度等。5.编制资源描述:每个编制主体都有不同的特点,最好使用混合的方式取长补短。如,由终端用户为一个新的资源领域标记相应词汇,由专家进展准确之后再借助于软件工具利用分类器生成摘要。6.评价资源描述:依据一些标准或维度评估其质量1常用:准确度、完整性、一致性.2其他:时效性、互操作性、可用性.3评价资源描述的创立4评
22、价资源描述的使用5反复评价的重要性:用户显性反应或资源交互记录的隐形反应非常重要.第五章 对关系和构造的描述一、描述关系的五种观点1语义学: 联想的意义2词法学: 如何使用特定语言中的词语来表达关系的概念描述。3构造: 分析资源之间的关联、排列、邻近或连接的模式 (通常忽略它们的原因)。4架构:强调关系组成局部的数量和抽象级别,它们一起表征其复杂性。5实施层面的观点:如何以特定符号和语法实现关系,以及在某些技术环境中将关系排列和存储的方式。二、三种广义的语义关系1包含关系种类包含:is-a, is-a-type-of, subset is-a-type-of, subset局部-整体关系包含:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 组织 期末 复习 要点
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内