[4]情报学概论-信息组织na.pptx
信息组织刘志辉科学计量与评价研究中心2015-10-20信息检索系统 信息资源匹配查询标引检索结果相关性反馈Description信息组织信息组织大纲信息资源描述技术信息资源标引技术信息资源封装技术信息组织算算 帐帐飞镜飞镜飞镜飞镜玉轮玉轮玉轮玉轮婵娟婵娟婵娟婵娟经、史、子、集经、史、子、集经、律、论经、律、论信息组织索引文摘法分类组织法主题组织法元数据本 体语义网体系分类法:DDC(Dewey Decimal Classification)体系-组配分类法:UDC(Universal Decimal Classification)组配分类法:CC(Colon Classification)标题法:LCSH(Library of Congress Subject Headings)叙词法:汉语主题词表单元词法关键词法索引法文摘法信息组织信息资源封装技术信息资源描述技术信息资源标引技术编 目元数据分类模式关联组织外部特征描述与转录内容特征概念及其相互关系描述与揭示已描述分散资源的整合与长期保存信息组织1 信息资源描述技术1.1 信息资源编目技术以特定顺序记录或转录信息资源元数据元素的相关标准规范与技术。l国际标准书目著录国际标准书目著录(International Standard Bibliographic Description,ISBD)1967:Anglo American Cataloging Rules,AACR1978:AACR22005:AACR3:RDA(Resources Description and Access))l英美编目条例英美编目条例l 中国中国 ISBD=GB/T3792 文献著录文献著录系列国家标准系列国家标准AACR=西文文献著录条例西文文献著录条例示例1 信息资源描述技术1.2 信息资源元数据技术从信息资源的外部特征中选取需要描述的元素,并对这些元素的名称、标签、语义、格式等进行设定的相关标准规范与技术。语义层语法层MARC1960sCCF1984TEI1987EAD1993DC1995FRBR1998MODS2002MARC I1966MARC II(LCMARC)1968USMARC1983MARC211997UNIMARC1977CWMARC1992合并CANMARCZ39.21971ISO27091977GB/T29011981SGML1985XML1998RDF2004HTML1993MARC:MAchine Readable CatalogingCCF :Common Communication FormatTEI :Text Encoding Initiative EAD :Encoded Archival Description DC :Dublin Core FRBR :Functional Requirements for Bibliographic Records MODS:Metadata Object Description SchemaSGML:Standard Generalized Markup Language XML :Extensible Markup Language RDF :Resource Description Framework 1 信息资源描述技术1.3 FRBR书目记录功能需求(Functional Requirement for Bibliographic Records)using the data to find materials that correspond to the users stated search criteria(e.g.,in the context of a search for all documents on a given subject,or a search for a recording issued under a particular title);using the data retrieved to identify an entity(e.g.,to confirm that the document described in a record corresponds to the document sought by the user,or to distinguish between two texts or recordings that have the same title);using the data to select an entity that is appropriate to the users needs(e.g.,to select a text in a language the user understands,or to choose a version of a computer program that is compatible with the hardware and operating system available to the user);using the data in order to acquire or obtain access to the entity described(e.g.,to place a purchase order for a publication,to submit a request for the loan of a copy of a book in a librarys collection,or to access online an electronic document stored on a remote computer).Group1智力或艺术产品:lWorklExpressionlManifestationlItemGroup2责任人:lPersonlCorporate BodyGroup3(work)主题:lGroup1&Group 2lConceptlObjectlEvent lplace1 信息资源描述技术1.3 FRBR书目记录功能需求(Functional Requirement for Bibliographic Records)1 信息资源描述技术1.3 FRBR1 信息资源描述技术1.3 FRBR1 信息资源描述技术WorkExpressionManifestationItemPersonCorporate BodyGroup 2Is owned byIs produced byIs realized byIs created by1.3 FRBRWorkPersonCorporate BodyWorkExpressionManifestationItemConceptObjectEventPlace1 信息资源描述技术1.3 FRBRHas as subjectHas as subjectHas as subject1 信息资源描述技术1.3 FRBR1 信息资源描述技术1.3 FRBR2 信息资源标引技术 Weakly-structured strongly-structured Natural Language Controlled LanguageTerm ListCategorization&ClassificationRelationship GroupsPick listsSynonym RingsAuthority FilesGlossaries/DictionariesGazetteersSubject HeadingsCategorization SchemestaxonomiesClassification SchemesThesaurusConcept MapsSemantic NetworksOntology强调概念强调概念 定义与理解,接近自然语言,定义与理解,接近自然语言,不涉及语义关系不涉及语义关系强调概念间的层级聚合和类别体系,来自强调概念间的层级聚合和类别体系,来自自然语言,具备相对规范的语义结构自然语言,具备相对规范的语义结构强调概念间各种关系的揭示,语义结构强,强调概念间各种关系的揭示,语义结构强,是经过规范化的机器可读的人工语言是经过规范化的机器可读的人工语言2 信息资源标引技术2.1 分类模式重点在于揭示概念间的等级关系,目前应用最广、发展最为成熟的信息组织体系,包括标题表、范畴表、分类表、层级表、Folksonomy等。l主要由主表、标记符号、复分表、类目注释系统和类目索引构成;l利用术语间的等级关系描述知识结构框架,不易于知识更新;u杜威十进分类法(DDC)u国际十进分类法(UDC)u美国国会图书馆分类法(LCC)u冒号分类法u中国图书馆图书分类法u中国科学院图书馆图书分类法2 信息资源标引技术2.2 关联组织模式重点在于揭示概念间的各种关系,除等同、等级、相关关系外,还包括整部、蕴含、因果等语义关系,以及一定的规则和推理,包括叙词表、概念地图、语义网、本体等。l传统关联组织模式又被称为主题法;l包括:标题法、元词法、叙词法、关键词法;l分类法主题法一体化趋势:分面叙词表、分类主题词表、集成词表u美国国会图书馆标题法(LCSH)u美国医学标题法(MeSH)u国防科学技术主题词典u汉语主题词表2 信息资源标引技术2.3 Folksonomy众分法、众分表、分众分类表、大众分类法、通俗分类法、社会分类法网络用户自发为某类信息定义一组标签进行描述,并选用高频次标签作为该类信息类名的一种网络信息分类方法。Tag Clouds2 信息资源标引技术2.4 OntologylGruber:An ontology is a specification of a conceptualization.lStuder:formal,explicit specification of a shared conceptualisation2 信息资源标引技术2.5 Semantic Web3 信息资源封装技术3.1 非内容封装仅包含信息资源对象的访问信息,提供对这些资源对象的目录级指引和链接,并不把这些资源对象物理地存在到一起。电子出版物标准(Electronic Publication,EPub)元数据编码与传输标准(Metadata Encoding and Transmission Standard,METS)3.2 内容封装封装文件包含下属信息资源对象的内容,成为装载这些资源对象的一个容器(Container),下属信息资源对象物理地打包成一个整体。lWeb 归档(Web ARChive,WARC)3 信息资源封装技术3 信息资源封装技术3.3 OAIS开放档案信息系统(Open Archival Information System):面向信息资源长期保存与存取的参考模型与概念框架。OAIS功能模型环境模型信息模型an archive,consisting of an organization of people and systems,that has accepted the responsibility to preserve information and make it available for a Designated Community.OAIS-环境模型ProducerOAISarchiveConsumerManagementOAIS-信息模型OAIS-功能模型推荐阅读1V.Bush.As We May Think2真溱,等.信息组织技术发展现状与趋势A.情报学进展M.国防工业出版社3 Eileen Svenonius.The Intellectual Foundation of Information Organization