电子文件元数据标准.doc
电子文件元数据标准(征求意见稿)1. 范围本标准适用于各级机关、团体、企事业单位、社会组织。本标准规定了电子文件元数据的结构、定义、编码体系。本标准描述的数字对象为通用的电子文件核心元数据,主要为原生电子文件与数字化文件(文本、图像)元数据。根据发展需要,扩展编制图形、影像、声音等文件类型的元数据标准。2. 编制目的2.1 对文件及相关实体进行标准化描述;2.2 实现不同机构、不同系统之间文件及信息的互操作; 2.3 为电子文件在不同时间、不同空间、不同应用软件中的再利用提供统一的元数据;2.4 为电子政务、办公自动化、电子文件中心、文档管理、档案管理等系统提供成熟的电子文件全过程管理的设计模式。3. 规范性引用文件下列文件中的条款,通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。GB/T 2659-2000 世界各国和地区名称代码GB/T 2260-2002 中华人民共和国行政区划代码GB/T 11714-1997 全国组织机构代码编制规则GB/T 9704-1999国家行政机关代码编制规则GB 2312-1980 信息交换用汉字编码字符集 基本集GB/T 4880-1991 语种名称代码GB/T 4880.2-2000 语种名称代码 第2部分:3字母代码 GB/T 4881-1985 中国语种代码GB/T 3792.1-1983 文献著录总则GB/T 13959-1992 文件格式与代码编制方法GB/T 15418-1994 档案分类标引规则GB/T 3760-1995 文献叙词标引规则GB/T 9704-1999 国家行政机关公文格式GB 18030-2000 信息技术 信息交换用汉字编码字符集 基本集的扩充GB/T 18894-2002 电子文件归档与管理规范GB/T 7156-2003 文献保密等级代码GB/T 19667 基于XML电子公文格式规范DA/T12-1994 全宗卷规范DA/T13-1994 档号编制规则DA/T18-1999 档案著录规则DA/T 19-1999 档案主题标引规则DA/T 22-2000 归档文件整理规则DA/T 1-2000 档案工作基本术语中办发199614号 中国共产党机关公文处理条例 国发200023号 关于发布国家行政机关公文处理办法的通知国档发19874号 关于颁发编制全国档案馆名称代码实施细则的通知ISO15489 信息与文件文件管理ISO23081-1 信息与文献文件管理流程文件元数据-总则ISO23081-2 信息与文献文件管理流程文件元数据-概念与实施问题ISO14721 空间数据和传输系统开放档案信息系统参考模型ISO11179 信息技术-元数据元素的规范与标准化 ISAD(G) 档案著录规则(总则)W3C Namespaces in XML XML的命名空间(Namespaces)4. 术语与定义 下列术语和定义适用于本标准。4.1 通用术语4.1.1 业务系统Business system将硬件、软件、信息或服务、政策、程序、人有机地组合在一起,实现对机构业务信息的保存、整理和提供。如:电子政务系统、办公自动化系统等。4.1.2 电子文件管理系统 Electronic Records Manage System (ERMS)为了满足业务对电子文件管理需要而设计的系统,用以捕获、保存、提供获取业务处理过程中产生的有证据价值的文件的功能。电子文件管理系统包括:档案工作者和文件使用者;授权政策、责任分配、权力授予、程序和做法;政策声明、程序手册、用户指南和其他用以批准和颁布政策的文件、程序和做法;文件本身;控制和记录的专门资料和文件系统;软件、硬件、其它设备、必要工具等。 4.1.3 实体Entity指过去、现在和将来存在的任何具体或抽象的事物以及它们之间的联系。比如:人、物体、事件、想法、过程等等。4.1.4 文件实体Record entity 在处理公务或事务过程中,由团体或个人形成或接收和保存的任何形式或载体的记录信息。可以是单份文件,也可以是文件的集合。4.1.5 责任者实体Agent entity对文件的信息内容负有责任的个人或团体。4.1.6 业务实体Business entity指业务过程中对文件进行处理与管理的一系列活动。4.1.7 关系实体Relationship entity描述文件、责任者、业务等实体自身、相互关系及这种关系的背景信息实体。4.1.8 电子文件元数据Electronic Records Metadata描述电子文件内容、背景和结构信息及整个管理流程的数据。4.1.9 元数据集Metadata schema规定和描述标准元数据集元素以及元素间相互关系的框架。语句集为元数据元素提供正式的结构(句法)和语义(定义)。4.1.10 元数据结构Metadata structures元数据集由一系列的元素组成,元素之间的相互关系形成了元数据的结构。元数据结构体现元数据扩展的方法与机制。元数据抽象模型的建立对其元素的扩展与整个元数据方案的规范具有参考作用。4.1.11 元数据语义Metadata Semantic 元数据的本质是描述对象的各种属性及相关关系等内容,每一个元素的语义明确定义了其含义、内涵与外延。语义定义是一个元数据规范的基本要素,也是元数据应用与元数据互操作的最重要的基础。4.1.12 元数据句法Metadata syntax 句法的问题即是一个形式化描述的问题,元数据集所有语义与结构及描述的内容以计算机可读或人可读的形式化方法描述出来。从标准、开放、互操作角度,采用标识语言对元数据集进行描述。本标准采用XML语言对元数据集进行描述。4.1.13 编码体系 Encoding Scheme编码体系有助于对元素修饰词值的理解。这类体系包括控制词表及正规的符号或解读方式。值的表示采用来自控制词表的标记符号(如分类体系或主题词表的术语)或者具有特定含义,或以一定形式组成的字符串。4.1.14 信息总体 Information Package 电子文件与其元数据可以分开保存,也可以被封装在一起保存,后者称为电子文件信息总体。封装是指创建的一个由电子文件及其元数据组成的自我包含的实体。信息总体便于对电子文件的独立理解,支持并长期保证电子文件的真实性、可靠性和完整性,同时提供电子文件与其形成背景之间的可靠而有意义的逻辑联系。电子文件封装入信息总体,该文件可以存在于任何存储或操作环境中,因其包含了嵌入其中的有关开始和过程的所有细节,包括那些用于存取、传递和表述文件的细节。信息总体需要将元数据捕获的多个点包含进文件,因为文件的处理历史像其最初的捕获元数据一样至关重要。本标准采用ISO14721信息技术-元数据元素的规范与标准化定义的封装技术,定义了信息总体的封装格式,包含维护真实性的技术机制。信息总体封装格式(Encapsulating Format for Information Package - EIP)见附录B。.4.1.15 信息总体固化 Fixity of Information Package电子文件元数据与其文件一样,需要受真实性规则、规范或标准的控制,以保证电子文件具有可信性,这种控制称为元数据固化。本标准采用数字签名技术来进行信息总体的固化。4.2 数据模型概念4.2.1 属性Attribute 物体或实体的特征。 4.2.2 类别Class:对具有相同属性,操作,方法,关系和语义的对象集的描述。 4.2.3 概念数据模型/概念模型Conceptual data model/conceptual model 通过数据模型对现实世界进行抽象地表达。5. 总则电子文件形成、捕获、登记、分类、存储和保管、利用、跟踪、处置、传输、归档移交及长期保存等过程中都需记录在元数据中,并应保持连续、一致,以确保电子文件的真实性、完整性与有效性。为实现电子文件全过程管理与监控,电子文件及其元数据与结构稳定、定义良好的元数据标准相一致,特制定本标准。本标准的制定遵循国际文件管理的系列标准规范: 按ISO15489信息与文件文件管理规定的文件管理过程要求定义电子文件管理元数据,采用ISO/TS 23081信息与文献文件管理流程文件元数据定义的电子文件管理元数据概念模型、实体及关系模型;采用ISO14721空间数据和传输系统开放档案信息系统参考模型定义的信息包(SIP、AIP及DIP)数据模型,实现电子文件内容、背景、结构信息的封装,以确保在分散与集中管理过程中电子文件的真实性、完整性、有效性,确保电子文件在不同应用系统间的安全传输;采用ISO14721定义的数字信息长期保存模型,实现电子文件的长期保存与利用。本标准支持元数据值的再利用、元数据元素的互操作及可扩展性和模块化。元数据来源于机构文件处理方案、主题词表或关键词表、编码方案、电子政务系统、办公自动化系统、电子文件管理系统、档案管理系统、E-mail系统、网站。 6. 元数据概念模型文件管理业务系统的各个流程,需要通过元数据实现对文件或档案的管理。元数据最主要的用途之一是用来描述业务系统中实体。关键实体如下:文件实体:文件本身,不管是单份文件还是文件集合体;责任者实体:业务环境中的人或组织结构;业务实体:业务办理。根据元数据类型,可将元数据分为下列几类:关于文件自身的元数据、关于责任者的元数据、关于业务工作或过程的元数据、关于业务规章制度、政策以及法规的元数据、关于文件管理过程的元数据。 业务文件管理业务人(责任者)文件政策法规创建被利用执行控制赋予职责执行整合于说明职责执行情况况被记录于记录、管理、使用图1 主要实体及其相互关系电子文件元数据模型的建立是以文件连续体理论为基础的。文件实体、责任者实体和业务活动实体,是用元数据帮助确保文件真实性、完整性和有效性,实施档案化管理必须充分关注的要素。文件作为交流、传递、贮存、利用信息的工具,其生成、处理、运转必然与文件责任者处理某项事务相关。对该事务的办理,形成文件的业务活动,构成了文件的来源。这种业务活动构成了文件的背景。责任者作为文件的形成和处理者,为业务活动或事务处理活动的实施者。作为业务活动的主体,责任者与业务活动的推进息息相关,人们的业务活动自身也是划分为一定层次并且与相关文件群体(文件集合)的层次相对应。从微观到宏观区分为以下层次:1)事务处理:即处理每一件具体事务的业务活动,在这种业务活动中形成的文件一般情况下可以构成一个文件组合(案卷)。2)业务活动:即处理某种类型事务而进行的职能活动,有可能是由某个机构的一个职能部门进行;也可能该职能活动属于某个相对独立的业务活动项目,是其中的一个子项目。在这种职能活动中形成的文件,往往构成全宗内的一个类别(系列)。3)业务职能:即具有相对独立性的业务活动过程。其中以主体为核心的,是由一个立档单位进行的全部业务活动,在该项业务活动中形成的全部文件往往构成一个主体全宗;以客体为核心的相对独立而又具有相当规模的业务活动,则是围绕着该客体而跨立档单位进行的,所形成的文件一般情况下可以构成一个客体全宗。人们进行的业务活动,同时也决定了文件所拥有的和将要拥有的各种有机联系。除了在处理同一项业务活动过程中形成的所有文件相互之间的联系以外,还有:业务活动与文件的联系;业务活动承担者(即文件形成者和处理者)与文件的联系。它们是与文件的形成产生过程同步共生的。因此,(由业务活动承担者进行的)“业务活动”所诱发形成的“与文件有关的各种有机联系”是文件来源信息的重要组成部分,因而也是文件背景信息的重要组成部分。7. 电子文件元数据集(Metadata schema)7.1 电子文件元数据元素简表7.1.1 文件实体(Record Entity)1.1 文件层级(Record Category)1.2文件标识(Record Identifier)1.3 文件题名(Record Title)1.4文件分类(Record Classification)1.5 文件主题(Record Subject)1.6文件摘要(Record Abstract)1.7文件日期(Record Date)1.8文件语种(Record Language Type)1.9文件种类(Record Form)1.10文件覆盖范围(Record Coverage) 1.11文件技术环境(Record Technical Environment.) 1.12文件位置(Record Location)1.13文件权限 (Record Rights)1.14文件处置(Record Disposal)1.15文件管理历史(Record Management History)7.1.2 责任者实体(Agent Entity)2.1责任者层级(Agent Category)2.2责任者标识(Agent Identifier)2.3责任者描述(Agent Description)2.4责任者权限(Agent Rights)2.5责任者行为历史(Agent Activity History)7.1.3 业务实体(Function Entity)3.1业务层级(Function Category)3.2 业务标识(Function Identifier)3.3 业务法规依据(Function Mandate)3.4业务描述(Function Description)3.5业务权限(Function Rights)3.6业务处理过程(Function Event Identifier)7.1.4 关系实体(Relation Entity)4.1关系实体标识(Relation Entity Identifier)4.2关系实体类型(Relation Entity Classification)4.3相关实体标识(Identifier Of The Related Entity)4.4相关实体类型(Type Of The Related Entity)4.5关系定义(Relationship Definition)4.6关系时间(Relationship Time)7.1.5 长期保存实体(Preservation Entity)5.1签名信息(Signature Info)5.2锁定签名信息(Lock Signature Info)5.3编码(Encoding)7.2 电子文件元数据总体框架表序号元素集元素元素标识限定元素限定元素标识11文件实体Record Entity1.1文件层级RecordCategory21.2文件标识RecordIdentifier1.2.1文件标识码 RecordIdentifier31.2.2文件编号RecordNumber41.3文件题名RecordTitle1.3.1正题名RecordTitle51.3.2并列题名AlternativeTitle61.3.3副题名AnnotationTitle71.3.4缩略题名AbbreviatedTitle81.4文件分类RecordClassification1.4.1职能分类FunctionClassification91.4.2主题分类SubjectClassification101.5文件主题RecordSubject1.5.1主题词或关键词Subject/Keyword111.5.2次关键词SecondLevelKeyword121.5.3第三关键词ThirdLevelkeyword131.6文件摘要RecordAbstract141.7文件日期RecordDate1.7.1创建日期CreationDate151.7.2登记日期RegistrationDate161.7.3传输日期TransferingDate171.8文件语种RecordLanguageType181.9文件种类RecordForm191.10文件覆盖范围RecordCoverage1.10.1覆盖时间CoveragePeriod201.10.2覆盖区域CoverageArea211.11文件技术环境RecordTechnicalEnvironment.1.11.1媒体格式MediaFormat221.11.2数据格式DataFormat231.11.3载体类型MediumType241.11.4扩展名Extent251.11.5原始创建环境OriginalCreatingEnvironment261.11.6载体到期时间MediumDueDate271.12文件位置RecordLocation1.12.1当前位置CurrentLocation281.12.2存储位置StoreLocation291.12.3存储日期LocationDate301.12.4存储说明StoreStatement311.13文件权限RecordRights1.13.1访问控制 RecordAccess321.13.2使用条件RecordUseCondition331.13.3安全等级RecordSecurityClassification341.13.4存取警告RecordAccessCaveat351.13.5存取说明RecordAccessStatement361.13.6存取时间RecordAccessDate371.13.7到期时间RecordDueDate381.14文件处置RecordDisposal1.14.1处置授权DisposalAuthorisation391.14.2处置内容DisposalSentence401.14.3处置状态DisposalStatus411.14.4处置日期DisposalDate421.14.5处置说明DisposalStatement431.15文件管理历史RecordMangementHistory1.15.1事件标识EventIdentifier441.15.2事件类型EventHistoryType451.15.3事件描述EventHistoryDefinition461.15.4事件实施日期EventHistoryDate472责任者实体 Agent Entity2.1责任者层级AgentCategory482.2责任者标识AgentIdentifier2.2.1责任者标识码 AgentIdentifier492.2.2责任者数字签名DigitalSignature502.3责任者描述 AgentDescription2.3.1责任者名称AgentTitle512.3.2责任者简称AbbreviatedName522.3.3责任者职责范围AgentDomain532.3.4责任者办公地址AgentBusinessAddress542.3.5责任者联系地址AgentContactAddress552.3.6责任者建立日期AgentCommencementDate562.3.7责任者撤销日期AgentCessationDate572.3.8责任者行为日期AgentOperationalPeriodDate582.4责任者权限AgentRights2.4.1责任者存取安全等级AgentAccessSecurityClassification592.4.2责任者存取警告AgentCaveat602.4.3文件保管许可RecordkeepingPermissions612.4.4责任者存取说明AgentAccessStatement622.4.5责任者存取生效日期AgentDeterminationDate632.4.6责任者存取到期日期AgentReviewDueDate642.5责任者行为历史AgentActivityHistory2.5.1责任者行为标识AgentActivityIdentifier652.5.2责任者行为类型AgentActivityType662.5.3责任者行为定义AgentActivityDefinition672.5.4责任者行为日期AgentActivityDate683 业务实体FunctionEntity3.1业务层级FunctionCategory693.2业务标识FunctionIdentifier3.2业务标识码 FunctionIdentifier703.3业务法规依据FunctionMandate3.3.1业务法规类型FunctionMandateType713.3.2业务法规题名FunctionMandateTitle723.3.3业务法规标识FunctionMandateIdentifier733.3.4业务法规描述FunctionMandateDescription743.3.5业务法规有效日期FunctionMandateValidDate753.3.6业务法规赋予权限FunctionMandateJurisdiction763.4业务描述FunctionDescription3.4.1业务范围FunctionActivityArea773.4.2业务名称FunctionTitle783.4.3业务说明FunctionStatement793.4.4业务执行日期FunctionExecutiveDate803.4.5业务完成日期FunctionCompletedDate813.4.6业务失效时间FunctionInvalidDate823.5业务权限FunctionRights3.5.1业务存取安全等级FunctionAccessSecurityClassification833.5.2业务存取警告FunctionCaveat843.5.3业务使用条件FunctionUseCondition853.5.4业务存取说明FunctionAccessStatement863.5.5业务存取生效日期FunctionDeterminationDate873.5.6业务存取到期日期FunctionReviewDueDate883.6业务处理过程FunctionHistory3.6.1业务处理标识FunctionEventIdentifier893.6.2业务处理类型FunctionEventType903.6.3业务处理定义FunctionEventDefinition913.6.4业务处理日期FunctionEventDate924关系实体RelationEntity4.1关系实体标识RelationEntityIdentifier934.2关系实体类型RelationEntityClassification944.3相关实体标识IdentifierOfTheRelatedEntity954.4相关实体类型TpyeOfTheRelatedEntity964.5关系定义RelationshipDefinition974.6关系时间RelationshipTime985保存实体PreservationEntity5.1签名信息SignatureInfo5.1.1签名格式描述SignatureFormatDescription995.1.2签名算法SignatureAlgorithm1005.1.3签名日期SignatureDate1015.1.4签名者Signer1025.1.5签名Signature1035.1.6证书链SignatureBlock1045.2锁定签名信息LockSignatureInfo5.2.1锁定签名格式描述LockSignatureFormatDescription1055.2.2锁定签名算法LockSignatureAlgorithm1065.2.3锁定签名日期LockSignatureDate1075.2.4锁定签名者LockSigner1085.2.5锁定签名LockSignature1095.2.6锁定证书链LockSignatureBlock1105.3编码Encoding5.3.1编码文件格式RenderingText1115.3.2当前编码关键词RenderingKeyWord1125.3.3文件编码RecordEncoding7.3 电子文件元数据模块元素及应用层次对应表7.3.1 文件实体(Record Entity)模块名称元素组成应用层次文件实体层级1.1文件层级(Record Category)文件,文件组合(案卷),类别(系列),全宗,全宗群文件标识1.2 文件标识(Record Identifier)1.2.1文件标识(Record Identifier)1.2.2文件编号(Record Number)文件,文件组合(案卷),类别(系列),全宗同上文件文件描述1.3文件题名(Record Title)1.3.1正题名(Record Title)1.3.2 并列题名(Alternative Title)1.3.3副题名(Annotation Title)1.3.4缩略题名(Abbreviated Title)1.4文件分类(Record Classification)1.4.1职能分类(Function Classification)1.4.2主题分类(Subject Classification)1.5 文件主题(Record Subject)1.5.1主题词或关键词(Subject or Keyword)1.5.2次关键词(Second Level Keyword)1.5.3第三关键词(Third Level keyword)1.6文件摘要(Record Abstract)1.7文件日期(Record Date)1.7.1创建日期(CreationDate)1.7.2登记日期(RegistrationDate)1.7.3传输日期(TransferingDate)1.8文件语种(Record Language Type)1.9文件种类(Record Form)1.10文件覆盖范围(Record Coverage)1.10.1覆盖时间(CoveragePeriod)1.10.2覆盖区域(CoverageArea)1.11文件技术环境(Record Technical Environment) 1.11.1 媒体格式(Media Format)1.11.2 数据格式(Data Format)1.11.3 载体类型(Medium Type)1.11.4 扩展名(Extent)1.11.5原始创建环境(Original Creating Environment)1.11.6 载体到期日期(Medium Due Date)1.12文件位置(Record Location)1.12.1 当前位置(Current Location)1.12.2存储位置(Store Location)1.12.3存储日期(Location Date)1.14.3 存储说明(Store Statement)文件,文件组合(案卷),类别(系列),全宗文件, 文件组合(案卷)文件,文件组合(案卷)文件,文件组合(案卷),类别,全宗文件,文件组合 (案卷),类别,全宗文件文件文件文件文件文件文件文件文件文件文件,文件组合(案卷),类别,全宗同上同上同上同上文件权限1.13文件权限(Record Rights) 1.13.1访问控制(Record Access)1.13.2使用条件(Record Use Conditions)1.13.3安全等级(Record Security Classification)1.13.4存取警告(Record Access Caveat)1.13.5存取说明(Record Access Statement)1.13.6存取时间(Record Access Date)1.13.7到期时间(Record Due Date)参见文件权限结构型数据定义文件, 文件组合(案卷),类别,全宗文件处置1.14 文件处置(Record Disposal)1.14.1处置状态(Preservation Term)参见处置结构型数据定义文件, 文件组合(案卷)文件管理历史1.15文件管理历史(Record Management History)1.15.1 事件标识(Event Identifier)参见文件管理历史结构型数据定义文件,文件组合(案卷)7.3.2 责任者实体(Agent Entity)模块名称元素组成应用层次责任者层级2.1责任者层级(Agent Category)个人,工作组,机构,组织责任者标识2.2 责任者标识(Agent Identifier) 2.2.1责任者标识码(Agent Identifier) 2.2.2责任者数字签名(Agent Digital Signature)个人,工作组,机构,组织责任者描述2.3责任者描述(Agent Description)2.3.1责任者名称(Agent Title)参见责任者描述结构型数据定义个人,工作组,机构,组织个人,工作组,机构,组织责任者权限2.4 责任者权限(Agent Rights)2.4.1责任者存取安全等级(Agent Access Security Classification)参见责任者权限结构型数据定义个人,工作组,机构,组织责任者行为历史2.5责任者行为历史(Agent Activity History) 2.5.1 责任者行为标识(Agent Activity Identifier)参见责任者行为历史结构型数据定义个人,工作组,机构,组织7.3.3 业务实体(Function Entity)模块名称元素组成应用层次业务层级3.1业务层级(Function Category)事务、活动、职能、外部职能业务标识3.2业务标识码(Function Identifier)事务、活动、职能、外部职能法规依据3.3 业务法规依据(Function Mandate)3.3.1法规类型(Function Mandate Type) 参见业务法规依据结构型数据定义事务、活动、职能、外部职能业务描述3.4.1业务范围(Function Activity Area)3.4.2业务名称(Function Title)参见业务描述结构型数据定义事务、活动、职能、外部职能业务权限3.5业务权限(Function Rights)3.5.1业务存取安全等级(Function Access Security Classification)参见业务权限结构型数据定义事务、活动、职能、外部职能业务处理过程3.6 业务处理过程(Function History)3.6.1 业务处理(Function Event Identifier)参见业务处理过程结构型数据定义事务、活动、职能、外部职能7.3.4 关系实体(Relation Entity)模块名称元素组成应用层次关系描述4.1关系实体标识(Relation Entity Identifier)参见关系描述结构型数据定义7.3.5 长期保存实体(Preservation Entity)模块名称元素组成签名信息5.1 签名信息(Signature Info)5.2锁定签名信息(Lock Signatu