WS∕T 671—2020 国家卫生与人口信息数据字典(卫生).pdf
《WS∕T 671—2020 国家卫生与人口信息数据字典(卫生).pdf》由会员分享,可在线阅读,更多相关《WS∕T 671—2020 国家卫生与人口信息数据字典(卫生).pdf(145页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、ICS 11.020 C 07 WS 中 华 人 民 共 和 国 卫 生 行 业 标 准 WS/T 6712020 国家卫生与人口信息数据字典 National data dictionary for health and population information 2020-05-22 发布 2020-12-01 实施 中华人民共和国国家卫生健康委员会 发 布 WS/T 6712020 目 次 前言.I 1 范围.1 2 规范性引用文件.1 3 术语、定义和缩略语.1 4 通用数据元描述规则.4 5 通用数据元表示类.5 6 元数据标识符产生规则.5 7 词表概念标识符产生规则.5 8 通
2、用数据元描述.5 9 词表.104 附录 A(规范性附录)HL7 V3 数据类型.128 附录 B(规范性附录)卫生信息概念数据模型与数据字典对应关系.130 附录 C(规范性附录)数据字典应用图示.134 参考文献.135 索引.136 WS/T 6712020 I 前 言 本标准按照 GB/T 1.12009给出的规则起草。本标准起草单位:中国人民解放军空军军医大学、国家卫生健康委统计信息中心、华中科技大学同济医学院、上海市疾病预防控制中心。本标准主要起草人:刘丹红、杨喆、娄苗苗、郝惠娟、胡建平、李岳峰、张黎黎、沈丽宁、夏天、张诚。WS/T 6712020 1 国家卫生与人口信息数据字典
3、1 范围 本标准给出了国家卫生与人口领域的通用数据元及其描述,作为相关领域数据类标准的开发指南。本标准适用于国家卫生与人口领域信息的标准化与规范化,指导数据采集、传输、汇总和集成过程中所使用的各类信息工件的开发,包括数据集、共享文档等。2 规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅所注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T 2260 中华人民共和国行政区划代码 GB/T 2659 世界各国和地区名称代码 GB/T 3304 中国各民族名称的罗马字母拼写法和代码 GB/T 4658 学历代码 GB/
4、T 18391.1 信息技术元数据注册系统(MDR)第1部分:框架(ISO/IEC 11179-1 IDT)GB/T 18391.3 信息技术元数据注册系统(MDR)第3部分:注册系统元模型与基本属性(ISO/IEC 11179-3 IDT)GB/T 30107 健康信息学 HL7 V3 参考信息模型 GB/T 31287 全国组织机构代码应用标识规范 WS/T 672 国家卫生与人口信息概念数据模型 ISO 4217 货币代码(Currency codes)HL7 V3 标准 数据类型-抽象规范,发布版本2(HL7 Version 3 Standard:Data Types-Abstract
5、 Specification,Release 2)3 术语、定义和缩略语 GB/T 18391-2009界定的以及下列术语和定义适用于本文件。为了便于使用,以下重复列出了GB/T 18391-2009中的某些术语和定义。3.1 术语和定义 3.1.1 对象类 object class 想法、抽象概念或现实世界中事物的一个集合,它可以用明确的界限和含义进行标识,其特性和表现遵循相同的规则。GB/T 18391.3-2009,定义3.3.88 3.1.2 属性 attribute 一个对象或实体的特征。GB/T 18391.3-2009,定义3.1.3 WS/T 6712020 2 3.1.3 定
6、义 definition 描述一个概念并区别于其他相关概念的表述。GB/T 18391.3-2009,定义3.1.12 3.1.4 数据元概念 data element concept 以数据元的形式表示的一个概念,其描述与任何特定表示法无关。GB/T 18391.3-2009,定义3.3.38 3.1.5 数据元 data element 由一组属性规定其定义、标识、表示和允许值的一个数据单元。GB/T 18391.3-2009,定义3.3.36 3.1.5.1 通用数据元 general data element 描述抽象的对象类的数据元。在具体的应用场景中,通用数据元可被特化为若干具体的
7、规范数据元。3.1.5.2 规范数据元 specified data element 描述具体的对象类的数据元。规范数据元可通过抽象被泛化为通用数据元。3.1.6 值域 value domain 允许值的集合 GB/T 18391.3-2009,定义3.3.140 3.1.7 元数据 metadata 定义和描述其它数据的数据。GB/T 18391.3-2009,定义3.2.18 3.1.8 数据字典 data dictionary 元数据的集合。3.1.9 数据集 data set 特定领域或主题的数据元的集合。3.1.10 词表vocabulary 有一个代码型属性或字段的多个有效值组成的
8、集合。WS/T 6712020 3 GB/T 30107-2013,定义3.1.54 3.1.11 数据类型 datatype 一些可区分的值的集合,这种区别由这些值的特性以及对这些值的运算所表征。GB/T 18391.3-2009,定义3.3.53 3.1.12 数据元表示 data element representation 一个数据元与其值域之间的关系。GB/T 18391.3-2009,定义3.3.50 3.1.13 数据元表示类 data element representation class 一个数据元表示的类。GB/T 18391.3-2009,定义3.3.51 3.1.14
9、 表示类 representation class 表示的类型分类。GB/T 18391.3-2009,定义3.3.126 3.1.15 编码系统 coding system(通常)使用短概念标识符说明概念是系统组成部分,且定义一个唯一概念代码集的概念表示体系。GB/T 30107-2013,定义3.1.10 3.1.16 数据标识符 data identifier 注册机构内一个管理项的唯一标识符。GB/T 18391.1-2009,定义3.3.10 3.1.17 注册机构 registration authority 负责维护一个注册薄的组织。GB/T 18391.3-2009,定义3.3
10、.121 3.1.18 注册状态 registration status 一个管理项在注册生命周期中状态的一个指称。GB/T 18391.3-2009,定义3.3.125 3.1.19 对象标识符 objectidentifier WS/T 6712020 4 标识一个ISO对象的、全球唯一的字符串,由数字和点组成,例如“2.16.840.1.113883.3.1”。对象标识符为树型结构,最左边的数字表示根,最右边的数字代表叶。HL7 DATA TYPE R2,定义1.7 3.2 缩略语 下列缩略语适用于本文件。HL7:健康信息交换与传输标准(Health Level Seven)ICD:国际
11、疾病分类(International Classification of Diseases)ID:标识符(Identifier)LOINC:逻辑观测指标标识符命名与编码系统(Logical Observation Identifier Names and Codes)OID:对象标识符(Object Identifier)RIM:参考信息模型(Reference Information Model)SNOMED CT:系统医学命名法临床术语(Systemized Nomenclature of Medicine,Clinical Term)UCUM:测量单位统一代码(Unified Code
12、for Units of Measure)4 通用数据元描述规则 通用数据元采用17项元数据属性进行描述,包括9项公共属性、4项数据元特有属性和4项数据元概念特有属性,详见表1。表 1 通用数据元描述规则 描述项目名称 定义 可选性 公共属性公共属性 元数据类型 数据元、数据元概念、值域或其它元数据项目。通用数据元的元数据类型为数据元 M 规范名称 按照ISO/IEC 11179-5命名规则确定的数据元名称,由数据元所描述的对象类、属性及其表示类型组合而成 M 同义名称 与规范名称具有同等含义的惯用称谓或者简称 O 元数据标识符 六位随机数,在本数据字典中具有唯一性 M 定义 根据该数据元在概
13、念数据模型中对应的对象类和属性,描述数据元的含义 M 注册机构 提出本数据元标准并完成注册的单位或机构名称 M 注册状态 标准生命周期中的某个阶段,例如标准、已发布标准、已废止标准等等 M 版本 数据字典目前的版本号 M 备注 需要补充说明的其它属性 O 数据元属性数据元属性 数据类型 数据元表示类型的名称 M 表示类 数据元表示形式的约束。通用数据元表示类参照ISO/IEC 11179-3 M 值域名称 表达编码型属性取值的编码系统的名称 O 值域标识符 表达编码型属性取值的编码系统的标识符 O 数据元概念属性数据元概念属性 对象类名称 数据元所描述的对象类的名称 M 对象类标识符 数据元所
14、描述的对象类的标识符,参照HL7 RIM M 属性名称 数据元所描述的对象类的属性的名称 M 属性标识符 数据元所描述的对象类的属性的标识符,参照HL7 RIM M WS/T 6712020 5 M:必选;O:可选。5 通用数据元表示类 通用数据元的表示类见表2。表 2 通用数据元的表示类 名称 说明 代码 代表特定值的有效符号系统,例如字母、数字、各类符号和/或上述形式的结合 计数 由计数得到的非货币数量值 货币 日期 表示日历日期,例如,YYYY-MM-DD 图形 图、表、数学曲线等,通常为矢量图 符号 代表客体的某种标记,该标记通常与其所代表的客体形似或类似 图片 人、客体或场景的可视化
15、表示,通常为光学影像 数量 连续性数值,例如长度、容量、客观物体的数目等 文本 非格式化的信息或字段 时间 日期或持续的时间,例如 HH:MM:SS.SSSS 6 元数据标识符产生规则 元数据标识符由机器算法产生,不采用先导为零的形式。首先采用随机函数产生六位随机数,再检验产生的随机数是否重复。如有重复则重新生成随机数,再次检验是否重复,直至所有的随机数都具备唯一性。7 词表概念标识符产生规则 词表中的概念使用概念ID进行标识。概念ID中的字母为概念所属对象类英文名称的首字母,数字为无含义随机数字,一般为六位,在本标准中具有唯一性。随机数产生规则与元数据标识符相同。8 通用数据元描述 国家卫生
16、与人口信息数据字典共包含144个通用数据元,描述如下。WS/T 6712020 6 8.1 编码系统标识符 公共属性公共属性 元数据类型 数据元 规范名称 编码系统标识符 同义名称 代码表标识 元数据标识符 173028 定义 赋予特定编码系统的唯一标识符。该标识符在国家卫生信息元数据管理系统内具有唯一性。当用户需要采用代码形式对描述对象(如实体)进行分类、命名和标识时,通过本数据元指向所使用的编码系统。编码系统定义可编码属性的值域。同一属性可使用不同的编码系统,而代码的形式和含义只保证在一个编码系统内部具有唯一性。为了避免不同用户使用不同编码系统描述同一个对象类的可编码属性时的语义混淆,必须
17、在使用代码的同时,通过本数据元明确、唯一地指向所使用的编码系统。本数据元适用于本数据字典中所有编码系统标识符的描述。注册机构 国家卫生健康委统计信息中心 注册状态 标准 版本 V1 备注 本数据元与本数据字典中所有的代码类数据元(CS,CV,CE,CD)联合使用。所有编码系统在其使用的范围内都应有唯一的标识符。例如,HL7自行定义和维护的词汇域及其指定的外部术语系统如LOINC,ICD,SNOMED CT等均有标识符,供文档等工件开发时使用。数据元属性数据元属性 数据类型 ST 表示类 文本 值域名称 值域标识符 数据元概念属性数据元概念属性 对象类名称 编码系统 对象类标识符 CodeSys
18、tem 属性名称 标识 属性标识符 ID WS/T 6712020 7 8.2 编码系统名称 公共属性公共属性 元数据类型 数据元 规范名称 编码系统名称 同义名称 代码表名称 元数据标识符 142557 定义 赋予特定编码系统的名称,表达该编码系统的主题和内容。因为自然语言的灵活性,编码系统名称须和编码系统标识符联合使用,即借助标识符的唯一性,避免用户通过名称指向所使用的编码系统时可能产生的误解。编码系统可用来定义所有可编码属性的值域,且同一属性可使用不同的编码系统,而代码的形式和含义只保证在一个编码系统内部具有唯一性。为了避免不同用户使用不同编码系统描述同一可个编码属性时语义的混淆,必须在
19、使用代码的同时,说明所使用的编码系统。本数据元适用于本字典中所有编码系统名称的定义。注册机构 国家卫生健康委统计信息中心 注册状态 标准 版本 V1 备注 所有编码系统都有其规范或习惯的名称。例如HL7标准体系自定义的词汇域及其指定的外部术语代码系统如LOINC,ICD,SNOMED CT等。数数据元属性据元属性 数据类型 ST 表示类 文本 值域名称 值域标识符 数据元概念属性数据元概念属性 对象类名称 编码系统 对象类标识符 Codesystem 属性名称 名称 属性标识符 Name WS/T 6712020 8 8.3 测量单位名称 公共公共属性属性 元数据类型 数据元 规范名称 测量单
20、位名称 同义名称 计量单位 元数据标识符 191412 定义 用于计量数量的单位,比如实体的测量单位。实体数量的测量单位应该与实体的固有属性在逻辑上一致。不同专业领域、针对不同种类的实体,可以采纳不同的表示测量单位的编码系统中的计量单位。注册机构 国家卫生健康委统计信息中心 注册状态 标准 版本 V1 备注 测量单位在不同的编码系统可能用不同的符号表示。使用某个计量单位的符号时,应该说明定义该符号的编码系统的标识符和名称。为了数据的一致性,提倡针对同一类实体使用相同的测量单位表示其数量,或者至少在针对同一类实体的不同测量单位之间建立数量上的换算关系,即使用UCUM。数据元数据元属性属性 数据类
21、型 CS 表示类 文本 值域名称 UCUM 值域标识符 UCUM的OID 数据元概念属性数据元概念属性 对象类名称 测量单位 对象类标识符 Measure Unit 属性名称 名称 属性标识符 Name 8.4 货币单位代码 公共公共属性属性 元数据类型 数据元 规范名称 货币单位代码 同义名称 货币单位 元数据标识符 775869 定义 世界各国或在一定范围内使用的货币种类,用代码表示。进行货币数量之间的比较时,必须说明所使用的货币的种类。本数据元的定义和表示等同采用国际标准ISO 4217或ISO4217的子集。注册机构 国家卫生健康委统计信息中心 注册状态 标准 版本 V1 备注 货币单
22、位代码常用于表示金额的数据元,例如,工资金额、费用金额、收入金额等。在表达数额的同时,应按照货币单位代码标注货币种类。数据元属性数据元属性 数据类型 CS 表示类 代码 值域名称 Currency 值域标识符 Currency的OID 数据元概念属性数据元概念属性 对象类名称 货币种类 对象类标识符 MO 属性名称 单位 属性标识符 unit WS/T 6712020 9 8.5 实体类代码 公共公共属性属性 元数据类型 数据元 规范名称 实体类代码 同义名称 实体类 元数据标识符 134193 定义 某个实体的实例所属的实体类别。如果用代码表示所有客观实体,代码的数量将异常庞大。因此,用类代
23、码首先对实体进行高层级的宏观分类,为每个实体的实例限定一个恰当的语境,然后再进一步用实体代码(Entity.code)属性赋予每个实体的实例一个代码值。人、机构、物质、地点等,均属于实体,可用代码表示其类别。注册状态 标准 注册机构 国家卫生健康委统计信息中心 版本 V1 备注 领域使用的数据元大多针对实体的实例,即特化后的实体。对实体进行特化时要遵守实体类代码和实体代码的定义,避免语义上的含糊和误解。数据元属性数据元属性 数据类型 CS 表示类型 代码 值域名称 实体类代码(见表3)值域标识符 实体类代码的OID 数据元概念属性数据元概念属性 对象类名称 实体 对象类标识符 Entity 属
24、性名称 类代码 属性标识符 cassCode WS/T 6712020 10 8.6 实体限定码 公共公共属性属性 元数据类型 数据元 规范名称 实体限定码 同义名称 元数据标识符 814063 定义 规定实体对象是宽泛的(类)还是特定的(实例)。多数情况下,一个实体可能表示关于某个特定实例的信息,有时表示一般意义上的一大类实体信息。例如,一个人(实例),某省居民(一类人)注册机构 国家卫生健康委统计信息中心 注册状态 标准 版本 V1 备注 数据元属性数据元属性 数据类型 CS 表示类型 代码 值域名称 实体限定码(见表4)值域标识符 实体限定码的OID 数据元概念属性数据元概念属性 对象类
25、名称 实体 对象类标识符 Entity 属性名称 限定码 属性标识符 determinerCode WS/T 6712020 11 8.7 实体标识系统标识 公共公共属性属性 元数据类型 数据元 规范名称 实体标识系统标识 同义名称 标识符种类 元数据标识符 300643 定义 任何实体均可用具备一定内部规则的标识符进行标识,以实现该实体在一定范围内的唯一可标识性。一个实体在不同的场景、为了不同的目的可采用不同标识系统制定的标识符进行标识,因而可以有对应的一系列标识符。为了保证标识符对实体标识的准确性,必须为每个产生标识符的系统设定标识,以表示该标识符系统的类型或者制定和分配该标识符的官方机构
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- WST 6712020 国家卫生与人口信息数据字典卫生 WS 671 2020 国家 卫生 人口 信息 数据 字典
限制150内