医疗数据中心建设规范第3部分:科研数据中心(T-GZBC 16.3—2020).pdf
《医疗数据中心建设规范第3部分:科研数据中心(T-GZBC 16.3—2020).pdf》由会员分享,可在线阅读,更多相关《医疗数据中心建设规范第3部分:科研数据中心(T-GZBC 16.3—2020).pdf(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、ICS 11.020 C 07 团体标准 T/GZBC 16.32020 医疗数据中心建设规范 第 3 部分:科研数据中心 Specification for construction of medical data centerPart 3:Scientific research data center 2020-08-17 发布 2020-09-01 实施 广州市标准化促进会 广东省健康医疗大数据标准工作组 发 布 T/GZBC 16.32020 I 目 次 前 言.II 1 范围.1 2 规范性引用文件 .1 3 缩略语.1 4 科研数据规范.1 4.1 数据资源规划.1 4.2 医疗业
2、务数据来源.2 4.3 其他医疗业务数据来源.2 4.4 数据标准化.2 5 科研数据治理要求.2 5.1 原则.2 5.2 治理范围.2 5.3 治理方法.3 5.4 治理评价.4 6 科研数据储存管理.5 6.1 数据存储模型.5 6.2 全量库存储.5 6.3 主题库存储.5 6.4 数据加密.5 7 科研数据中心服务要求.5 7.1 服务流程规范.5 7.2 数据服务项.9 T/GZBC 16.32020 II 前 言 T/GZBC 16医疗数据中心建设规范分为以下 3 部分:第 1 部分:临床数据中心;第 2 部分:运营数据中心;第 3 部分:科研数据中心。本部分为T/GZBC 16
3、 的第3部分。本部分按照GB/T 1.12020标准化工作导则 第1部分:标准化文件的结构和起草规则的规定起草。请注意本部分的某些内容可能涉及专利。本部分的发布机构不承担识别专利的责任。本部分由广东省健康医疗大数据标准工作组提出并归口。本部分起草单位:广州中医药大学第一附属医院、中山大学附属第一医院、广州医科大学附属第一医院、中山大学附属肿瘤医院、广州医科大学附属第二医院、广州医科大学附属第三医院、广州市第八人民医院、南方医科大学南方医院、南方医科大学珠江医院、广州市妇女儿童医疗中心、工业和信息化部电子第五研究所、北京嘉和美康信息技术有限公司、广州惠侨计算机科技有限公司、广州知汇云科技有限公司
4、。本部分主要起草人:贺嘉嘉、林圻、余俊蓉、黄超仪、任忠敏、王琼、黄波、杨广黔、曹晓均、张巍、付敬、张雷、刘花、刘云鹤、郭露、黄小帅、陆慧菁、高峰、陈涛、李永强、查正清、张家庆、邓意恒、吴丽萍。本部分首次发布。T/GZBC 16.32020 1 医疗数据中心建设规范 第 3 部分:科研数据中心 1 范围 T/GZBC 16 的本部分规定了科研数据中心科研数据规范、数据治理要求、数据储存管理和对外服务要求等方面内容。本部分适用于医疗机构全疾病谱科研数据中心建设,不适用于医院的科研数据中心硬件要求、IT基础设施,也不适用于区域医疗数据中心、非紧密型医联体数据中心的要求。2 规范性引用文件 下列文件中
5、的内容通过文中的规范性引用而构成本文必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。WS/T 3032009 卫生信息数据元标准化规则 WS/T 3042009 卫生信息数据模式描述指南 WS/T 3052009 卫生信息数据集元数据规范 WS/T 3062009 卫生信息数据集分类及编码规则 WS/T 500(所有部分)电子病历共享文档规范 T/GZBC 362020 广东省健康医疗数据脱敏技术规范 T/GZBC 372020 医疗机构数据治理规范 国家卫生健康委办公厅关于印发全国医院数据上报管理方案(试
6、行)的通知 附件 1 全国医院数据上报管理方案 医疗业务(试行)(国卫办规划函2019380 号)3 缩略语 下列缩略语适用于本文件。CSV:逗号分隔值(Comma-Separated Values)EMRs:电子病历系统(Electronic Medical Record System)LIS:检验信息系统(Laboratory Information System)JSON:对象简谱(JavaScript Object Notation)PACS:影像归档与通讯系统(Picture Archiving and Communication Systems)XML:可扩展标记语言(eXtens
7、ible Markup Language)XSL:可扩展样式语言(eXtensible Stylesheet Language)4 科研数据规范 4.1 数据资源规划 T/GZBC 16.32020 2 建设科研数据中心,医疗机构应首先完成数据资源的规划工作,通过资源规划明确科研数据中心拟收集数据的主要来源业务、数据范围、数据项目、数据类型和采集频度,数据资源规划应满足学术和伦理要求,科研数据中心的数据来源可以包括:医疗业务数据和非医疗业务数据。4.2 医疗业务数据来源 医疗业务数据是指患者在诊治活动中所产生的过程性记录数据,数据范围包括但不限于:医嘱、检查报告、检验报告、病历等。医疗业务数据
8、主要由医院信息系统产生和管理,这些系统包括但不限于HIS、EMR、LIS、RIS、手术麻醉系统、ICU 管理系统、体检系统、随访系统等。4.3 非医疗业务数据来源 非医疗业务数据是指通过非临床业务系统产生的可用于研究的数据。非医疗业务数据来源包括但不限于:生物样本信息、生物组学数据、实验分析数据、临床研究数据、临床试验数据、流行病调查数据、预防免疫数据、环境因素及其他相关数据、国内外公开权威数据库数据、外部登记数据等。4.4 数据标准化 4.4.1 原则 科研数据中心中的医学数据应遵循统一的数据标准并优先采用国家、卫生行业已经制定的相关数据标准作为基准,对非标准数据进行转换处理。若没有相应的国
9、家或卫生行业数据标准可以引用,应按照国家卫生信息标准制定的有关要求完成数据标准制定工作。4.4.2 通用科研数据标准 对于医疗机构的主要业务断面和相关数据,应符合“国家卫生健康委办公厅关于印发全国医院数据上报管理方案(试行)的通知 附件 1 全国医院数据上报管理方案-医疗业务(试行)”及 WS/T 500(所有部分)里的有关规定。4.4.3 未制定标准的数据标准化 对于国家或者卫生行业尚未制定标准的数据,应按照 WS/T 3032009、WS/T 3042009、WS/T 3052009、WS/T 3062009 的要求形成标准化数据元和数据集。5 科研数据治理要求 5.1 原则 科研数据治理
10、是针对纳入科研数据中心采集范围的医疗相关数据的治理与反馈,是医疗机构数据治理工作中的一个重要环节,应符合 T/GZBC 372020 中数据治理的相关要求。5.2 治理范围 科研数据中心的数据治理范围应包括医疗机构中可用于临床和转化研究的全部电子化信息,按照数据产生的场景来划分,可以区分为内部数据和外部数据两类。a)内部数据:指由医疗机构内部的工作系统所产生的电子化数据,包括但不限于:医院内的电子病历系统(EMRs)、检验信息系统(LIS)、医学影像管理系统(PACS)、手术麻醉系统、生物样本管理系统等产生的相关记录,需要根据需求定期地、重复地进行治理;b)外部数据:是指来自医疗机构之外的电子
11、化数据,包括但不限于:外院数据、外检数据、公共T/GZBC 16.32020 3 数据等,需要通过特定的安全传输方式进行数据的归集,在此基础上根据科研需求定期地、重复地进行治理。5.3 治理方法 5.3.1 核心过程 在整个数据治理过程中,应针对不同时期、不同类型的数据特点,采取不同的方法进行治理。治理的过程应至少包括 5 个核心步骤:数据收集、数据清洗、后结构化处理、数据归整、数据校验,并要求在各个过程均有管理与监控工具支持。5.3.2 数据收集 数据收集是数据治理的第一步,针对内部数据,科研数据中心可以采用直接收集、集成平台收集、数据中心收集等方式;对于外部数据可以采用电子交换、数据导入等
12、收集办法,并按照时间增量方式进行收集。a)直接收集:从生产系统直接收集科研数据,宜采用定时抽取方式获取有关数据,有条件的情况下建议使用备份数据进行收集。根据生产系统的实际情况,科研数据中心可以使用关系型数据库原表(或关系型数据库视图)或者其他通用数据接口方式进行数据收集;b)集成平台收集:应根据科研数据需求与数据来源分布,在集成平台的信息交换协议框架下,建立数据收集规则,利用集成平台实现相关数据的及时收集;c)数据中心收集:对于已经建立全量级医院数据中心的机构,科研数据中心宜直接从数据中心获取相关数据;d)电子交换:对于来自外部的电子化数据,在网络、安全条件许可情况下,可以采取基于电子数据交换
13、协议的收集方式;e)数据导入:科研数据中心应支持通用电子数据文件的导入,如 Excel、CSV 等。5.3.3 数据清洗 科研数据中心对收集到的数据,应首先进行数据清洗工作。科研数据中心应具备灵活的数据清洗规则定义能力,这些规则包括但不限于:数据映射、缺失值处理、格式验证、逻辑验证等。5.3.4 医学文本后结构化处理 科研数据中心应具备针对非结构化电子记录的结构化处理能力,将医学语境下基于自然语言描述的医疗记录转化为结构化数据。后结构化的准确率和召回率应满足使用要求。5.3.5 数据归整 针对清洗和结构化处理的数据,科研数据中心应基于语义进行归一、分类、索引整理,建立元数据,以纳入对象个体为单
14、位实现数据序列化,通过对象的唯一性标识,实现多源数据的逻辑整合,这些数据包括但不限于:临床业务数据、实验分析数据、外部数据等。5.3.6 数据校验 科研数据中心应在数据治理过程的各主要阶段进行必要的数据校验,保证科研数据的完整性。5.3.7 数据脱敏 科研数据中心应在保证数据科研使用最大价值和可用性的前提下,采取适宜的技术方法对收集的科T/GZBC 16.32020 4 研数据进行脱敏处理,符合 T/GZBC 362020 中数据的要求。5.3.8 数据注释 科研数据中心应提供数据二次注释能力,通过定义符合科研要求的数据项/词性,采用人工标注或者其他标注方式,对原始病历文书、检验、检查等源数据
15、进行相应数据项/词性的标注,进一步扩充科研数据中心内容。5.3.9 人工干预 科研数据中心应提供人工干预数据合格判定的功能,在依据系统判定数据合格与否的基础上,人为可干预判定结果,标定人为干预合格数据的标志,避免特例数据在治理过程中错误的判定。5.3.10 质量保证 针对核心数据治理过程,科研数据中心应建立有效的质量保证体系,建立可信的证据链,并通过客观的质量指标反映数据治理过程和结果。5.4 治理评价 5.4.1 建立评价体系 科研数据中心要建立一套可评价的体系,从数据的及时性、完整性、准确性、一致性、关联性、溯源性等 6 个维度对数据治理过程进行评价。5.4.2 及时性 及时性是业务数据产
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医疗数据中心建设规范第3部分:科研数据中心T-GZBC 16.32020 医疗 数据中心 建设 规范 部分 科研 GZBC 16.3 2020
限制150内