药学数据集化学(T-BIA 15—2023).pdf
《药学数据集化学(T-BIA 15—2023).pdf》由会员分享,可在线阅读,更多相关《药学数据集化学(T-BIA 15—2023).pdf(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 ICS 01.040.19 CCS C10 T/BIA 团 体 标 准 T/BIA 15-2023 药学数据集 化学 Pharmaceutical dataset-Chemistry 2023-04-17 发布 2023-04-18 实施 北京信息化协会 发 布 T/BIA 15-2023 I 目 次 前言.II 引言.III 1 范围.4 2 规范性引用文件.4 3 术语和定义.4 4 数据元基本属性说明.5 4.1 数据元基本属性.5 4.2 标识符编码规则.5 4.3 数据元名称.5 4.4 说明.5 4.5 数据类型说明.5 4.6 表示格式说明.6 4.6.1 表示格式中字符含义描
2、述规则.6 4.6.2 表示格式中字符长度描述规则.6 4.7 值域.7 5 概述.7 6 数据元.7 6.1 化合物的基本信息.7 6.2 化合物的结构信息.8 6.3 化合物的物理性质信息.9 6.4 化合物的化学性质信息.9 6.5 化合物的波谱信息.10 6.6 化合物的含量纯度信息.11 6.7 化合物的药物靶点信息.11 参考文献.13 T/BIA 15-2023 II 前 言 本文件按照 GB/T 1.12020标准化工作导则 第 1 部分:标准化文件的结构和起草规则的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由北京信息化协会提出。
3、本文件由北京信息化协会归口。本文件起草单位:中国医学科学院药物研究所;国家人口健康科学数据中心;中国医学科学院;中国医学科学院医学信息研究所;北京协和建昊医药技术开发有限责任公司。本文件主要起草人:李燕、潘显道、刘晓宇、周伟、杨金玲、冯志强、范愉、靳洪涛、吴思竹、沈珑瑛、褚迎雪、邓海东、罗葳、刘思齐、张晓宇、王嘉阳、叶铃、刘盛宇。本文件为首次发布。T/BIA 15-2023 III 引 言 药学数据集包括药理学、药物代谢动力学、药物毒理学、药学相关的组学及化学五个部分。本文件是药学数据集的组成部分之一,旨在为药学相关的化学研究提供一套术语规范、定义明确的基本数据元标准,以规范信息记录内容,实现
4、信息在收集、存储、发布、交换等应用中的一致性和可比性,保证药学信息的有效交换、统计和共享,是药学数据清洗工具研发的基础。T/BIA 15-2023 4 药学数据集 化学 1 范围 本文件规定了化合物的基本信息、化合物的结构信息、化合物的物理性质信息、化合物的化学性质信息、化合物的波谱信息、化合物的纯度含量信息、化合物的药物靶点信息,及编码规则。本文件适用于临床前药物研究、技术优化、研发关键技术工具、数据库构建、数据共享等。2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包
5、括所有的修改单)适用于本文件。GB/T 31074 科技平台 数据元设计与管理 GB/T 7408 数据元和交换格式 信息交换 日期和时间表示法 GB 2312 信息交换用汉字编码字符集 基本集 GB 3102.1-93 空间和时间的量和单位 GB/T 14666 分析化学术语 3 术语和定义 下列术语和定义适用于本文件。3.1 化合物 compound 由两种或两种以上元素的原子组成的纯净物质。具有一定的特性,通常具有一定的组成。3.2 化学性质 chemical properties 化合物在化学变化过程中表现出来的性质。牵扯到化合物分子(或晶体)结构和化学组成的变化。化合物的酸碱性、氧化
6、还原性和络合性等都属化学性质。3.3 物理性质 physical properties 化合物不需要发生化学变化就表现出来的性质,如颜色、性状、气味、熔点、沸点、硬度和密度等。3.4 靶点 target T/BIA 15-2023 5 药物与机体生物大分子的结合部位即药物靶点。药物作用靶点涉及受体、酶、离子通道、转运体、免疫系统、基因等。4 数据元基本属性说明 4.1 数据元基本属性 数据元标识符、数据元名称、英文名称、说明、数据类型、表示格式、计量单位、值域。4.2 标识符编码规则 数据元标识符编码应遵循以下规则:a)规范性引用文件中的数据元标识符编码规则适用于本文件对应数据元。b)非引用类
7、数据元标识符由 2 位大写英文字母与 7 位阿拉伯数字组成。按数据集首字母缩写、大类代码、小类代码、顺序号从左至右顺序排列。结构见图 1。图 1 数据元标识符代码结构 图 1 中:a)标识符前 2 位:数据集首字母缩写 PD,用 2 位大写英文字母表示。b)大类代码:用 2 位数字表示,从 01 开始顺序编码。c)小类代码:用 2 位数字表示,数字大小无含义,在大类内进行排序,从 01 开始顺序编码。大类代码与小类代码之间加“.”区分。d)顺序号:用 3 位数字表示,数字大小无含义,在小类内进行排序,从 001 开始顺序编码。小类代码与顺序号之间加“.”区分。4.3 数据元名称 数据元的名称是
8、标识数据元的主要手段,简称“名称”。4.4 说明 关于数据元的含义和基本特征的说明,并使之区别于其他数据元。4.5 数据类型说明 数据元的数据类型说明见表 1。T/BIA 15-2023 6 表 1 数据类型说明 数据类型 表示符 描述 字符型(string)S 通过字符形式表达的值的类型,可包含字母字符(az,AZ)、数字字符等(默认 GB 2312),其中:S1:不可枚举型,表示数据元的允许值(值域)是不可枚举的,且以字符描述;S2:枚举型,表示数据元的允许值(值域)是可枚举的,通常列表值不超过 3 个;S3:引用型,数据元的允许值(值域)是可枚举的,当列表值超过3个时通常会引用代码表 布
9、尔型(boolean)L 又称逻辑型,采用0(False)或1(True)形式表示的逻辑值的类型 数值型(number)N 通过“0”到“9”数字形式表示的值的类型 日期型(date)D 采用GB/T 7408中规定的YYYYMMDD格式表示的值的类型 日期时间型(datetime)DT 采用GB/T 7408中规定的YYYYMMDDThhmmss格式表示的值的类型(字符T作为时间的标志符,说明时间表示的开始)时间型(time)T 采用GB/T 7408中规定的hhmmss格式表示的值的类型 二进制(binary)BY 上述无法表示的其他数据类型,如图像、音频、视频等二进制流文件格式 4.6
10、表示格式说明 4.6.1 表示格式中字符含义描述规则 数据元的表示格式中字符含义描述规则见表 2。表 2 表示格式中字符含义描述规则 字符 含义 A 字母字符 N 数字字符 AN 字母或(和)数字字符 D8 采用YYYYMMDD的格式表示,其中,“YYYY”表示年份,“MM”表示月份,“DD”表示日期 T6 采用hhmmss的格式表示,其中“hh”表示小时,“mm”表示分钟,“ss”表示秒 DT15 采用YYYYMMDDThhmmss的格式表示,字符T作为时间的标志符,说明日的时间表示的开始;其余字符表示与上同 4.6.2 表示格式中字符长度描述规则 数据元的表示格式中字符长度描述规则见表 3
11、。表 3 表示格式中字符长度描述规则 类别 表示方法 固定长度 在数据类型表示符后直接给出字符长度的数目,如N4 T/BIA 15-2023 7 类别 表示方法 可变长度 1.可变长度不超过定义的最大字符数,在数据类型表示符后加“.”后给出数据元最大字符数目,如 AN.10 2.可变长度在定义的最小和最大字符数之间,在数据类型表示符后给出最小字符长度数后加“.”后再给出最大字符数,如 AN4.20 有若干字符行表示的长度 按固定长度或可变长度的规定给出每行的字符长度数后加“X”后,再给出最大行数,如AN.40X3,有国家规定行文模板的记做AN.X 有小数位 按固定长度或可变长度的规定给出字符长
12、度数后,在“,”后给出小数位数,字符长度数包含整数位数、小数点位数和小数位数,如N6,2 4.7 值域 允许值的合集。5 概述 药学数据集包括:药理学数据集、药物代谢动力学数据集、药物毒理学数据集、化学数据集、药学相关的组学数据集。从实际应用、数据规范共享角度出发,按照药学分支学科分类。化学数据集按照化合物的不同信息内容分类,对化合物的基本信息、结构信息、物理性质信息、化学性质信息、波谱信息、纯度含量信息、药物靶点信息等进行规范,规定了数据元编码规则、数据类型、表示格式、计量单位(可按照不同试验场景选择对应单位)、值域。6 数据元 6.1 化合物的基本信息 化合物的基本信息数据元见表 4。T/
13、BIA 15-2023 8 表 4 化合物的基本信息数据元 6.2 化合物的结构信息 化合物的结构信息数据元见表 5。表 5 化合物的结构信息数据元 数据元标识符 数据元名称 英文名称 说明 数据类型 表示格式 计量单位 值域 PD05.02.001 化学结构2D two-dimensional chemical structure 用元素符号相互连接,表示化合物分子中原子的排列和结合方式的式子 BY AN.X-PD05.02.002 化学结构3D three-dimensional chemical structure 从三维空间揭示化合物的立体结构 BY AN.X-数据元标识符 数据元名称
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 药学数据集化学T-BIA 152023 药学 数据 化学 BIA 15 2023
限制150内