能源大数据数据目录指南(T-JSIA 0002—2022).pdf
《能源大数据数据目录指南(T-JSIA 0002—2022).pdf》由会员分享,可在线阅读,更多相关《能源大数据数据目录指南(T-JSIA 0002—2022).pdf(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、ICS35.080L 77T/JSIA江 苏 省 软 件 行 业 协 会江 苏 省 软 件 行 业 协 会 团 体团 体 标 准标 准T/JSIA 00022022能源大数据 数据目录指南Energy big dataGuidelines for data catalog2022-12-01 发布2022-12-02 实施江苏省软件行业协会江苏省软件行业协会发发 布布T/JSIA 00022022I目次前言.II1范围.12规范性引用文件.13术语和定义.14元数据.24.1元数据属性.24.2业务元数据.34.3管理元数据.55数据目录编码.85.1数据目录编码原则和方法.85.2数据目录编
2、码格式.85.3一级类编码.95.4二级类编码.95.5三级类编码.95.6四级类编码.115.7扩展机制.115.8目录编码示例.116数据目录管理.116.1数据目录管理架构.116.2数据目录管理参与角色.126.3数据目录管理环节.12附录 A(资料性)数据目录分类与编码示例.15参考文献.1T/JSIA 00022022II前言本标准按照GB/T 1.12020标准化工作导则 第1部分:标准化文件的结构和起草规则的规定起草。本标准由江苏省软件和信息技术服务标准化技术委员会、江苏省软件行业协会提出和归口。本标准由国网江苏省电力有限公司共同提出。本标准起草单位:国家电网有限公司、国网江苏
3、省电力有限公司、国网江苏省电力有限公司信通分公司、国家电网有限公司大数据中心、国网江苏省电力有限公司营销服务中心、江苏方天电力技术有限公司本标准主要起草人:徐春雷、顾斌、刘梅招、夏飞、车伟、凌绍伟、顾颖程、刘凯、罗慧、皮一晨、宋玉、程环宇、孙博、许梦晗、汤雷、赵申、刘琛、余晗、沈子奇、孔月萍、吴亦贝、邵恩泽、王子涵T/JSIA 000220221能源大数据 数据目录指南1范围本文件提供了能源大数据中心的元数据、数据目录编码、数据目录管理等方面的建议和指导。本文件适用于指导能源大数据中心开展数据目录的规划、编目、注册、管理、服务及使用工作。2规范性引用文件下列文件中的内容通过文中的规范性引用而构
4、成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T 2260-2007 中华人民共和国行政区划代码GB/T 2589-2020 综合能耗计算通则GB/T 7027-2002 信息分类和编码的基本原则与方法GB/T 7408-2005 数据元和交换格式 信息交换 日期和时间表示法GB 18030-2005 信息技术 中文编码字符集GB/T 21063.3-2007 政务信息资源目录体系 第3部分:核心元数据GB/T 21063.4-2007 政务信息资源目录体系 第4部分:政务信息资源分类GB/
5、T 22373-2021 标准文献元数据GB/T 29870-2013 能源分类与代码GB/T 38667-2020 信息技术 大数据 数据分类指南DB37/T 2975-2017 国土资源数据目录体系规范3术语和定义下列术语和定义适用于本文件。3.1能源大数据 energy big data煤炭、石油、天然气、电力、新能源、热力、水等能源行业生产、运输、消费、运营和管理过程中产生的数据,以及宏观经济运行、生态环境、气象等能源行业密切相关的数据。注:它可以具有大数据的体量、速度、多样性和易变性特征。能源数据的特征,当其在网络上传输时或暂时驻留于计算机存储器中以备读出或更新时,表征的是动态能源数
6、据。3.2能源大数据中心 energy big data center能源大数据的数据汇聚中心、价值创造中心、开放共享中心。一般具有实体或虚拟的组织管理形式和机构,包含基础设施、数据管理、产品服务、运营管理、安全防护等部分。3.3目录 catalog采用规范的元数据提取的、描述某个具体信息资源特征的一组信息T/JSIA 000220222来源:DB37/T 2975-2017,定义3.13.4分类 classification按照选定的属性(或特征)区分分类对象,将具有某种共同属性(或特征)的分类对象集合在一起的过程。来源:DB37/T 2975-2017,定义3.63.5编目 catalog
7、ue采编数据核心元数据或服务资源元数据的过程。来源:DB37/T 2975-2017,定义3.73.6元数据 metadata定义和描述其他数据的数据。来源:GB/T 22373-2021,定义3.3.3.7元数据元素 metadata element元数据的基本单元,用以描述信息资源某个特性。注:元数据元素在元数据实体中是唯一的。来源:GB/T 21063.3-2007,定义3.13.8元数据实体 metadata entity一组说明信息资源相关特性的元数据元素。注:可以保护一个或一个以上元数据实体。来源:GB/T 21063.3-2007,定义3.23.9耗能工质 energy-cons
8、umed medium在生产过程中所消耗的不作为原料使用、也不进入产品,在生产或制取时需要直接消耗能源的工作物质。来源:GB/T 2589-2020,定义3.14元数据4.1元数据属性参照GB/T 21063.3-2007的相关规定,元数据属性包括:中文名称、定义、数据类型、值域、注解、取值示例。4.1.1中文名称指元数据元素或元数据实体的中文名称,用4.2和4.3中各条的标题来表达。4.1.2定义描述元数据实体或元数据元素的基本内容,给出数据目录某个特性的概念和说明T/JSIA 0002202234.1.3数据类型说明元数据元素的数据类型,对元数据元素的有效值域及允许的有效操作进行了规定。例
9、如整型、实型、布尔型、字符串、日期等。4.1.4值域说明元数据元素可以取值的范围。4.1.5注解对元数据元素的含义的进一步解释,包括该元数据元素的约束(必选、可选)和最大出现次数。4.1.5.1约束说明元数据实体或元数据元素是否必须选取的属性。包括必选、可选:a)必选:表明该元数据实体或元数据元素必须选择;b)可选:根据实际应用可以选择也可以不选择的元数据实体或元数据元素。已经定义的可选元数据实体或元数据元素可充分说明数据目录。可选元数据实体可以包括必选元数据元素,但只当可选实体被选用时才成为必选。如果一个可选元数据实体未被使用,则该实体所包括的元素(包括必选元素)也不选用。4.1.5.2最大
10、出现次数说明元数据实体或元数据元素可以具有的最大实例数目。只出现一次的用“1”表示,多次重复出现的用“N”表示。允许不为1的固定出现次数用相应的数字表示,如“2”、“3”、“4”等。4.1.6取值示例对于每一个元数据元素,都列举一个著录时的填写内容示例。4.2业务元数据4.2.1目录名称目录名称应包括但不限于:a)定义:数据目录的标题名称;b)数据类型:字符串;c)值域:自由文本,见附录 A;d)注解:必选项;最大出现次数为 1;e)取值示例:煤炭生产企业信息。4.2.2目录编码目录编码应包括但不限于:a)定义:数据目录唯一不变的标识编码;b)数据类型:字符串;c)值域:自由文本,见附录 A;
11、d)注解:必选项;最大出现次数为 1T/JSIA 000220224e)取值示例:P320000-EP-1001-01。4.2.3目录摘要目录摘要应包括但不限于:a)定义:对数据目录内容进行概要说明的文字;b)数据类型:字符串;c)值域:自由文本;d)注解:必选项;最大出现次数为 1;e)取值示例:指煤炭生产企业的基础数据、位置数据等。4.2.4目录标签目录标签应包括但不限于:a)定义:用于标识目录内容的通用词、形式化词或短语;b)数据类型:字符串;c)值域:自由文本;d)注解:可选项;最大出现次数为 N;e)取值示例:煤炭生产。4.2.5目录安全定级目录安全定级应包括但不限于:a)定义:包括
12、 1 级、2 级、3 级、4 级、5 级;b)数据类型:字符串;c)值域:自由文本;d)注解:可选项;最大出现次数为 1;e)取值示例:1 级。4.2.6开放和共享形式开放和共享形式应包括但不限于:a)定义:包括原始数据、脱敏数据、标签数据、验真数据和群体数据等;b)数据类型:字符串;c)值域:自由文本d)注解:可选项;最大出现次数为 N;e)取值示例:脱敏数据。4.2.7开放和共享属性开放和共享属性应包括但不限于:a)定义:包括不予开放和共享、有条件开放和共享和无条件开放和共享三类;b)数据类型:字符串;c)值域:自由文本;d)注解:必选项;最大出现次数为 1;e)取值示例:不予开放和共享T
13、/JSIA 0002202254.2.8目录开放和共享技术方式目录开放和共享技术方式应包括但不限于:a)定义:包括但不限于“API 获取”“数据库封装”“文件”“网页链接”“推送”或“交换库”;b)数据类型:字符串;c)值域:自由文本;d)注解:可选项;最大出现次数为 N;e)取值示例:API 获取。4.3管理元数据4.3.1目录状态目录状态应包括但不限于:a)定义:包括注册待审核、审核通过、返回修改、上架启用、启用后申请更新、停用;b)数据类型:字符串;c)值域:自由文本;d)注解:必选项;最大出现次数为 N;e)取值示例:上架启用。4.3.2目录版本目录版本应包括但不限于:a)定义:目录的
14、版本号信息;b)数据类型:字符串;c)值域:自由文本;d)注解:必选项;最大出现次数为 1;e)取值示例:version_211101。4.3.3目录注册日期目录注册日期应包括但不限于:a)定义:目录提供方申请注册目录的日期;b)数据类型:日期型;c)值域:按 GB/T 7408-2005 执行,格式为 CCYY-MM-DD;d)注解:可选项;最大出现次数为 1;e)取值示例:2021-11-11。4.3.4目录审核日期目录审核日期应包括但不限于:a)定义:目录运营方审核注册目录的日期;b)数据类型:日期型;c)值域:按 GB/T 7408-2005 执行,格式为 CCYY-MM-DD;d)注
15、解:可选项;最大出现次数为 1;e)取值示例:2021-11-12T/JSIA 0002202264.3.5目录上架日期目录上架日期应包括但不限于:a)定义:目录运营方发布目录上架的日期;b)数据类型:日期型;c)值域:按 GB/T 7408-2005 执行,格式为 CCYY-MM-DD;d)注解:可选项;最大出现次数为 1;e)取值示例:2021-11-13。4.3.6目录更新日期目录更新日期应包括但不限于:a)定义:目录上架启用后,目录提供方再次提交的更新日期;b)数据类型:日期型;c)值域:按 GB/T 7408-2005 执行,格式为 CCYY-MM-DD;d)注解:可选项;最大出现次
16、数为 N;e)取值示例:2021-11-21。4.3.7目录停用日期目录停用日期应包括但不限于:a)定义:目录运营方停用目录的日期;b)数据类型:日期型;c)值域:按 GB/T 7408-2005 执行,格式为 CCYY-MM-DD;d)注解:可选项;最大出现次数为 N;e)取值示例:2021-11-25。4.3.8目录提供方信息目录提供方信息应包括但不限于:a)定义:包括目录提供方单位/部门、联系人、联系电话;b)数据类型:复合型;c)注解:可选项;最大出现次数为 N。4.3.8.1目录提供方单位目录提供方单位应包括但不限于:a)定义:目录提供方的单位/部门名称;b)数据类型:字符串;c)值
17、域:自由文本;d)注解:必选项;最大出现次数为 1;e)取值示例:江苏电力信息技术有限公司*部门。4.3.8.2目录提供方联系人目录提供方联系人应包括但不限于:a)定义:目录提供方的联系人T/JSIA 000220227b)数据类型:字符串;c)值域:自由文本;d)注解:可选项;最大出现次数为 1;e)取值示例:张三。4.3.8.3目录提供方联系电话目录提供方联系电话应包括但不限于:a)定义:目录提供方的联系电话;b)数据类型:字符串;c)值域:自由文本;d)注解:可选项;最大出现次数为 1;e)取值示例:137*。4.3.9目录运营方信息目录运营方信息应包括但不限于:a)定义:包括目录运营方
18、单位/部门、联系人、联系电话;b)数据类型:复合型;c)注解:可选项;最大出现次数为 N。4.3.9.1目录运营方单位目录运营方单位应包括但不限于:a)定义:目录运营方的单位/部门名称;b)数据类型:字符串;c)值域:自由文本;d)注解:必选项;最大出现次数为 1;e)取值示例:国网江苏省电力有限公司营销服务中心*部门。4.3.9.2目录运营方联系人目录运营方联系人应包括但不限于:a)定义:目录运营方的联系人;b)数据类型:字符串;c)值域:自由文本;d)注解:可选项;最大出现次数为 1;e)取值示例:张三。4.3.9.3目录运营方联系电话目录运营方联系电话应包括但不限于:a)定义:目录运营方
19、的联系电话;b)数据类型:字符串;c)值域:自由文本;d)注解:可选项;最大出现次数为 1T/JSIA 000220228e)取值示例:137*。4.3.10目录管理方信息目录管理方信息应包括但不限于:a)定义:包括目录管理方单位/部门、联系人、联系电话;b)数据类型:复合型;c)注解:可选项;最大出现次数为 N。4.3.10.1目录管理方单位目录管理方单位应包括但不限于:a)定义:目录管理方的单位/部门名称;b)数据类型:字符串;c)值域:自由文本;d)注解:必选项;最大出现次数为 1;e)取值示例:国网江苏省电力有限公司*部。4.3.10.2目录管理方联系人目录管理方联系人应包括但不限于:
20、a)定义:目录管理方的联系人;b)数据类型:字符串;c)值域:自由文本;d)注解:可选项;最大出现次数为 1;e)取值示例:张三。4.3.10.3目录管理方联系电话目录管理方联系电话应包括但不限于:a)定义:目录管理方的联系电话;b)数据类型:字符串;c)值域:自由文本;d)注解:可选项;最大出现次数为 1;e)取值示例:137*。5数据目录编码5.1数据目录编码原则和方法本文件数据目录编码的原则和方法遵循GB/T 7027-2002的规定。数据目录编码使用的英文字母和阿拉伯数字遵循GB 18030-2005的规定。5.2数据目录编码格式数据目录编码由一级类编码、二级类编码、三级类编码和四级类
21、编码四部分组成,编码之间用字符“-”隔开,其形式如图1所示T/JSIA 000220229图 1数据目录编码格式数据目录分类与编码示例见附录A。5.3一级类编码一级类编码共7位,由能源大数据中心管理级别和行政区划编码组合而成。能源大数据中心管理级别编码共1位,用大写英文字母“”至“”标识,见表1。表 1能源大数据中心管理级别编码能源大数据中心管理级别公司级省级地市级园区级编码NPCI行政区划编码采用GB/T 2260-2007中对应的6位数字码来命名。5.4二级类编码采用能源大数据供应和消费环节编码,共2位,由大写英文字母“”至“”组合而成,见表2。表 2能源大数据供应和消费环节编码能源大数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 能源大数据数据目录指南T-JSIA 00022022 能源 数据 目录 指南 JSIA 0002 2022
限制150内