2023发电企业工业互联网平台数据入湖标准.docx
《2023发电企业工业互联网平台数据入湖标准.docx》由会员分享,可在线阅读,更多相关《2023发电企业工业互联网平台数据入湖标准.docx(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、工业互联网平台数据入湖标准发电企业工业互联网平台数据入湖标准目 录1. 概述41.1. 编写目的41.2. 适用范围41.3. 数据湖定义52. 数据入湖标准52.1. 明确数据Owner52.2. 发布数据标准62.3. 认证数据源82.4. 定义数据密级92.5. 数据质量评估102.6. 元数据注册113. 数据入湖方式111. 概述根据XX发电公司企业信息化现状和数字化前期建设要求,规划建设XX发电工业互联网平台,增强业务协同和集中管控能力,实现XX发电各信息化系统数据的快速接入,构建工业互联网数据湖。打破目前各业务系统之间的数据壁垒,实现数据资源横向集成、纵向贯通,实现XX发电企业级
2、数据共享,解决数据与业务紧密耦合、数据分析应用重复建设、需要出台数据入湖的标准,指导企业的通过统一的标准开展业务系统数据入湖工作。1.1. 编写目的本文档目的是对工业互联网平台项目建设过程中的数据入湖标准进行详细的介绍,明确数据入湖标准整体思路和流程,对数据进行统一的管理及维护,编写此文档,指导读者开展数据入湖工作。1.2. 适用范围适用于项目组成员、平台设计、开发、维护技术人员及平台管理员。1.3. 数据湖定义数据湖是一个以原始格式(通常是对象块或文件)存储数据的系统或存储库。数据湖通常是所有企业数据的单一存储,用于报告、可视化、高级分析和机器学习等任务。数据湖可以包括来自关系数据库的结构化
3、数据(行和列)、半结构化数据(CSV、日志、XML、JSON)、非结构化数据(电子邮件、文档、pdf)和二进制数据(图像、音频、视频)。数据作为一项重要资产,已经成为企业的共识,为了更好地存储数据、挖掘数据,使用数据湖,企业在快速实现企业中各类的数据集成的同时,也能轻松获取企业外部数据,打通产业链上下游数据,实现生态化数据整合,实现全貌数据分析。同时,数据存储量大,支持批量历史数据和实时流数据的处理,能够实现数据的快速查询和高级分析。2. 数据入湖标准数据入湖要遵从6项入湖标准,基于6项标准保证入湖的质量,同时面向不同的消费场景提供两种入湖方式,满足数据使用的要求。数据入湖是数据消费的基础,需
4、要严格满足入湖的6项标准,包括明确数据Owner、发布数据标准、定义数据密级、明确数据源、数据质量评估、元数据注册。通过这6项标准保证入湖的数据都有明确的业务责任人,各项数据都可理解,同时都能在相应的信息安全保障下进行消费。2.1. 明确数据Owner数据Owner由数据产生对应的流程Owner担任,是所辖数据端到端管理的责任人,负责对入湖的数据定义数据标准和密级,承接数据消费中的数据质量问题,并制定数据管理工作路标,持续提升数据质量。如下表梳理:序号系统责任部门责任人1核心业务一体化系统-财务财务张三2全面预算系统财务李四3资金调度中心财务张三4普联报表系统财务李四5财务共享中心财务李四2.
5、2. 发布数据标准入湖数据要有相应的业务数据标准。业务数据标准描述公司层面需共同遵守的“属性层”数据的含义和业务规则,是对某个数据的共同理解。数据标准的信息如下表所示。根据上面要求梳理各个业务系统提供的数据较准要求的内容,提供业务数据资产分类(即数据表属于哪个主题域),数据表字段类型、字段中文名、表间关系。举例如下,下面是财务域二级主题划分,根据业务系统提供的数据信息来分类到具体主题域下,并开展与对应逻辑模型和物理模型的数据入湖对接工作。同时提供详细的业务系统的表台账,如下表所示:2.3. 认证数据源通过认证数据源,能够确保数据从正确的数据源头入湖。认证数据源应遵循公司数据源管理的要求。认证过
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 发电 企业 工业 互联网 平台 数据 标准
限制150内