数据中台技术架构设计方案.docx
《数据中台技术架构设计方案.docx》由会员分享,可在线阅读,更多相关《数据中台技术架构设计方案.docx(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据中台技术架构设计方案一、数据中台总体架构图前面我们通过理论层面对数据中台有了一定的了解,下面我们通过架构层面来详细看一下数 据中台的设计。上层应用数据服务体系服务创建服务创建API网关服务授权哽管理数据资产管理数据资产目录元数据数据资产目录元数据数据质量数据血缘数据生命周期数据运8体系数据安全省理原始数据层明细数据层数据体系(数据仓库)期层数据应用层数据中台数据汇聚可视化配置.数据开发离线开发实时开发JI H法开发 智能调度智能运维“监控告警MySQLOracleHadoopSparkFlinkKafka数据源内部数据外部数据数据中台是位于底层存储计算平台与上层的数据应用之间的一整套体系。
2、数据中台屏蔽掉底层存储平台的计算技术复杂性,降低对技术人才的需求,让数据的使用成 本更低。通过数据中台的数据汇聚、数据开发模块建立企业数据资产。通过数据体系对数据进行分层存储通过资产管理、数据服务,把数据资产变为数据服务能力,服务于企业业务。数据安全管理、数据运营体系,保障数据中台可以长期健康、持续运转。1、数据汇聚数据汇聚是数据中台数据接入的入口,数据中台本身不产生数据,所有的数据来自于业务系 统,数据库、口志、文件等,这些数据分散在不同的网络环境和存储平台中,难以利用,很 难产生业务价值,所以需要统一汇聚。2、数据开发数据开发是一整套数据加工以及处理的工具,因为通过数据汇聚模块汇聚到中台的
3、数据没有 经过处理,基本是按照数据的原始状态堆砌在起的,这样业务是很难直接使用的。所以需 要通过数据开发模块实现对数据的加工处理,形成有价值的数据,提供给业务部门使用。3、数据体系通过数据汇聚、数据开发,中台就具备了构建数仓平台的基本能力,这一块其实就是将采集 过来的各种数据按照数仓的标准进行建设。4、数据资产管理通过数仓建立起来的数据资产比较偏向于技术,业务人员比较难理解,资产管理是以业务人 员更好理解的方式,把数据资产展现给企业的业务人员。5、数据服务体系数据服务体系就是把数据变为一种服务能力,通过数据服务让数据参与到业务,激活整个数 据中台,数据服务体系是数据中台存在的价值所在。6、数据
4、运营体系是数据中台得以健康、持续运转的基础7、数据安全管理是为了保证数据中台中的数据安全。这是一个典型的数据中台总体架构设计。二、数据中台四字箴言如果大家之前没有工作过的话,可能对数据中台还是不好理解,所以在这我将数据中台的功能总结为四个字:采、存、通、用下面我们来详细分析一下这四字箴言1、采采:表示采集的意思,就是采集企业中的所有数据。随着互联网、移动互联网、物联网等技术的兴起,企业的业务形态开始多元化,数据的产生 形式也是多样化的,对应的就需要有多种采集形式。埋点采集、硬件采集、爬虫采集、数据库采集、日志采集。埋点采集:一般是采集用户行为信息、,例如用户在平台上的浏览、点击、停留等行为。硬
5、件采集:指的是物联网数据采集,例如通过无人机传感器来采集空气质量指标。爬虫采集:指的是采集互联网上的公开数据,例如:电商平台竞品价格采集。数据库采集:一般是采集企业内的业务数据,例如:用户交易数据、用户个人信息数据等。日志采集:一般是采集软件运行时产牛的日志。这些是常见的采集形式。从数据组织形式可以分为:结构化数据、半结构化数据、非结构化数据。结构化数据:数据规则、完整、能够通过二维逻辑来表现的数据,严格遵守数据格式与长度 规范,常见的有数据库中的数据、excel中的数据。半结构化数据:数据规则、完整,同样严格遵守数据格式与长度规范,但无法通过二维关系 来表现,常见的有JSOr XML等格式的
6、数据。非结构化数据:数据结构不规则或不完整,不方便用二维逻辑表来表现,需要经过复杂的逻 辑处理才能提取其中的信息内容,常见的有word文档、图片、视频、音频等数据。从数据的时效性上来划分,可以分为:离线数据、实时数据。离线数据:主要用于大批最数据的周期性迁移,对时效性要求不高,一般采用分布式批最数 据同步的形式,通过连接读取数据,读取数据过程中可以有全量、增量的方式,经过统一处 理后写入到目标存储。实时数据:主要面向低延时的数据应用场景,一般通过实时监控的方式实现,例如通过读取 数据库的binlog Fl志来实现数据库的实时数据采集。前面我们针对数据的采集形式、数据的组织形式、数据的时效性进行
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 技术 架构 设计方案
限制150内