数据中台解决方案.pptx
《数据中台解决方案.pptx》由会员分享,可在线阅读,更多相关《数据中台解决方案.pptx(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据中台的概念由阿里巴巴首次提出,它是一个承接技术,引领业务,构建规范定义的、全域可连接萃取的、智慧的数据处理平台,建设目标是为了高效满足前台数据分析和应用的需求。数据中台是涵盖了数据资产、数据治理、数据模型、垂直数据中心、全域数据中心、萃取数据中心、数据服务等多个层次的体系化建设方法。数据中台概念数据服务化数据中台是培育业务创新的土壤,是利用数据促进业务创新的保障数据标准化“书同文,车同轨”,避免了“重复数据抽取和维护带来的成本浪费”数据智能化通过大量智慧算法训练数据细胞,形成数据大脑,产生智慧的力量,预先洞察未来数据资产化数据不断的在补充,数据模型不断的进化,只有在滋养中才能从最初的字段单
2、一到逐渐成长为企业最为宝贵的模型资产数据中台的内核包括两方面:一个是应用数据的技术能力,另一个是数据资产的管理。数据中台概念第1页/共10页全流程一体化从数据采集到数据服务全链路通向上多样化赋能场景通用产品+行业产品+专享产品向下屏蔽多计算引擎公共云+专有云+混合云双向联动业务与产品&技术协同互助One DataOneIDOneService数据标准化数据规范定义从业务源头标准化技术内核工具化规范定义、建模研发、调度运维、元数据驱动智能化半自动化智能化规划计算和存储技术驱动数据连接基于超强ID识别技术连接数据技术内核工具化超强ID识别、高效标签生产、业务驱动价值化孤岛高质量高价值主题式数据服务
3、主题逻辑表屏蔽复杂物理表统一但多样化数据服务一般查询+OLAP分析+在线服务跨源数据服务屏蔽多种异构数据源数据中台建设方法第2页/共10页高内聚和低耦合主要从数据业务特性和访问特性两个角度来考虑:将业务相近或者相关的数据、粒度相同数据设计为一个逻辑或者物理模型;将高概率同时访问的数据放一起,将低概率同时访问的数据分开存储。数据可回滚处理逻辑不变,在不同时间多次运行数据结果确定不变。核心模型与扩展模型分离建立核心模型与扩展模型体系,核心模型包括的字段支持常用核心的业务,扩展模型包括的字段支持个性化或是少量的应用的需要,不能让扩展字段过度侵入核心模型,破坏了核心模型的架构简洁性与可维护性。公共处理
4、逻辑下沉及单一越是底层公用的处理逻辑更应该在数据调度依赖的底层进行封装与实现,不要让公共的处理逻辑暴露给应用层实现,不要让公共逻辑在多处同时存在。成本与性能平衡适当的数据冗余换取查询和刷新性能,不宜过度冗余与数据复制。开发过程规则表命名需清晰、一致,表名需易于消费者理解和使用,相同的字段含义在不同表中字段命名必须相同,必须使用规范定义表中的名称。数据中台设计原则第3页/共10页规范定义是指以维度建模作为理论基础,构建总线矩阵,划分和定义数据域、业务过程、维度、度量/原子指标、修饰类型、修饰词、时间周期、衍生指标等。一般指标组成体系可以划分为:原子指标、衍生指标、修饰类型、修饰词、时间周期。原子
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 解决方案
限制150内