欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    数据中台解决方案.pptx

    • 资源ID:72979578       资源大小:698.54KB        全文页数:10页
    • 资源格式: PPTX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    数据中台解决方案.pptx

    数据中台的概念由阿里巴巴首次提出,它是一个承接技术,引领业务,构建规范定义的、全域可连接萃取的、智慧的数据处理平台,建设目标是为了高效满足前台数据分析和应用的需求。数据中台是涵盖了数据资产、数据治理、数据模型、垂直数据中心、全域数据中心、萃取数据中心、数据服务等多个层次的体系化建设方法。数据中台概念数据服务化数据中台是培育业务创新的土壤,是利用数据促进业务创新的保障数据标准化“书同文,车同轨”,避免了“重复数据抽取和维护带来的成本浪费”数据智能化通过大量智慧算法训练数据细胞,形成数据大脑,产生智慧的力量,预先洞察未来数据资产化数据不断的在补充,数据模型不断的进化,只有在滋养中才能从最初的字段单一到逐渐成长为企业最为宝贵的模型资产数据中台的内核包括两方面:一个是应用数据的技术能力,另一个是数据资产的管理。数据中台概念第1页/共10页全流程一体化从数据采集到数据服务全链路通向上多样化赋能场景通用产品+行业产品+专享产品向下屏蔽多计算引擎公共云+专有云+混合云双向联动业务与产品&技术协同互助One DataOneIDOneService数据标准化数据规范定义从业务源头标准化技术内核工具化规范定义、建模研发、调度运维、元数据驱动智能化半自动化智能化规划计算和存储技术驱动数据连接基于超强ID识别技术连接数据技术内核工具化超强ID识别、高效标签生产、业务驱动价值化孤岛高质量高价值主题式数据服务主题逻辑表屏蔽复杂物理表统一但多样化数据服务一般查询+OLAP分析+在线服务跨源数据服务屏蔽多种异构数据源数据中台建设方法第2页/共10页高内聚和低耦合主要从数据业务特性和访问特性两个角度来考虑:将业务相近或者相关的数据、粒度相同数据设计为一个逻辑或者物理模型;将高概率同时访问的数据放一起,将低概率同时访问的数据分开存储。数据可回滚处理逻辑不变,在不同时间多次运行数据结果确定不变。核心模型与扩展模型分离建立核心模型与扩展模型体系,核心模型包括的字段支持常用核心的业务,扩展模型包括的字段支持个性化或是少量的应用的需要,不能让扩展字段过度侵入核心模型,破坏了核心模型的架构简洁性与可维护性。公共处理逻辑下沉及单一越是底层公用的处理逻辑更应该在数据调度依赖的底层进行封装与实现,不要让公共的处理逻辑暴露给应用层实现,不要让公共逻辑在多处同时存在。成本与性能平衡适当的数据冗余换取查询和刷新性能,不宜过度冗余与数据复制。开发过程规则表命名需清晰、一致,表名需易于消费者理解和使用,相同的字段含义在不同表中字段命名必须相同,必须使用规范定义表中的名称。数据中台设计原则第3页/共10页规范定义是指以维度建模作为理论基础,构建总线矩阵,划分和定义数据域、业务过程、维度、度量/原子指标、修饰类型、修饰词、时间周期、衍生指标等。一般指标组成体系可以划分为:原子指标、衍生指标、修饰类型、修饰词、时间周期。原子指标时间周期修饰词衍生指标修饰类型数据规范定义设计第4页/共10页数据地图管理,是对整个数据中台内的数据进行统一查询、管理的“地图”,数据地图主要面向数据开发者,汇聚用户所有数据信息,通过元数据信息收集、数据血缘探查、数据权限申请授权等手段,帮助数据中心专有云完成数据信息的收集和管理,解决有哪些数据可用、到哪里可以找到数据的难题,并且提升数据资源的利用率。基本管理自动探查平台内存在的表信息,记录表名、字段、分区、存储等信息,同时支持数据预览。血缘关系管理根据任务、脚本等因素自动建立血缘关系,实现数据链路的可查询、可跟踪。生命周期管理覆盖全部数据的自动化生命周期管理,提高存储系统利用效率。权限管理表级、字段级的权限授权、审批等流程,从更高层面保障数据安全。支持多级表类目管理,实现最快时间找到最需要的数据。类目体系管理对同步任务产生的脏数据统一查看与管理。脏数据管理对新建、删除、变更表结构等操作自动记录,实现数据操作踪迹可查询。操作记录管理数据资产管理第5页/共10页数据模型管理,主要是为解决架构设计和数据开发的不一致性,是为了约束平台使用者的表名、字段名的规范性,架构师从工具层合理的进行模型分层和统一开发规范,包括2部分,一个是规则配置,另一个是对表名、字段名的定期校验。规范化检测中心模型设计基础配置表级l模型层级(ODS/DWD/DWS)l主题域(销售、库存、用户)l刷新频率(天、周、日)l增量定义(全量、增量)l模型生成规则字段级l原子指标l衍生指标l规则生成层级主题域刷新频率自定义+示例:ODS_sales_D_customAnalyl 模型检测l 模型不规范原因分析l 字段检测l 字段不规范原因分析数据资产管理第6页/共10页在实际生产中,数据计算任务没有告警,但不代表数据就是正确的,比如源数据异常、代码逻辑修改等原因都会造成结果数据错误。数据质量就是保障数据正确性的工具,主要包括这么几部分:一是支持准确性校验规则,二是支持双表校验,三是输出校验报告。支持的数据源l目前已支持6种数据源,符合绝大多数场景下的质量校验校验规则l基于数据生产的实战经验,内置20余种校验规则l支持表级、字段级2类规则质量报告l支持字段级、表级校验报告,具备历史数据统计功能,辅助定位数据质量的问题根源数据资产管理第7页/共10页以云计算,大数据,人工智能技术为基础平台,搭建全域、实时、智能的数据中台。网站统计移动统计客流统计DMP价格监测品牌卫士经营分析管理决策市场洞察广告营销反黄牛接待大屏媒体大屏接待大屏行业定制数据应用数据中台数据资产数据研发数据地图数据血缘资产分析资产管理资产运营数仓规划指标规范模型构建数据同步数据开发日志分析用户画像推荐引擎营销引擎智能风控舆情分析分析报表数据大屏机器学习人脸识别图像识别全域数据中心萃取数据中心统一ID数据类目体系数据标签体系数据集成数据智能中台实时计算离线计算机器学习数据管理任务调度任务运维外部数据数据源爬虫数据埋点数据日志文件业务数据库ERMCRM数据中台架构第8页/共10页谢谢大家!第9页/共10页感谢您的观看!第10页/共10页

    注意事项

    本文(数据中台解决方案.pptx)为本站会员(莉***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开