(大数据资料)H3C DataEngine DI数据集成介绍.pptx
《(大数据资料)H3C DataEngine DI数据集成介绍.pptx》由会员分享,可在线阅读,更多相关《(大数据资料)H3C DataEngine DI数据集成介绍.pptx(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、H3C DataEngine DI 数据集成 介绍大纲H3C数据集成应用场景010203数据集成概述H3C数据集成介绍数据集成的定义数据集成就是把不同来源、格式、特性的数据在逻辑上和物理上有机地集中,从而为企业应用系统,数据仓库提供全面的数据共享。OracleMySQLDB2SybaseXML文件TXT共享库Excel主题库主题库主题库源数据目前市场面临的数据挑战 不规范数据复杂多数据源多系统的应用业务迅猛发展自主开发繁琐工具参差不齐6我的价值70%体现在了能够拿到数据,只有30%体现在数据分析上对数据集成软件提出的要求分散的数据数据消费者关键支持因素图形化、脚本化的数据处理模型实现异构数据源
2、的数据处理数据集成平台易学易用二次扩展开发能力 快速构建数据处理模型业务变化与调整导致数据结构不断变化传统的手工编码或存储过程已经无法满足快速变化的需求敏捷响应数据结构优化调整对海量数据处理能力的需求不断增加每天要执行上千个job,每个job要处理上千万条数据如何应对未知的数据异常企业级性能稳定性模型监控管理模型调度管理自定义作业管理作业自动化处理系统管理数据处理模型的管控OracleMPPERP业务分析人员开发人员大纲H3C数据集成应用场景010203数据集成概述H3C数据集成介绍应用数据库大数据平台文本文件XML影音图像CSV日志数据数据源数据集成平台目标数据数据仓库大数据平台资源目录应用
3、分布式抽取海量数据源适配分布式加载丰富的数据处理组件WEB设计器 H3C数据集成流程示意轻松整合海量异构数据、节约你项目的交付时间NodeExecutorExecutorExecutorNode ExecutorExecutorExecutorNodeExecutorExecutorExecutorManagerSchedulerRepositoryMonitorServerWeb DesignerJob submissionHeart beat模块说明DesignerWeb化的设计器Executor任务的执行者,负责维护任务运行实例的整个生命周期。Scheduler负责控制单一任务或任务链的
4、调度Monitor监控模块分为两部分,监控管理部分嵌入Manager中,监控数据采集部分嵌入Executor。ManagerWeb化的集中管理平台,包含但不限于任务管理、任务链管理、资源库管理、监控管理、警告报警、历史回顾、数据流量统计、系统管理等。Repository资源仓库,存储ETL元数据信息。数据集成引擎技术架构数据集成引擎部署结构 DI可视化设计界面(Designer)可视化设计界面(Designer)提供了数据模型设计、任务调度设计、运行监控管理等一体化的集成开发环境 DI功能组件库组件库是组件库是 DI DI产品的功能组件仓库,产品预制了几十种数据抽取、转换、装载产品的功能组件仓
5、库,产品预制了几十种数据抽取、转换、装载的常用组件以及任务调度组件,提供了企业数据整合中的常用功能的常用组件以及任务调度组件,提供了企业数据整合中的常用功能业务模型组件集:对数据本身进行操作的组件集合任务调度组件集:对设计好的数据流程进行管理调度的组件集数据抽取组件数据转换组件数据装载组件登录首页修改密码和注销执行机管理数据库连接管理任务管理设计面板作业自动化:生成DI作业任务链管理监控报表历史回顾H3C 数据集成特性 DI功能特性云化ETL云化分布式ETL引擎,充分发挥集群资源,实现负载均衡,大幅提高ETL效率,尤其适用于大数据平台的并行处理,且性能随着数据平台的扩展而提升 DI功能特性任务
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据资料H3C DataEngine DI数据集成介绍 数据资料 H3C DI 数据 集成 介绍
限制150内