KETTLE基础培训(共47张).pptx
《KETTLE基础培训(共47张).pptx》由会员分享,可在线阅读,更多相关《KETTLE基础培训(共47张).pptx(47页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Kettle 基础基础培训培训 (一)目录一、一、 Kettle 介绍介绍二、二、 Kettle的的要求环境(要求环境(JDK版本)、安装、基本操作。版本)、安装、基本操作。三、三、 Kettle的的组件的类型基本说明(作业与转换)组件的类型基本说明(作业与转换)四、四、基于表对表的基于表对表的同步同步五、基于文件到表的同步五、基于文件到表的同步六、六、基于表到文件的同步基于表到文件的同步七、七、JAVASCRIPT的基本应用的基本应用八、八、文件文件FTP下载、上传。下载、上传。九、九、作业调用作业、转换。作业调用作业、转换。十、十、启动脚本说明启动脚本说明。十一、十一、JAVA调用作业、转
2、换调用作业、转换十二、使用原则十二、使用原则简介ETLETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程)作为BI/DW(Business Intelligence)的核心和灵魂,能够按照统一的规则集成并提高数据的价值,是负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。如果说数据仓库的模型设计是一座大厦的设计蓝图,数据是砖瓦的话,那么ETL就是建设大厦的过程。在整个项目中最难部分是用户需求分析和模型设计,而ETL规则设计和实施则是工作量最大的,约占整个项目的60%80%,这是国内外从众多实践中得到的普遍共识。ETL是数据抽取(Ext
3、ract)、清洗(Cleaning)、转换(Transform)、装载(Load)的过程。是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。简介Kettle Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。 Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。 Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而
4、不是你想怎么做。 Kettle中有两种脚本文件,transformation和job,transformation工作流的控制。完成针对数据的基础转换,job则完成整个KETTLE的要求环境(的要求环境(JDK版本)、安装、基本操作版本)、安装、基本操作 KETTLE要求先安装JDK1.5版本或以上 无需安装下载后直接运行spoon.bat即可5KETTLE的组件的类型基本说明(作业与转换) Kettle中有两种脚本文件,transformation(转换,后缀为.ktr)和job(作业, 后缀为.kjb),transformation完成针对数据的基础转换,好比工厂里的生产流水线,每个组件相
5、当于一个员工;job则完成整个工作流的控制,好比工厂里的管理。 如果用记事本打开文件可发现转换和作业都是xml类型文件。6KETTLE的组件的类型基本说明(作业与转换)7 作业:分串行执行和并行执行,串行执行是先执行完其中一条线再执行另一条线,并行是两条线同时执行,同一条线上的两个步聚会先执行前面的再执行后面的,每个步骤执行结果分两种:true(成功)/false(失败),根据返回结果可以控制流程走向。KETTLE的组件的类型基本说明(作业与转换)8 作业流程图说明KETTLE的组件的类型基本说明(作业与转换)9 转换:一传递分复制和分发两种模式。开始所有步骤同时运行,记录会从最前端的步骤向后
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- KETTLE 基础 培训 47
限制150内