KETTLE使用说明中文版.ppt





《KETTLE使用说明中文版.ppt》由会员分享,可在线阅读,更多相关《KETTLE使用说明中文版.ppt(34页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、KETTLE1.1 什么是kettle Kettle 是”kettle E.T.T.L Envirnonment”首字母缩写,这意味着设计实现ETL需要:抽取,转换,装入和加载数据。Spoon 是一个图形用户界面,它允 许运行转换或者任务,其中转换是用pan工具来运行,任务是用Kitchen来运行。Pan 是一个数据转换引擎,它可以执行很多功能。例如从不同的数据源读取、操作和写入数据。Kitchen 是一个可以运行利用xml或数据资源库描述的任务,通常任务是在规定的时间间隔内用批处理的模式自动运行。1.2 安装kettle要运行Kettle,必须按安装java 环境1.4或以上版本,kettl
2、e下载可以到:http:/kettle.pentaho.org 取得最新版本。(pdi-ce-4.0.1-stable.zip)1.3 运行spoon 下面是不同平台上运行spoon 所支持的脚本:spoon.bat windows 平台运行Spoon.Spoon.sh linux 平台运行Spoon.1.4 资源库 一个Kettle 资源库可以包含那些转换信息,这意味着为了从数据资源中加载一个转换,你必须连接相应的资源库。1.5 资源库自动登录 可以设置以下环境变量,来让 Spoon 自动登录资源库。环境变量:KETTLE_REPOSITORY,KETTLE_USER,KETTLE_PASS
3、WORD 1.6 定义1.6.1 转换 l 1.Value:Values 是行的一部分,且包含以下类型的数据是行的一部分,且包含以下类型的数据:Strings,floating point Numbers、unlimited precision BigNumbers、Integers、Dates 或者或者 Boolean.l 2.Row:一行包含一行包含0个或者个个或者个Valuesl 3.Output Stream:一个一个Output Stream 是离开一个步骤时的行的堆栈。是离开一个步骤时的行的堆栈。l 4.Input Stream:一个一个Input Stream 是进入一个步骤时的
4、行的堆栈。是进入一个步骤时的行的堆栈。l 5.Hop:一个一个Hop 代表两个步骤之间的一个或者多个数据流。一个代表两个步骤之间的一个或者多个数据流。一个Hop总是代总是代 表着一个步骤的输出流和一个步骤的输入流。表着一个步骤的输出流和一个步骤的输入流。l 6.Note:一个一个Note 是一个转换附加的文本注释信息。是一个转换附加的文本注释信息。1.6.2 任务 l 1.Job Entry:一个一个Job Entry 是一个任务的一部分,它执行某些内容。是一个任务的一部分,它执行某些内容。l 2.Hop:一个一个Hop 代表两个步骤之间的一个或者多个数据流。一个代表两个步骤之间的一个或者多个
5、数据流。一个Hop总是代总是代 表着两个表着两个Job Entry 之间的连接,并且能够被原始的之间的连接,并且能够被原始的Job Entry设置,无设置,无条件的执行下一个条件的执行下一个JobEntry,直到执行成功或者失败。直到执行成功或者失败。l 3.Note:一个一个Note 是一个任务附加的文本注释信息。是一个任务附加的文本注释信息。1.7选项你可以改变很多选项来增强图形用户界面的个性化。例如设置窗体的字体和颜色。此选项在 Tools/选项 中设置。1.8搜索元数据v 通过 编辑/搜索元数据(ctr+f)来使用这个特性。v这个选项将在可用的字段、连接器、注释以及所有加载的任务和转换
6、中搜索,并展示搜索的结果。2 新建一个转换或任务v可以通过工具栏上的文件/新建/来建立一个转换或任务,也可以直接在主对象页签栏双击转换,新建一个转换。选择好需要创建的文件类型后,将会根据你的选择,创建一个图形界面。v转换 作业3 数据库连接v一个连接描述了kettle连接数据库的方法,左边的菜单展示了所有可用的连接。3.1 选项l 1.Connection name:定义转换或任务访问的连接的唯一名称,可自行设置,但不能为空。2.Connection Type:连接的数据类型 3.Access:可以是Native(JDBC),odbc,oci,jndi.一般选择JDBC 4.HostName:
7、指定数据库部署的主机或者服务器的名称,也可以指定IP地址。5.DataBase Name:指定连接的数据库的名称,如果是ODBC方式就指定DSN名称。6.port Number:设定数据库监听的TCP/IP端口号 7.user Name/password:指定连接数据库的用户名和密码 3.2 SQL 编辑器(SQL Editor)l1.描述 Spoon 提供简单SQL 编辑器,可以实现创建表,删除索引或者修改字段。大多数的DDL,例如:create/alter table,create index,create sequence 命令都可以通过SQL编辑器窗口运行。(新建转换,输出是表输出时,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- KETTLE 使用说明 中文版

限制150内