Waha!Transformer操作手册doc.doc
《Waha!Transformer操作手册doc.doc》由会员分享,可在线阅读,更多相关《Waha!Transformer操作手册doc.doc(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Waha!Transoformer操作手册备实必(上海)软件科技有限公司前 言Waha!Transformer(本文及以后简称Waha)软件是一款专业的数据挖掘、清洗的软件,有着处理速度快、易操作、数据连接源种类多(如Excel报表、数据库表等等)等特点,还能进行数据与文档的清洗、挖掘的批处理,十分强大,本手册是作解释说明并且指导用户操作的所使用。同时也值得说明的是,本文档所指导与解释的操作正是Waha中最基础最底层的操作,而现实中的大型项目正是建立在这样的一个一个小操作之上,因此,在用户的实际操作过程中,根据用户所创建的使用项目的不同,项目创建过程中的实际情况和操作可能会发生改变,当出现了这
2、样的情况且用户无法自行解决时,我们建议用户联系我们的技术人员来获取帮助。另外,如有软件版本的更新,请以最新版本的操作手册为主。联系方式:备实必(上海)软件科技有限公司地址:上海市浦东新区商城路738号胜康廖氏大厦2107室电话:+86 021- 5058-8268 电子邮箱: supportbsp-网站主页: http:/www.bsp-2016年8月 编法律责任声明本手册仅仅针对Waha软件5.0的版本的操作使用,对于5.0以下的版本有着一定的适用性,但并不推荐5.0以下的版本的用户使用。Waha的用户(无论正在使用哪个版本的Waha)如果遇到Waha的技术问题请联系我们。本手册以“我们”这
3、一人称代词代指备实必(上海)软件科技有限公司,以“用户”一词代指所有有着Waha的合法使用权的操作人员或公司。Waha!Transformer软件的一切权益以及本手册的最终解释权都归备实必(上海)软件科技有限公司所有。目 录软件概述1第一章 连接源信息41.连接源信息42.如何创建连接源83.本章小结21第二章 视表模板221.视表模板222.按内容把视表归类并命名223.创建视表模板224.本章小结27第三章 过滤器介绍291.过滤器分类292.过滤器介绍32第四章 作业流程制作471. 新建作业472.作业工作区域483.作业属性及和外部程序接口的设定49第五章 函数581.函数概述582
4、.函数的创建58第六章 总体功能611.作业流程制作过程612连接器种类613.过滤器种类61第七章 Waha运行环境621. Waha中文Windows版所支持的操作系统平台。622.Waha5.0中文Windows版所支持的数据库623.Waha运行的硬件环境62软件概述在Waha中,一个完整的工程应该至少包含四个项目,分别是“作业”,“视表模板”,“连接源”以及“视表过滤器”(又简称为“过滤器”),前三个项目在打开Waha软件的主界面的左侧侧边窗口中能够看到。而“视表过滤器”则是在每一个作业中建立的,一个作业可以包含多个不同种的过滤器,根据不同的实际需要可以选择不同的种类的过滤器,关于这
5、四个项目的解释与功能都能在下文中找到。当用户完成安装的时候(安装操作与过程请参考Waha!Transformer安装手册),Waha会在用户的“开始”栏中创建快捷选项,如果用户已经知道安装过程中所设置的用户名与密码,则可以直接登录,在快捷选项中找到文件夹“Waha!Transformer V5.0”,然后选择该文件夹下的“Designer”选项,即可打开Waha软件,如图0-1所示。图0-1.在开始菜单中打开Waha点击该选项之后之后,用户就可以打开Waha软件。每次用户打开Waha应该是一个登录界面,如图0-2所示。图0-2.Waha的登录界面此时,使用默认账号即可以登录,密码是严格区分大小
6、写的,请注意在设置账号的时候牢记密码,本文编者为了简化方便,设置用户名为DBA,密码为dba。账号登录成功之后会进入到Waha的主画面,主画面应该是如图0-3所示的,此时能够看到在侧边框中有“作业”、“视表模板”以及“连接源信息”三个文件夹,这三个文件夹都是建立在作业库中的,如果不对作业库进行配置,则使用的是默认作业库,该默认作业库的路径为%waha_home%RepositoryDefaultRepository(其中%waha_home%为Waha的安装路径)。图0-3.waha主界面从这个主画面开始,在下文中,我们会指导用户进行Waha的基础操作并会对这些基础操作进行举例示范。第一章 连
7、接源信息1.连接源信息1.1连接源定义连接源是开始一个Waha项目或工程所必须的,连接源是数据库与视表之间数据通信的桥梁纽带,连接源的作用就是把数据从数据库或文本文件中取出放入视表中或把视表中的数据写入数据库或文本文件中。1.2连接源种类根据所连接的数据的种类的不同,我们将连接源大体分为数据库连接源、文本连接源、虚拟连接源三类,连接源一般建立在“连接源信息”的文件夹中,在Waha主画面左侧的侧边框能够看到,如图1-1所示。图1-1.主界面中的连接源文件夹虽然我们还针对不同功能甚至所用数据库软件的不同将连接源进行进一步细分,而在大体上,这些连接源被分为三类,数据库连接源、文本连接源以及虚拟连接源
8、,前两者在新创建连接源的窗口中能够找到,所有在Waha中的数据库和文本的连接源的种类如图1-2所示。图1-2.Waha中所有的连接源一览注:虚拟连接源在直接对视表模板进行连接时可以创建,不同于数据库连接源和文本连接源能够直接创建。对于创建新的虚拟连接源,这需要在已创建的视表模板上进行,创建新的虚拟连接源的窗口,如图1-3所示。图1-3.虚拟连接源一览1.3连接源说明SQLDB连接器:用于连接各种关系型数据库,把数据从数据库中读取出来。对数据库中的数据只读,不会坏数据库中的数据。更新SQLDB连接器:用于连接各种关系型数据库,把过滤中处理过的数据更新到数据库中。对数据库具有读和写的功能。固定长文
9、本文件连接器:用于连接文本数据文件,根据视表中设定的长度读取数据超过设定长度的部分,将被截掉。具有读写文件功能。示例如下表:固定长文本连接器连接文件数据时,根据设置的列长度取值。超过长度部分将被截断FAChar10FBChar5源文件长AABBCCAABBCC输出结果AABBCCAABBC可变长文本文件连接器:用于连接文本数据文件,根据设定的分隔符读取数据字段。具有读写文件功能。如下表所示:用可变长文本连接器连接文本文件时,按分隔符去字符串长度。分隔符为“,”源文件输出结果AABBCCDDEEFF,GG,HHIIJJKKLLAABBCCDDEEFFGGHHIIJJKKL二进制文件连接器:连接二
10、进制文件,并具有对其读写的功能。用于对以二进制形式存在的文件进行操作。此连接器主要用于IBM大型机、小型机或PC机上的二进制文件传输。Essbase维度构建连接器:用于读取多维数据库中的数据,常见于BPM(企业绩效管理解决方案)中所使用的多维数据库。Essbase维度装入连接器:用于将数据写入到目标多维数据库中,常见于BPM(企业绩效管理解决方案)中所使用的多维数据库。输入用XML连接器:用于根据节点读取XML文件里面的数据。输出用XML连接器:用于根据节点将数据写入到XML文件里面。Excel读取:用于读取excel表格里面的数据。Excel工作表名读取:用于读取excel的sheet名称。
11、Excel指定单元格读取:用于读取某一个或者某几个指定单元格的值。Excel写入:用于将数据写入到目标excel表格中。Excel指定单元格写入:用于将数据写入到目标表中某个或者是某几个指定的单元格当中。DB load for ORACLE:只用于连接ORACLE数据库,适用于处理大数据量的数据迁移,数据更新等。把数据批量更新到Oracle数据库中,属Oracle数据库专用。DB load for Sybase IQ: 只用于连接IQ数据库,适用于处理大数据量的数据迁移,数据更新等。把数据批量更新到Sybase IQ数据库中,属IQ数据库专用。数据通道连接器:此虚拟连接器用于直接在内存中处理数
12、据,其所连接的过滤器同时并行处理数据。临时文件连接器:此虚拟连接器用于直接在内存中处理数据,当处理数据时,会往计算机上写入临时文件,处理完毕后,临时文件会自动删除掉。连接在其两端的过滤器是串行处理数据。虚拟文件连接器:此虚拟连接器用于直接在内存中处理数据,当处理数据时,会使用计算机虚拟内存,连接在其两端的过滤器串行处理数据。2.如何创建连接源2.1新建数据源如图所示,选中主画面左侧侧边框中的连接源信息,鼠标右键点击,这时会弹出三个选项,如图1-4所示,单机选择“新建连接源信息”选项即可完成创建连接源。图1-4.新建连接源的方法2.2 选择连接源图1-5.选择连接源的窗口单机新建连接源信息之后会
13、弹出一个如图1-5的选择窗口,对于不同的连接源有着不同的功能与作用,正对于不同的情况以及数据源的类型,正确的使用连接源才能完成所需要的数据挖掘以及清洗等工作。下文将列出并讲述了一些主要的连接源的属性设置。2.2.1 SQLDB连接器的属性设置。如下图1-6所示:图1-6.SQLDB连接器2.2.2 固定长文本连接器属性设置。如下图1-7所示:图1-7.固定长文本连接器2.2.3可变长文本连接器属性设置。如下图1-8所示:图1-8.可变长文本连接器2.2.4二进制文件连接器属性设置,如下图1-9所示:图1-9.二进制文件连接器2.2.5 Essbase维度构建连接器属性,如下图1-10所示。图1
14、-10.Essbase维度构建连接器2.2.6 Essbase数据装入连接器属性,如下图1-11所示。图1-11.Essbase数据装入连接器2.2.7 更新SQLDB连接器属性,如下图1-12所示。图1-12.更新SQLDB连接器2.2.8 输入用XML连接器属性,如下图1-13所示。图1-13.输入用XML连接器属性2.2.9 输出用XML连接器属性,如下图1-14所示。图1-15.输出用XML连接器2.2.10 Excel读取连接器属性,如下图1-16所示。图1-16.Excel读取连接源2.2.11 Excel工作表名读取属性设置,如下图1-17所示。图1-17.Excel工作表名读取
15、属性设置2.2.12 Excel指定单元格读取连接源属性设置,如下图1-18所示。图1-19.Excel制定单元格读取连接器2.2.13 Excel写入连接源属性设置,如下图1-20所示。图1-21.Excel写入连接源2.2.14 Excel指定单元格写入连接源属性设置,如下图1-22所示。图1-22.Excel指定单元格写入连接器2.2.15 DB loader for ORACLE属性设置,如下图1-23所示。图1-23.DB loader for ORACLE连接器2.2.16 DB Loader for Sybase IQ连接源属性设置,如下图1-24所示。图1-24.DB load
16、er for Sybase IQ连接源3.本章小结在Waha中,连接源是一个工程或项目所必须的,连接源的功能就在于连接数据或是文本并对这些数据或文本进行读取或写入,当本地的文本或是数据库需要在Waha上进行数据清洗、处理等行为时,这个时候就需要通过连接源把本地数据或是文本进行连接至Waha上,并且根据不同的数据库和文本文件,选择不同的连接器。然而在使用特殊的连接器时,需要提前进行不同的设置,比如在使用ODBC连接源时,需要客户端安装对应的数据库驱动程序,并在Windows的ODBC中建立好数据源,然后在WAHA中选择ODBC连接源。SQLDB连接器,是只读连接源。DB Loader for O
17、RACLE连接器是只适合于ORACLE数据库。第二章 视表模板1.视表模板视表模板的定义:又简称为视表,Waha中视表的概念,对应着数据库中的视图和表。用于多方位地展示数据库中的数据,相当于本地文件或是数据库的数据在Waha中的展现。2.按内容把视表归类并命名在创建或是进行一个大型项目的时候,视表的高效分类和命名显得尤为重要,正确并高效的分类和命名能让工作效率加倍,也使得数据易于查找,一般来说,我们会根据视表属性分成以下几个类,并按照功能作用来进行加前缀的命名,如下图2-1所示。图2-1.视表在左侧边框的位置以及规范的命名在用户使用Waha的时候,我们推荐用户参照我们的Waha命名规约来进行视
18、表等一些文件的命名办法进行命名,能够使得工作效率的最大化。3.创建视表模板选择主画面左侧的侧边框的“视表模板”,鼠标右键点击,会出现三个选项,如图2-2所示,选择“新建视表”选项即可完成创建一个新的视表模板。图2-2.新建视表模板点击“新建视表”之后,会弹出一个窗口名为“视表属性”的窗口,可以对新建的视表进行属性设置,属性说明如下图2-3所示。图2-3.属性设置在视表的属性设置中,表格栏可以手动设定或是以导入数据的方法来导入,手动设定只需要在表格栏设定中自行设定即可,点击“最后追加”即可添加一行表格栏。如果使用导入表格的方式导入表格栏式,则可使用以下的方法。第一步:点击图2-3的窗口下方的“导
19、入”选项。然后会跳出图2-4所出现的窗口,单选选择“从已存样本文件的读取结果中推定”,点击“下一步”。 图2-3.选择导入方法来导入表格栏第二步:进入到如图2-4所示的画面,选择需要读取的文件后,点击“下一步”。图2-4.选择需要读取的文件第五步:进入到如图2-5所示的画面,在预显视表中可以查看是否连接错误或是乱码,如果设置正确,则会在预显中看到正确的结果,成功之后点击“下一步”。图2-5.文件格式设置的窗口第六步:进入到如图2-6所示的画面,这里可以设置导入的方法,设置成功之后,点击“下一步” 。图2-5.导入完成之后的预显第七步:进入到如图2-6所示的画面,可以看到这个画面与图2-3的主体
20、一致 ,但是内容有所添加,即我们在上述的几个步骤中,完成了本地文件与Waha视表的连接过程,所以本地文件的数据会在Waha的视表中显示出来,此时可以点击“确定”。注:如果上诉步骤出现了,点击“返回”即可返回到上一步。即使已经点击确定之后,仍然能在左侧边框中选择该视表模板以重新编辑。图2-6.能够成功读取数据的视表第八步:在上一步中已经完成了一个视表的建立,可以在左侧边框中找到所创建的视表,在视表模板的文件夹中,如下图2-7所示,此时,右键选中点击,出现菜单选项,点击“视表预显”。图2-7.在左侧边栏中找到刚刚所创建的视表第九步:进入如图2-8所示的画面,查看预显结果。图2-8.预显结果4.本章
21、小结在一个Waha项目中,作业是作为一个基础的处理单元而存在的,而在作业中,视表与过滤器则组成了作业基本的流程框架,视表可以直接在作业中显示出来,因此,对于视表的命名应该是直接了当的,能够一眼看出该视表对应的本地文件以及作用,用户可以参考我们的命名公约以对视表命名。值得注意的是,在视表制作过程中,如果要连表头标题一起输出,需要在此视表中的连接源中修改表头行数。可能在一些文件中出现文本乱码情况,这个时候需要修改字码设置。如:GB码修改为UTF-8等,具体的文本乱码的设置,可以自行在网上查找相关的字节编码的文件。第三章 过滤器介绍视表过滤器功能定义:又可以简称为过滤器,能够把数据按条件设置从源视表
22、输出到目标视表,在过滤器中可以设置过滤条件、输入输出视表、字段转换函数等。过滤器的几种传输方式:过滤器作为数据的连接方式,在数据库和文本之间能够相互或是自互连接,即有着四种方式可以连接,数据库-数据库、数据库-文件、文件-数据库、文件-文件。这个过程,如下图3-1所示:图3-1.过滤器连接数据的方式1.过滤器分类在Waha的5.0版本中共有九种视表过滤器:标准视表过滤器、结合视表过滤器、归并视表过滤器、统计视表过滤器、分割视表过滤器、参照视表过滤器、纵向展开视表滤器、更新SQLDB视表过滤器、作业执行视表过滤器。所有的过滤器如图3-2所示。图3-2.Waha中所有的过滤器(注:在5.0之前的版
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Waha Transformer 操作手册 doc
限制150内