DataStage企业版产品白皮书之三教学文案.doc
《DataStage企业版产品白皮书之三教学文案.doc》由会员分享,可在线阅读,更多相关《DataStage企业版产品白皮书之三教学文案.doc(34页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Good is good, but better carries it.精益求精,善益求善。DataStage企业版产品白皮书之三-统一数据交换池项目ETL工具软件及产品现场支持服务竞争性谈判提交文件之六.二.三MetaStage白皮书北京先进数通信息技术有限公司2004年10月21日本文件涉及信息为北京先进数通信息技术有限公司专有信息,敬请视同机密文件处理。除因需要而得到授权的中国建设银行及本公司有关人员外,请勿以任何形式向他人或任何第三方透露。目录1.关于MetaStage32.集成元数据43.捕捉操作型元数据54.共享元数据65.资源分析和报表76.查看对象87.流览对象98.执行简单的
2、检索109.调查数据世系1110.执行ProcessAnalysis1111.执行ImpactAnalysis1212.执行查询1213.建立元数据文档1314.NationalLanguageSupport1315.MetaStage安全1316.MetaStage组件1517.MetaStage目录1617.1查看目录1618.MetaBrokers1719.MetaStage管理员1819.1MetaArchitect1819.2ProcessMetaBroker1819.3MetaStageExplorer1920.同时使用DataStage与MetaStage2021.同时使用Qua
3、lityStage与MetaStage2022.管理数据集成项目中的元数据21这个文档描述了MetaStage的特征,以及MetaStage为数据集成项目管理人员和用户带来的好处。本文概要介绍了MetaStage架构,描述了主要的客户机和服务器组件。1. 关于MetaStage通过协调整个企业范围内的元数据,MetaStage可以帮助用户处置、管理和有效地利用自己的数据集成项目,处理数据集成项目中与数据迁移和使用的工具有关的元数据。MetaStage将元数据的控制权交给用户,使用户知道:什么是元数据?元数据位于哪里?元数据来自哪里?这些元数据与什么相关?谁负责这些元数据?这些元数据与公司的那些
4、术语、词汇和业务域相关联?对元数据所作的任何变动将产生什么连带的影响?当把它们导出到另一个工具时,其属性及关系将是什么?不管数据集成的架构如何,MetaStage使用户能够开发一个高质量的企业数据源,在此基础上,用户可以真正地控制元数据的集成和共享。MetaStage可以帮助用户从DataStage作业和其他数据迁移处理过程中集成元数据。MetaStageProcessMetaBroker将监控这些生成操作型元数据的处理过程。然后,MetaStage将存储和使用这些操作型的元数据,为用户提供在整个企业范围内将会发生何种变化的详细信息(来自DataStage主机(Mainframe)作业的操作型
5、元数据可以直接发送到MetaStage,而不必使用ProcessMetaBroker)。在大多数的数据设计中,数据迁移和商务智能产品在生成自己的元数据时,没有共同的元数据交换准可循。MetaStage使用户能够把元数据集成到一个中心目录,利用这个目录与其他工具共享元数据无须工具供应商再做额外的工作。这意味着用户可以在一个环境中使用不相关的产品。通过集成整个企业范围内的元数据,MetaStage能够回答诸如“数据向来自哪里?采用的是什么转换和业务规则?谁在使用该数据?以及对数据集成项目所作的一个特定变动将会产生什么影响?”等问题。MetaStage也能快速地提供以超连接形式标记的详细数据项、以及
6、该数据项与其他数据的关系的报表。总而言之,作为一个企业范围的工具,MetaStage提供许多数据集成功能:从各种相关的工具中同步和集成元数据;自动地从操作型的系统中收集操作型的元数据;共享元数据、作业组件和设计;从一个单点处可以对作为集成资产的所有元数据进行浏览、查询、检索和制作报表;了解项目中数据的来源、出处和意义;评估改变数据操作处理过程时将会产生的影响;下面将分专题进一步介绍这些功能。2. 集成元数据用户可以把自己的工具和过程集成到MetaStage中。这使用户能够在不同的外部工具(包括建模、设计、抽取、转换和数据分析等工具)之间传输和转化元数据。例如,用户可以利用这些工具收集元数据,使
7、用它们设计数据集成处理过程。也可以把元数据直接导到数据分析工具,以避免冗长乏味的手工数据录入。MetaStage并不强求对准备共享的元数据采用单一的通用模型。对于数据集成工具可以共享的元数据,一个通用模型只能为用户提供一个最低的共同关注点。与此相反,MetaStage却可以利用数据集成工具把元数据分解成原子语义单位,然后再重构以便其他数据集成工具使用。单个MetaBrokers可以为每个工具之间提供一个界面,以便其查看存储在目录中的元数据以及元数据的语义单位。MetaStage可以捕捉各种元数据,其中包括: 设计元数据:是设计者和开发人员用于定义需求的元数据,它包括数据模型、业务元数据和转换作
8、业设计。 物理元数据:是利用工具执行时建立、管理和访问的元数据。 操作型元数据:在执行数据集成活动时,操作型元数据将告诉用户会发生什么变动,特别是有关它影响数据集成源的方式。项目元数据:用于制作文档,审计开发成果、分派责任人以及处理变动管理事项。面向:操作人、责任人、工具用户和管理层。注意:在本文档中,物理元数据和设计元数据均简称作元数据。MetaStage使用MetaBrokers直接从数据集成工具中导入和导出这样的数据。3. 捕捉操作型元数据4. MetaStage能够自动地捕捉描述数据集成处理过程正在运行时产生的事件的元数据。MetaStage使用这种操作型的元数据,建立数据集成过程中各
9、种数据源之间的关系的视图。在这些处理过程中,通过组合操作型元数据与设计元数据,MetaStage提供功能强大的查询能力。上图展示了一个运行的DataStage作业以及与该作业相关的所有事件。当作业开始处理时,作业中的每个连接都产生一个操作事件。另外,图中也展示了涉及到的每个软件资源。操作型元数据不仅展示事件,而且也能帮助确定数据世系。共享元数据MetaStage使用户能够利用主要的数据集成工具,共享整个企业范围内的元数据。主要步骤如下:1.使用适当的工具建立元数据,例如,DataStage、Cognos或Erwin;2.通过与工具有关的MetaBroker,或利用ProcessMetaBrok
10、er的捕捉功能,把元数据导入MetaStage;3.发布选择的元数据,以便感兴趣的用户能够订阅,并把元数据导出,供适当的数据集成工具使用(这些工具不一定必须与建立元数据时使用的工具相同)。例如,用户可以从数据库设计工具中把元数据导入MetaStage目录,然后从中导出元数据,接着再导入DataStage,以定义DataStage作业将录入数据的数据库的表和列。另外,也可以导出元数据供业务报表生成工具使用,如BusinessObjects或Cognos。用户还可以使用“SendtoDatabase”功能,把元数据导入MetaStage目录中的一组关系表。下图展示了一个从Erwin中导入元数据的过
11、程。5. 资源分析和报表把元数据导入MetaStage目录,或在数据集成活动中捕捉了操作型元数据之后,按照对象间的关系,用户可以浏览、查询或检索目录中完整的元数据结构。这些功能都是从MetaStageExplorer中可以访问的。用户可以:检查目录中一个或多个对象的属性及关系;指定哪一个人或组织负责某个对象;建立对象与业务术语、术语与词汇,以及词汇与业务域之间的关联关系;从一个对象开始,再按照对象与它包含的或依赖的其他对象之间的关系,递进式的进行浏览;对目录进行简单的检索;调查数据集成项目中数据的世系关系;审查进程(如DataStage作业)的执行历史;使用跨工具ImpactAnalysis(
12、影响分析)调查改变数据集成源或处理过程造成的影响;建立和运行针对更复杂的检索而定制的、预定义的查询;通过建立各种格式(包括HTML和XML)的报表,制作元数据文档。6. 查看对象MetaStage使用户能够很容易地查看MetaStage目录(DataStage表定义)中的任何对象,例如,查看对象的属性及关系、对象在其他数据集成工具中的重叠,以及能够运行生成有关对象更多信息的查询和模板。7. 流览对象在MetaStageContentBrowser(内容浏览器)中,使用资源管理器式的导航窗口界面,用户可以从任何元数据对象,如某个DataStage项目开始,按照包含或依赖关系,从上到下,逐层浏览这
13、些关系涉及到的所有对象。用户也可以从不同数据集成工具的角度(使用不同的MetaBroker视图),按照相应工具中可用的不同关联关系,显示同一对象。8. 执行简单的检索简单检索使用户能够从MetaStage目录的一个子集中,查询满足基于名字、描述、日期和元数据类型的检索准则的对象。可以把检索到的对象的属性保存到一个文本文件,例如,一个MicrosoftExcel能够读的文件中。9. 调查数据世系操作型元数据的数据世系(DataLineage)调查使用户能够找出数据项的历史,例如,它的来源、状态和最后修改时间等。组合使用DataLineage和ImpactAnalysis时,可以得出诸如“数据来自
14、哪一个特定物理目标表的特定列”和“最后一次得到数据的时间”等问题的答案。MetaStage的ProcessMetaBroker收集操作型元数据,并通过监控影响数据集成项目的处理活动,回答有关数据世系的问题。它记录受(如作业运行)影响的数据源,不管是写入还是从中读取。MetaStage也可以从DataStage主机作业中导入操作型元数据。用户可以跟踪数据世系,以审计DataStage作业的运行情况。可以看到运行时调用的一组转换规则、例程以及其他任何非作业对象的内容。然后还可以输出一个说明作业怎样一步一步地生成输出表中每一个列的报表。这个简单的数据世系说明一个具有200个记录的源文件怎样被输出到一
15、个目标表中。在这个作业中,所有的200个记录均被读写。10. 执行ProcessAnalysisProcessAnalysis(处理过程分析)类似于DataLineage调查,但它给出的是处理过程执行情况的信息,而非数据迁移信息。ProcessAnalysis通过考察操作型元数据,使用户能够察看处理过程执行情况的历史,可以得到诸如“每一个可执行的处理过程最后一次运行时的详细信息是什么?”,“这个处理过程最后三次运行时每一次使用的都是哪些参数?”,以及“出现失败事件的作业的哪些信息是可用的?”等问题的答案。11. 执行ImpactAnalysisMetaStageImpactAnalysis(影
16、响分析)使用户能够得到诸如“如果我做了这个改动会有什么影响?”和“这个对象依赖于谁”等问题的答案。例如,用户可以找出从MetaStage目录中删除一个特定的转换规则将会产生的影响。MetaStage利用存储在某个目录中的元数据的关联关系提供影响分析功能。MetaStage中的跨工具支持意味着这种关系可以跨越工具,以及整个数据集成项目实现的范围。例如,使用MetaStage,用户不仅可以找出改变一个例程将会影响哪个DataStage作业,而且还会发现该例程与哪个CASE框图相关联。12. 这一影响分析展示了从Erwin中连接到DataMart表的所有表,以及所有的导入模型(或产品),并通过该模型
17、关联DataMart表。执行查询为了全面地考察MetaStage目录中的元数据,可以使用QueryBuilder,或使用每个DataStageMetaBroker均随机附带的预定义的查询,建立自己定制的查询。这使用户能够得出包括下列数据集成组件之间的复杂关系等问题的答案。查询的结果是一个按照指定规则排序的对象的集合。用户可以使用上次查询的结果作为再次查询的起点,重新调整为一个新的检索。13. 查询可以保存,以便之后再重新使用该检索考查不同的对象集合。可以把查询导入一个文本文件,也可以从这个文本文件中再导入其他MetaStage目录。建立元数据文档MetaStage使用户几乎能够即时建立起复杂的
18、、以超连接形式标记的报表,描述MetaStage目录中的对象或对象集合的关系和属性。用户也能够以HTML、XML、RTF及文本格式建立这些报表,供打印输出,或在Web浏览器、MicrosoftWord以及文本编辑器中显示和整理。14. NationalLanguageSupportMetaStage具有多国语言支持能力(NationalLanguageSupport,NLS)。使用支持NLS的MetaStage和MetaBrokers,用户能够处理以任何字符集表示的数据,在MetaStage字段中显示各种语言形式的数据。但MetaStage和MetaBroker界面仍为英语文字。如果客户计算机
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DataStage 企业版 产品 白皮书 三教 文案
限制150内