数据仓库方案比较.doc
《数据仓库方案比较.doc》由会员分享,可在线阅读,更多相关《数据仓库方案比较.doc(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据仓库方案对比1 概述成功地实施一个数据仓库项目,通常需要很长的时间。如果仅仅着眼于短期成果,缺乏整体考虑,采用一种不健全的体系结构,不仅会增加系统开发和维护成本,而且必将对发挥数据仓库的作用造成不利的影响。Oracle公司是世界上最大的数据仓库厂家,能够提供完整的数据仓库解决方案。根据第三方专业咨询机构TDWI-Forrester所做的市场调查显示,Oracle是大多数IT主管选择数据仓库平台时的首选。IBM数据仓库的市场占有率低于Oracle。权威市场分析机构IDC发布全球数据仓库平台工具2006年度供应商市场份额报告,根据2006年度软件收入,把甲骨文评为数据仓库平台工具领域的领先供应
2、商(数据仓库平台工具包括ETL工具、数据仓库存储平台、多维数据库、前端展现工具)。IDC把甲骨文评为数据仓库管理领域的领先供应商,是因为甲骨文的市场份额已接近41%。在数据仓库管理工具市场,甲骨文排名最近的竞争对手的各项指标几乎只有甲骨文的一半,市场份额仅占22.8%。下图是另一家权威市场分析机构Gartner的数据仓库象限图:IBM同样低于Oracle。2 ETL工具IBM的ETL工具有三个:收购的DataStage(通常市场上说的IBM的ETL工具指的就是Datastage,不提供增量数据捕获功能,价格昂贵),数据联邦工具:Information Integrator(异构连接性好、提供增
3、量数据捕获功能,但是不提供完整的数据源到目标数据库的ETL功能,尤其是数据转换功能很弱,没有ETL步骤打包、流程编排功能,没有按照事件或者时间触发ETL流程的功能,价格昂贵),包在Data Warehouse Edition中的ETL工具SQL Warehousing(功能很弱,异构连接性差,不提供增量数据捕获,是一个新工具,没有什么用户,不是IBM的主流ETL工具)。功能点使用场景或者益处OracleIBM增量数据捕获增量数据加载时,如果数据源系统没有时间戳,或者时间戳不可靠,需要利用读取数据源系统日志或者触发器方式获取增量数据,然后根据需要可以复制到目标数据库上或者批量同步到目标数据库上。
4、Oracle Data Integrator,对于Oracle数据库和DB2 400可以采用读取日志方式,其他数据库采用触发器方式Information Integrator提供,Data Stage霍和SQL Warehousing不提供,对于Oracle数据库采用的是触发器方式抽取、加载、转换功能Oracle Data IntegratorData Stage或者SQL Warehousing提供,Information Integrator不提供异构数据源和目标支持支持关系型数据库、数据仓库、文件作为数据源和目标Oracle Data IntegratorData Stage支持,SQL
5、 Warehousing只支持DB2作为目标报错信息采用数据库报错信息便于查找错误原因Oracle Data IntegratorData Stage、SQL Warehousing的错误信息都是自己工具的错误信息,不方便查找错误原因高性能Oracle Data Integrator采用ELT架构,数据的抽取加载转换过程在数据库服务器上完成,充分利用数据库的处理能力,从而提高性能Data Stage采用ETL架构,数据的抽取加载转换过程在ETL服务器上完成,不能充分利用数据库的函数和处理能力,性能较差。无须单独ETL服务器减少硬件管理和维护Oracle Data Integrator不需要单独
6、的ETL服务器Data Stage需要单独的ETL服务器元数据存储在关心型数据库中Oracle Data Integrator的元数据可以存储在任何关系型数据库中,通过数据库开发接口可以访问元数据。Data Stage的元数据存储在自己的私有数据库Universe中,不是主流的数据库,对外提供接口方面无法采用数据库的开发接口。3 数据仓库功能点使用场景或者益处OracleIBMOLTP和OLAP的支持数据库在此项目中作为数据中心使用,其特性既有OLAP作用,已批量数据加载、查询为主,也有OLTP特性,以高速少量数据的增删改查为主Oracle数据库既支持OLTP也支持OLAP,在TPC-C和TP
7、C-H测试中,都有使用数据库集群或者不使用数据库集群的测试结果。DB2 UDB对于OLTP的支持方式是不采用数据库分区(集群),如在OLTP标准测试TPC-C中,从未使用集群方式;对于大数据量的OLAP应用,采用数据库分区(集群),如在OLAP标准测试TPC-H中,全部采用集群方式。作为数据中心这种混合体应用,DB2不适合。分区是提高大量数据下性能的好方法,其实质是将达数据量分割为小数据量,通过并行、减少数据量等手段提高性能Oracle数据库提供Range、List、Hash、Range+Hash、List+Hash、Range+List等多种分区方式;Oracle的分区技术从8i就开始,是非
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 方案 比较
限制150内