Greenplum 分布式数据仓库软件特性介绍.docx
《Greenplum 分布式数据仓库软件特性介绍.docx》由会员分享,可在线阅读,更多相关《Greenplum 分布式数据仓库软件特性介绍.docx(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1. Greenplum 分布式数据仓库软件特性介绍Greenplum数据仓库软件是业界首创将大规模并行计算技术,应用到了数据库软件领域。该类技术同样应用在Google搜索引擎的中。Greenplum数据仓库软件功能: 无共享/MPP核心架构Greenplum数据库软件将数据平均分布到系统的所有节点服务器上,所以节点存储每张表或表分区的部分行,所有数据加载和查询都是自动在各个节点服务器上并行运行,并且该架构支持扩展到上万个节点。 混合的存储和执行(按列或按行)Greenplum发明支持混合按列或按行存储数据,每张表或表分区可以由管理员根据应用需要,分别指定存储和压缩方式。基于这个功能,用户可以
2、对任何表或表分区选择按行或按列存储数据和处理方式。这些是在建表或表分区的DDL语句中配置的,只需在建表或表分区时指定。这个功能基于Greenplum的多态维数据存储技术。 多层次的容错能力Greenplum 数据仓库软件自己包含多层次容错和冗余能力,这是云计算架构软件的一个重要特征。该功能保证整个数据仓库系统在遇到硬件、软件的故障的情况下,仍然自动继续运行。 在线系统扩容(永不停机)在系统中增加节点服务器即可增加存储容量,处理性能和加载性能。当系统扩展时,数据仓库保持在线,并且完全可用,扩展进程在后台运行。增加节点服务器,性能和容量线性增加。 负载管理(Workload Management)
3、 具有系统资源管控能力,并且可控制给各个查询分配各自系统资源。允许管理员指派资源队列,从而管理数据仓库的队列进入执行情况。在运行的查询的优先级可以随时调整。 PB级的装载能力基于MPP Scatter/Gather 流技术的高性能并行加载功能。加载速度随着节点线性增加,实际超过4TB/小时。 灵活的外部数据访问数据仓库软件可在任意外部数据源上并行运行常规SQL,不论外部数据源的位置,格式或存储介质。 数据库内压缩利用业界领先的压缩技术,进一步提高性能,并极大地节省了数据存储空间。用户可获得3-10倍的空间节省,并且同时获得相应有效I/O性能提升。 多层次表分区能力允许灵活地按照时间、范围、值域
4、划分表分区。表分区由DDL设定,分区层级不限。数据仓库软件的查询优化器自动从查询执行计划中略去不涉及的表分区。 索引功能Greenplum 支持各种数据库索引技术,包括B-Tree,Bitmap等等。按列存储、按行存储数据库表都支持索引。 完全遵从SQL最新标准 遵从SQL-92 , SQL-99 ,至SQL 2003标准,并包括SQL 2003 OLAP扩展项。所有SQL查询都是在系统上并行执行。 原生MapReduce功能 MapReduce由Google发明,已被证实为一个高扩展性的文本非结构化数据分析的技术。Greenplum的并行数据库软件核心可原生运行MapReduce程序。 支持
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Greenplum 分布式数据仓库软件特性介绍 分布式 数据仓库 软件 特性 介绍
限制150内