greenplum数据库经验谈.pptx
《greenplum数据库经验谈.pptx》由会员分享,可在线阅读,更多相关《greenplum数据库经验谈.pptx(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、greenplum数据库经验谈数据库经验谈唐成唐成 Alibaba 2012.05自我介绍姓名:唐成,网名osdba阿里巴巴集团-数据库技术团队职位:数据库专家技术专长lGreenplum、PostgreSQL、OraclelAIX、LinuxlC/C+MSN:QQ:191421283内容Greenplum的架构简介Greenplum与Hadoop的对比Greenplum中的有趣话题讨论日常维护经验谈Greenplum的架构简介Segment HostSegment HostSegment HostSegment Host内部高速以太网交换机Master HostClient HostMast
2、er Standby外部以太网网络Client HostClient HostGreenplum VS Hadoop比较项比较项GreenplumHadoop+Hive软件性质商业软件开源集群规模一般在100台以下可以到上万台。性能在100台以下时,性能比hadoop好。单个SQL可以做到秒级别集群规模越大,总体性能越好。单个SQL最少也有数十秒。SQL的支持程度支持完善,几乎所有PostgreSQL支持的SQL,gp都支持。支持有限的SQL,查询支持子查询,但不支持窗口函数。大部分dml都不支持,只支持append。稳定性有较多的bug。比较稳定。Greenplum中的有趣话题lGreenp
3、lum是如何做到的访问它就象访问单个PostgreSQL数据库一样?Greenplum中的有趣话题分布式执行计划lgather操作lmother操作GreenplumGreenplum最大精华就是分布式执行计划最大精华就是分布式执行计划分布式执行计划分布式执行计划的例子create table t1(id int primary key,cn int,name varchar(40)distributed by(id);create table t2(id int primary key,cn int,name varchar(40)distributed by(id);create tabl
4、e t3(id int primary key,cn int,name varchar(40)distributed by(id);insert into t1 select generate_series(1,1000000),generate_series(1,1000000),generate_series(1,1000000);insert into t2 select generate_series(1,1000000),generate_series(1,1000000),generate_series(1,1000000);insert into t3 select genera
5、te_series(1,100),generate_series(1,100),generate_series(1,100);分布式执行计划的例子tangdb=#explain select count(*)from t1;QUERY PLAN -Aggregate (cost=13884.48.13884.49 rows=1 width=0)-Gather Motion 4:1 (slice1;segments:4)(cost=13884.40.13884.46 rows=1.-Aggregate (cost=13884.40.13884.41 rows=1 width=0)-Seq Sca
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- greenplum 数据库 经验谈
限制150内