GreenPlum详细培训教程.pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《GreenPlum详细培训教程.pdf》由会员分享,可在线阅读,更多相关《GreenPlum详细培训教程.pdf(224页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Greenplum数据库数据库数据库数据库v3.3 系统管理员培训系统管理员培训系统管理员培训系统管理员培训课程介绍课程介绍课程介绍课程介绍课程内容课程内容课程内容课程内容1.产品概述产品概述产品概述产品概述2.系统配置和验证系统配置和验证系统配置和验证系统配置和验证3.软件安装和系统初始化软件安装和系统初始化软件安装和系统初始化软件安装和系统初始化4.客户端应用程序客户端应用程序客户端应用程序客户端应用程序9.数据加载数据加载数据加载数据加载10.数据操作语言数据操作语言数据操作语言数据操作语言(DML)和数据查询和数据查询和数据查询和数据查询语言语言语言语言(DQL)11.性能优化性能优化
2、性能优化性能优化4.客户端应用程序客户端应用程序客户端应用程序客户端应用程序5.服务器配置服务器配置服务器配置服务器配置6.数据定义语言数据定义语言数据定义语言数据定义语言(DDL)7.角色角色角色角色、权限和基于角色的资源队列权限和基于角色的资源队列权限和基于角色的资源队列权限和基于角色的资源队列8.表分区功能表分区功能表分区功能表分区功能12.系统管理系统管理系统管理系统管理13.冗余和高可用性冗余和高可用性冗余和高可用性冗余和高可用性14.备份和恢复备份和恢复备份和恢复备份和恢复15.数据库内部结构数据库内部结构数据库内部结构数据库内部结构课程资料和安排课程资料和安排课程资料和安排课程资
3、料和安排?授课形式授课形式授课形式授课形式?培训指导手册培训指导手册培训指导手册培训指导手册?培训练习培训练习培训练习培训练习 根据手册的练习内容 需要网络和ssh接入?Q&A讨论讨论讨论讨论?反馈和课程评价反馈和课程评价反馈和课程评价反馈和课程评价培训对象培训对象培训对象培训对象数据库管理员数据库管理员数据库管理员数据库管理员(DBA)?基本的基本的基本的基本的SQL语法语法语法语法?常规的数据库概念常规的数据库概念常规的数据库概念常规的数据库概念系统管理员系统管理员系统管理员系统管理员?基本的基本的基本的基本的UNIX命令命令命令命令(cd,ls,ssh,cat,grep等等等等)?VI(
4、文本编辑器文本编辑器文本编辑器文本编辑器)的使用的使用的使用的使用学习目标学习目标学习目标学习目标?理解理解理解理解Greenplum数据库的架构和组成部分数据库的架构和组成部分数据库的架构和组成部分数据库的架构和组成部分?熟悉熟悉熟悉熟悉Greenplum数据库的特性和功能数据库的特性和功能数据库的特性和功能数据库的特性和功能?懂得如何使用懂得如何使用懂得如何使用懂得如何使用Greenplum数据库完成基本操作数据库完成基本操作数据库完成基本操作数据库完成基本操作掌握如何管理掌握如何管理掌握如何管理掌握如何管理Greenplum数据库系统数据库系统数据库系统数据库系统以及解决故障以及解决故障
5、以及解决故障以及解决故障?掌握如何管理掌握如何管理掌握如何管理掌握如何管理Greenplum数据库系统数据库系统数据库系统数据库系统,以及解决故障以及解决故障以及解决故障以及解决故障Greenplum产品概述产品概述产品概述产品概述第第第第1课课课课主要架构和组成部分主要架构和组成部分主要架构和组成部分主要架构和组成部分高可用性设计高可用性设计高可用性设计高可用性设计系统管理内容系统管理内容系统管理内容系统管理内容重要概念重要概念重要概念重要概念数据分布和查询数据分布和查询数据分布和查询数据分布和查询Greenplum数据库数据库数据库数据库?海量并行处理海量并行处理海量并行处理海量并行处理(
6、MPP)DBMS?基于基于基于基于 PostgreSQL 8.2相同的客户端功能增加支持并行处理的技术增加支持数据仓库和BI的特性增加支持数据仓库和BI的特性?外部表/并行加载?资源管理?查询优化器增强Greenplum基本架构基本架构基本架构基本架构Segment HostLANSegment HostSegment HostSegment HostClientMaster Host客户端程序客户端程序客户端程序客户端程序?psql?pgAdmin III?ODBC?JDBC?Perl DBI?Python?libpqMaster主机主机主机主机?访问系统的入口?数据库侦听进程(postgr
7、es)?处理所有用户连接?建立查询计划建立查询计划?协调工作处理过程?管理工具?系统目录表和元数据(数据字典)?不存放任何用户数据Segments主机主机主机主机?每个Segment上存放一部分用户数据?一台Segment主机可以有多个实例?通过增加Segment主机实现线性扩展?用户不能直接存取访问?所有对段的访问都经过Master?数据库监听进程(postgres)来自Master的连接Interconnect?Greenplum数据库之间的连接层?进程间协调和管理?基于千兆以太网架构?属于系统内部私网配置?支持两种协议:TCP or UDP高可用性的架构高可用性的架构高可用性的架构高可用
8、性的架构mirror segmentmirror segmentmirror segment数据冗余数据冗余数据冗余数据冗余 Segment镜像镜像镜像镜像primary master hoststandby master hostSystem CatalogsSystem CatalogsMaster镜像镜像镜像镜像热备热备热备热备MasterTransaction LogsTransaction LogssynchronizationprocessGreenplum 管理命令管理命令管理命令管理命令?存放位置存放位置存放位置存放位置$GPHOME/bin$GPHOME/bin$GPHOME
9、/bin$GPHOME/bin?命令行功能可提供命令行功能可提供命令行功能可提供命令行功能可提供:系统的设置和初始化系统的设置和初始化系统的设置和初始化系统的设置和初始化 系统的开启和关闭系统的开启和关闭系统的开启和关闭系统的开启和关闭 系统的扩容和数据的重新分布系统的扩容和数据的重新分布系统的扩容和数据的重新分布系统的扩容和数据的重新分布 复原故障的复原故障的复原故障的复原故障的Master或或或或Segment实例实例实例实例 备份和恢复备份和恢复备份和恢复备份和恢复 为并行加载创建文件服务器为并行加载创建文件服务器为并行加载创建文件服务器为并行加载创建文件服务器 系统状态报告系统状态报告
10、系统状态报告系统状态报告?性能监控工具性能监控工具性能监控工具性能监控工具Performance MonitorPerformance MonitorPerformance MonitorPerformance MonitorGreenplum数据库的重要概念数据库的重要概念数据库的重要概念数据库的重要概念?表分布方式表分布方式表分布方式表分布方式?并行查询的实现方式并行查询的实现方式并行查询的实现方式并行查询的实现方式salecustomercn integercname textvendormastersale part 3segment 3sale part 1segment 1sale
11、 part 2segment 2分布式的数据表分布式的数据表分布式的数据表分布式的数据表cn integervn integerpn integerdt dateqty integerprc floatvn integervname textloc textproductpn integerpname textglobal catalogcustomer part 3productpart 3vendor part 3customer part 1productpart 1vendor part 1customer part 2productpart 2vendor part 2Hash分布分
12、布分布分布 CREATE TABLE DISTRIBUTED BY(column,)同样内容的键值被分配到同一个同样内容的键值被分配到同一个同样内容的键值被分配到同一个同样内容的键值被分配到同一个Segment上上上上表分布的方式表分布的方式表分布的方式表分布的方式循环分布循环分布循环分布循环分布 CREATE TABLE DISTRIBUTED RANDOMLY 具有同样数值的行内容并不一定在同一个具有同样数值的行内容并不一定在同一个具有同样数值的行内容并不一定在同一个具有同样数值的行内容并不一定在同一个Segment上上上上计划和调度一个查询计划和调度一个查询计划和调度一个查询计划和调度一
13、个查询SLICE 3SELECT customer,amount FROM sales JOIN customer USING(cust_id)WHERE date=04302008;Gather MotionGather MotionSLICE 3SEGMENT 2SEGMENT 1并行查询计划并行查询计划并行查询计划并行查询计划SLICE 1SLICE 2Table ScanRedistributeMotionTable ScanHashHash JoinTable ScanRedistributeMotionTable ScanHashHash JoinSLICE 1SLICE 2mas
14、tergang查询工作的进程查询工作的进程查询工作的进程查询工作的进程segment1segment2ganggang3.3版本的新增内容版本的新增内容版本的新增内容版本的新增内容?在线的系统扩容方式在线的系统扩容方式在线的系统扩容方式在线的系统扩容方式?数据表再分布更新数据表再分布更新数据表再分布更新数据表再分布更新?pgAdmin III工具工具工具工具复习复习复习复习Greenplum概念概念概念概念第第第第1课练习课练习课练习课练习系统配置和验证系统配置和验证系统配置和验证系统配置和验证第第第第2课课课课Greenplum和硬件设备和硬件设备和硬件设备和硬件设备参考架构参考架构参考架构
15、参考架构OS内核优化内核优化内核优化内核优化Greenplum系统验证工具系统验证工具系统验证工具系统验证工具估算存储容量估算存储容量估算存储容量估算存储容量Greenplum软硬件需求软硬件需求软硬件需求软硬件需求?Greenplum数据库软件方案数据库软件方案数据库软件方案数据库软件方案 给客户多种硬件平台的选择 数据库的性能与硬件性能有密切关系 Greenplum有多种型号的硬件平台经过测试认证?选择硬件的考虑因素选择硬件的考虑因素选择硬件的考虑因素选择硬件的考虑因素?选择硬件的考虑因素选择硬件的考虑因素选择硬件的考虑因素选择硬件的考虑因素 Segment服务器具有相同的硬件配置 Mas
16、ter服务器需要较高的CPU和内存资源?认证的操作系统认证的操作系统认证的操作系统认证的操作系统 Solaris 10 update 4/5 (添加推荐的patches)SUSE Linux Enterprise 10 Red Hat Enterprise Linux 5.x CentOS 5.xGreenplum硬件配置硬件配置硬件配置硬件配置?Segment主机的推荐配置主机的推荐配置主机的推荐配置主机的推荐配置 2颗P3/Athlon CPU,dual-core 32GB内存 内置或直连的高速磁盘阵列 4个以上的千兆网口4个以上的千兆网口?Greenplum认证的硬件型号认证的硬件型号认
17、证的硬件型号认证的硬件型号(x86 PC服务器服务器服务器服务器)Sun Fire x4240(Master)+Sun Fire x4540(Segment)HP DL180G6 Dell R710+MD1120磁盘阵列 Dell 2950+MD1000磁盘阵列 华赛Oceanstor T3500Segment主机配置示例主机配置示例主机配置示例主机配置示例每个有效的每个有效的每个有效的每个有效的CPU core对应对应对应对应一个主一个主一个主一个主Segment实实实实例例例例通通通通过逻辑过逻辑过逻辑过逻辑磁磁磁磁盘驱动盘驱动盘驱动盘驱动映射到文件系映射到文件系映射到文件系映射到文件系统
18、统统统逻辑逻辑逻辑逻辑磁磁磁磁盘驱动盘驱动盘驱动盘驱动使用物理磁使用物理磁使用物理磁使用物理磁盘组盘组盘组盘组(RAID)RAID模式的模式的模式的模式的选择选择选择选择取决于:取决于:取决于:取决于:性能与容量的需求或Segment主机主机主机主机 磁盘阵列磁盘阵列磁盘阵列磁盘阵列 性能与容量的需求(RAID-10 或 RAID-5)数据保护和磁盘容错的考虑Greenplum White Box 配置参考配置参考配置参考配置参考硬件硬件硬件硬件?15 rack units(15u)?5 x 3u servers (1 master+4 segment hosts)?16 x 400GB SA
19、TA disks per server?2 SATA hardware RAID10 controllers?2 mirrored OS drives on separate controller?64 GB total RAM on segment hosts存储能力存储能力存储能力存储能力?24 TB raw capacity?6 TB usable primary data capacity on segment hosts?Mirroring enabled基准性能基准性能基准性能基准性能?3.2GB/Second(综合的系统磁盘读写速度)Sun DW设备规格设备规格设备规格设备规格?
20、S1002,S1004,S1010,S1020,S1040 基本规格基本规格基本规格基本规格,供客户供客户供客户供客户选择选择选择选择?Master 服务器服务器服务器服务器(X4200)(与与与与ETL服务器分离服务器分离服务器分离服务器分离)?Segment 服务器服务器服务器服务器(X4500)?Segment 服务器服务器服务器服务器(X4500)?ZFS文件系统配置文件系统配置文件系统配置文件系统配置S1002S1004S1010Sun DW设备设备设备设备 2节点节点节点节点,4节点节点节点节点,10节点节点节点节点 1 Sun Fire X4200 2 Sun Fire X450
21、0s 1 Sun 1000-42 Rack 1 Sun Fire X4200 4 Sun Fire X4500s 1 Sun 1000-42 Rack 1 Sun Fire X4200 10 Sun Fire X4500s 2 Sun 1000-42 Racks型号型号型号型号S1002S1004S1010容量容量容量容量10 TB(20 TB with RAIDZ)20 TB(40 TB with RAIDZ)50 TB(100 TB with RAIDZ)机架单位机架单位机架单位机架单位122044Sun DW设备的配置设备的配置设备的配置设备的配置机架单位机架单位机架单位机架单位1220
22、44读写速度读写速度读写速度读写速度3.6 GB/sec7.2 GB/sec18 GB/sec内存内存内存内存32 GB64 GB160 GBCPU Cores81640Master主机规格主机规格主机规格主机规格(X4200)?CPU:2颗双核颗双核颗双核颗双核AMD Opteron处理器处理器处理器处理器?内存:16 GB?硬盘:4块块块块146GB SAS磁盘磁盘磁盘磁盘操作系统 Solaris 10,64位位位位?操作系统:Solaris 10,64位位位位?文件系统:Solaris ZFS?RAID:软件级软件级软件级软件级RAID1,使用使用使用使用ZFS?网络:6个千兆网络接口个
23、千兆网络接口个千兆网络接口个千兆网络接口Segment 主机规格主机规格主机规格主机规格(X4500)?CPU:2颗双核颗双核颗双核颗双核AMD Opteron处理器处理器处理器处理器?内存:16 GB?硬盘:48块块块块500GB SATA II内置磁盘内置磁盘内置磁盘内置磁盘操作系统 Solaris 10,64位位位位?操作系统:Solaris 10,64位位位位?文件系统:Solaris ZFS?RAID:软件级软件级软件级软件级RAID-Z,使用使用使用使用ZFS?网络:6个千兆网络接口个千兆网络接口个千兆网络接口个千兆网络接口考虑存储容量的磁盘配置考虑存储容量的磁盘配置考虑存储容量的
24、磁盘配置考虑存储容量的磁盘配置 4个RAID-Z存储池,11块磁盘为一组(RAID 5)牺牲4块磁盘作为保护 读写速度大约600-800 MB/sZFS磁盘配置磁盘配置磁盘配置磁盘配置Logical DiskSegment InstanceCPU 2Segment InstanceCPU 3Segment InstanceCPU 4ZFS File SystemZFS File SystemZFS File SystemZFS File SystemRAID 10 PoolSegment InstanceCPU 1考虑高性能的磁盘配置考虑高性能的磁盘配置考虑高性能的磁盘配置考虑高性能的磁盘配置
25、 一个带镜像的存储池,以22块磁盘作为镜像组(RAID 10)牺牲22块磁盘作为镜像保护 读写速度大约1600-1800 MB/sX4200(Master Host)e1000g4e1000g5e1000g3e1000g2e1000g1e1000g0iLOMCatalyst 2960192.168.Local LAN/WANas locally definedS1002网络配置网络配置网络配置网络配置SMC 8748MSMC 8748M172.16.0172.16.1172.16.2172.16.3X4500(Segment Host 2)e1000g3e1000g2e1000g1e1000g
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GreenPlum 详细 培训 教程
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内