Greenplum集群安装配置及最佳实践

有些话、适合烂在心里 提交于 2020-02-29 01:36:47

Greenplum集群安装配置及最佳实践

目录

Greenplum集群安装配置及最佳实践 1

目录 1

1 总体介绍 2

1.1 硬件平衡 2

1.2 高可用 2

1.3 部署方案 2

1.3.1 Group Mirroring 部署方案 3

1.3.2 Spread Mirroring 部署方案 3

1.3.3 Group + Spread Mirroring 部署方案 4

2 硬件选型 4

2.1 Master 节点 4

2.1.1 网卡 4

2.1.2 内存 4

2.1.3 磁盘 4

2.1.4 CPU 5

2.2 Segment 节点 5

2.2.1 网卡 5

2.2.2 内存 5

2.2.3 磁盘 5

2.2.4 CPU 5

2.3节点配置实例 6

2.4硬件配置经验总结 6

3 硬件配置 7

1主机配置实例 7

2 磁盘的配置 7

3 网络配置 8

4 交换机配置 8

4 储存规划 9

4.1 磁盘可用空间 9

4.2 用户数据容量 9

4.3 系统数据容量 10

5 集群的配置 10

5.1 最低系统要求 10

5.2 系统设置 11

5.3 操作系统参数设置 11

5.4 I/O设置 12

5.5 其他设置 13

6 集群安装 13

6.1 安装方式 13

6.2 数据库目录 14

7 集群验证 14

7.1 硬件性能验证 14

7.2 集群初始化 15

7.3 配置文件 15

7.4 数据目录 16

7.5 pg_hba.conf 配置文件 16

7.6 安装完后的环境变量 17

8 可选组件安装 18

8.1 安装外部支持的语言 18

8.2 故障诊断 19

1 总体介绍

1.1 硬件平衡

1、性能

2、容量

3、成本

1.2 高可用

1、节点

2、网络

3、磁盘

1.3 部署方案

1、Master与Standby Master分级部署

2、Primary Segment与Mirror Segment 分机部署

3、Segment Mirroring 部署方案

3.1、Group Mirroring

3.2、Spread Mirroring

3.3、Group + Spread Mirroring

4、Pivotal Supported Greenplum 必须部署Mirroring Segment

5、铜一主机Segment个数

5.1 CPU/Core 数据

5.2 查询并发数

5.3 查询复杂度

5.3 单机Primary Segment 总数不能过多

1.3.1 Group Mirroring 部署方案

按照以下4台机器Group Mirroring的部署方案总结

缺点: 一台机器down掉后,会把流量全部放在下一个节点,下一个节点的流量会变成2倍的流量

优点: down掉一台机器后,集群能正常的提供服务,如果再down掉第二台集群就不可用

1.3.2 Spread Mirroring 部署方案

按照以下4台机器Spread Mirroring的部署方案总结

缺点: 一台机器down掉后,会把流量全部放在下两个节点

优点: down掉一台机器后,集群能正常的提供服务,如果再down掉第二台集群就不可用

1.3.3 Group + Spread Mirroring 部署方案

如果集群比较大建议使用Group + Spread Mirroring部署方案,如果集群由down流量会分流道其他的机器上,集群不可用的几率比较小。

2 硬件选型

2.1 Master 节点

2.1.1 网卡

1、2块万兆网卡内部互联

2、1-2块千兆网卡带外管理及接入客户网络

2.1.2 内存

DDR4 64GB以上,建议256G

2.1.3 磁盘

1、6块600G/900G 10k RPM SAS盘

2、采用RAID5或RAID10

3、单独预留hotspare 盘

4、1块RAID卡,cache 1GB以上,带有掉电保护功能

2.1.4 CPU

1、2路8核及以上

2、主频2.5G HZ以上

2.2 Segment 节点

2.2.1 网卡

1、2块万兆网卡内部互联

2、1-2块千兆网卡带外管理及接入客户网络

2.2.2 内存

DDR4 64GB以上,建议256G

2.2.3 磁盘

1、24块600G/900G 10k RPM SAS盘

2、采用RAID5或RAID10

3、单独预留hotspare 盘

4、1-2块RAID卡,cache 1GB以上,带有掉电保护功能

2.2.4 CPU

1、2路8核及以上

2、主频2.5G HZ以上

2.3节点配置实例

2.4硬件配置经验总结

1、磁盘故障时Greenplum集群最常见的故障

1.1分析性查询: SAS盘 > SATA盘

1.2高并发小IO查询: 优先SSD或NVMe

2、RAID级别

2.1 RAID-5 VS RAID-10

3、RAID 卡一定带Cache功能,能提高磁盘的读写性能。

4、硬件监控

5、预留灾备机

RAID-5 VS RAID-10的区别:

RAID-5:在容量上会比较大,储存会达到90%的利用率,在读写的性能上比RAID10会好一点,RAID5的可靠性会差很多。

RAID-10:冗余级别更高,储存会达到50%的利用率,当有的盘出现坏的情况下,磁盘的可靠性有保证。

3 硬件配置

1主机配置实例

一下的配置两个CPU主机的例子,两个segment两个primary两个mirror以及两个网卡的例子

2 磁盘的配置

3 网络配置

4 交换机配置

以下配置是两个交换机,配置的流量是均衡的。

4 储存规划

4.1 磁盘可用空间

4.2 用户数据容量

4.3 系统数据容量

5 集群的配置

5.1 最低系统要求

以下是系统的最低的配置

5.2 系统设置

5.3 操作系统参数设置

5.4 I/O设置

5.5 其他设置

6 集群安装

6.1 安装方式

6.2 数据库目录

7 集群验证

7.1 硬件性能验证

7.2 集群初始化

7.3 配置文件

7.4 数据目录

7.5 pg_hba.conf 配置文件

7.6 安装完后的环境变量

8 可选组件安装

8.1 安装外部支持的语言

8.2 使用gppkg 命令安装

8.2 故障诊断

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!