GaussDB 200的高可用容灾目标是在任何故障场景,数据不丢失,业务不停机。为达到这样的目标,GaussDB 200设计了双集群容灾的方案:分别部署两套同构的集群,集群间通过容灾任务进行周期性的物理数据同步。其中主集群提供正常的业务,灾备集群(亦称“备集群”)在恢复期间不可用,非恢复期间提供只读服务。当主集群不可用时,灾备集群可以代替主集群正常提供业务,从而实现数据库的高可用。双集群容灾的约束限制见下图:
1、环境信息
如下图所示,两个同构集群环境(Gauss1和Gauss2)都是由三个节点组成,容灾数据的存放路径都指定在同一位置(这里在各个节点单独挂载了一块磁盘用于存放容灾数据)。
2、配置主备集群容灾
在启动双集群容灾功能之前,必须先对主备集群进行容灾配置,步骤如下:
2.1 配置主集群容灾
登录主集群FusionInsight Manager,在“集群”下拉列表中单击需要操作的集群名称,选择“服务 > MPPDB > 容灾 ”,填写完成后,单击“保存配置”。保存成功,配置状态显示为“已配置”。
2.2 配置备集群容灾
登录备集群FusionInsight Manager,在“集群”下拉列表中单击需要操作的集群名称,选择“服务 > MPPDB > 容灾 ”,填写完成后,单击“保存配置”。保存成功,配置状态显示为“已配置”。
2.3 配置说明
3、启动与停止集群容灾
3.1 启动集群容灾
- 登录主集群FusionInsight Manager,在“集群”下拉列表中单击需要操作的集群名称,选择“服务 > MPPDB > 容灾 ”,单击“启动容灾”。
- 在弹出窗口中输入Manager管理员密码,单击“确定”。在弹出窗口中输入对端集群root用户密码,单击“确定”。
- 等待容灾启动成功,单击“完成”。
- 重复1~3,启动备集群容灾。
容灾启动后,主集群首先会执行一次全量备份,然后在备集群进行恢复(默认一周做一次全备份)。之后会周期性(默认为1小时)的执行增量备份恢复任务。备集群恢复期间,mppdb服务不可用,可以暂时忽略系统的告警信息。3.2 停止集群容灾
1.登录主集群FusionInsight Manager,在“集群”下拉列表中单击需要操作的集群名称,选择“服务 > MPPDB > 容灾 ”,单击“停止容灾”。
2.在弹出窗口中输入Manager管理员密码,然后单击“确定”。在确认停止容灾任务的对话框中单击“确定”。
3.参见1~2登录备集群FusionInsight Manager停止备集群容灾。4、即时恢复
在主备集群容灾过程中,备集群的恢复任务为周期性任务,如果设置的恢复周期较长,在两个周期之间如需在备集群即时执行一次数据恢复,可使用备集群的即时恢复功能。
1.登录备集群FusionInsight Manager,在“集群”下拉列表中单击需要操作的集群名称,选择“服务 > MPPDB > 容灾”。
2.单击“即时恢复”。
3.在弹出窗口中输入备集群FusionInsight Manager管理员密码,单击“确定”。
4.在弹出窗口中输入主集群root用户密码,单击“确定”。
5.在确认执行即时恢复任务的对话框中单击“确定”。
5、主备集群切换
当主集群出现故障或需要升级时,可以使用容灾的主备切换功能将灾备集群升级为主集群,解除只读限制,在原主集群故障或升级期间继续对外提供服务,保证业务不中断。
1.登录备集群FusionInsight Manager,在“集群”下拉列表中单击需要操作的集群名称,选择“服务 > MPPDB > 容灾 ”,单击“停止容灾”。
2.等待容灾停止后,单击“主备集群切换”。在弹出窗口中输入Manager管理员密码,单击“确定”。在确认执行主备切换任务的对话框中单击“确定”进行主备切换。
切换之前,会做一次增量备份与恢复,如果数据量大,则切换的时间比较长,需耐心等待。
3.等待主备切换成功之后,修改原备集群的容灾配置。
4.如果原主集群正常,修改原主集群的容灾配置,否则,请先修复原主集群故障,再配置。
5.启动主备集群的容灾,建立新的主备关系,如下图所示:
来源:51CTO
作者:candon123
链接:https://blog.51cto.com/candon123/2450326?source=dra