一、概述
什么是哨兵机制
- Redis的哨兵(sentinel) 系统用于管理多个 Redis 服务器,该系统执行以下三个任务:
- 监控(Monitoring): 哨兵(sentinel) 会不断地检查你的Master和Slave是否运作正常。
- 提醒(Notification):当被监控的某个 Redis出现问题时, 哨兵(sentinel) 可以通过 API 向管理员或者其他应用程序发送通知。
- 自动故障迁移(Automatic failover):当一个Master不能正常工作时,哨兵(sentinel) 会开始一次自动故障迁移操作,它会将失效Master的其中一个Slave升级为新的Master, 并让失效Master的其他Slave改为复制新的Master; 当客户端试图连接失效的Master时,集群也会向客户端返回新Master的地址,使得集群可以使用Master代替失效Master。
- 哨兵(sentinel) 是一个分布式系统,你可以在一个架构中运行多个哨兵(sentinel) 进程,这些进程使用流言协议(gossipprotocols)来接收关于Master是否下线的信息,并使用投票协议(agreement protocols)来决定是否执行自动故障迁移,以及选择哪个Slave作为新的Master.
- 每个哨兵(sentinel) 会向其它哨兵(sentinel)、master、slave定时发送消息,以确认对方是否”活”着,如果发现对方在指定时间(可配置)内未回应,则暂时认为对方已挂(所谓的”主观认为宕机” Subjective Down,简称sdown).
- 若“哨兵群”中的多数sentinel,都报告某一master没响应,系统才认为该master"彻底死亡"(即:客观上的真正down机,Objective Down,简称odown),通过一定的vote算法,从剩下的slave节点中,选一台提升为master,然后自动修改相关配置.
- 虽然哨兵(sentinel) 释出为一个单独的可执行文件 redis-sentinel ,但实际上它只是一个运行在特殊模式下的 Redis 服务器,你可以在启动一个普通 Redis 服务器时通过给定 --sentinel 选项来启动哨兵(sentinel).
- 哨兵(sentinel) 的一些设计思路和zookeeper非常类似
二、环境配置
2.1 虚拟机
- 哨兵机制的作用:管理集群redis、监控选举策略、心跳检测,(独立的一个应用程序)
- 环境配置 实现三台不同服务器的redis实现集群(克隆)
- 直接先安装一台,后面两台全部克隆
192.168.212.145 主redis服务器 192.168.212.147 从redis 192.168.212.148 从redis
2.2 安装Redis
##下载Redis安装包 wget http://download.redis.io/releases/redis-3.2.9.tar.gz ##解压Redis安装包 tar -zxvf redis-3.2.9.tar.gz ##安装 cd redis-3.2.9 make cd src make install PREFIX=/usr/local/redis ##移动配置文件到安装目录下 cd ../ mkdir /usr/local/redis/etc mv redis.conf /usr/local/redis/etc ## 修改配置文件 vi /usr/local/redis/etc/redis.conf ## 1. 修改为后台启动 daemonize yes ## 2. 修改密码 requirepass 123456 ## 3. 开启外网访问 ,注释掉下面的 ## bind 127.0.0.1 ## 开始测试 ## 1. 开启redis /usr/local/redis/bin/redis-server /usr/local/redis/etc/redis.conf ## 2. 连接Redis客户端 ./redis-cli -h 127.0.0.1 -p 6379 -a "123456" PING #结果表示成功 ## 3. 测试完成 ,停止Redis服务 ./redis-cli -h 127.0.0.1 -p 6379 -a "123456" shutdown ## ☆☆☆☆注意事项☆☆☆ ## 在做主动复制时要关闭Linux防火墙 ##1. 临时关闭 systemctl stop firewalld ##2. 禁止开机启动防火墙 systemctl disable firewalld Removed symlink /etc/systemd/system/multi-user.target.wants/firewalld.service. Removed symlink /etc/systemd/system/dbus-org.fedoraproject.FirewallD1.service.
2.3 配置主从复制
配置主从复制:将从服务器的slaveof 指向主服务器,并设置访问密码
连接客户端之后可以,输入info命令可以查看当前redis的信息,可以看出145为主服务器,148服务器为从服务器:
- 注意的地方:关闭所有防火墙
- 如果在集群的时候,之前的主redis同步密码一定要指向。集群的所有服务器都要开启密码
2.4 配置哨兵
我们在从服务器上配置哨兵:
##实现步骤: ##1.将redis根目录下的sentinel.conf 拷贝到etc目录 cp sentinel.conf /usr/local/redis/etc ##2.修改sentinel.conf配置文件,如下配置要修改: ##2.1 sentinel monitor <master-name> <ip> <port> <quorum> ## 主节点名称 IP 端口号 选举次数 ## 关于<quorum> 如果设置为1 , ## 代表至少要有 1 个哨兵认为主节点故障了, ## 才算这个主节点是 客观下线 (odown) 了 sentinel monitor mymaster 192.168.110.133 6379 1 ##2.2 sentinel auth-pass <master-name> <password> ## 如果主节点设置了密码,则需要这个配置,否则哨兵无法对主节点进行监控。 sentinel auth-pass mymaster 123456 ##2.3 sentinel down-after-milliseconds <master-name> <times> ## 每个哨兵节点会定期发送ping命令来判断Redis节点和其余的哨兵节点是否是可达的 ## 如果超过了配置的<times>时间没有收到pong回复 ## 就主观判断节点是不可达的,<times>的单位为毫秒 sentinel down-after-milliseconds mymaster 30 ##2.4 sentinel parallel-syncs <master-name> <nums> ## 当哨兵节点都认为主节点故障时,哨兵投票选出的leader会进行故障转移, ## 选出新的主节点,原来的从节点们会向新的主节点发起复制, ## 这个配置就是控制在故障转移之后,每次可以向新的主节点发起复制的节点的个数, ## 最多为<nums>个, sentinel parallel-syncs mymaster 2 # 做多少合格节点 ##2.5 sentinel failover-timeout <master-name> <times> ## 这个代表哨兵进行故障转移时如果超过了配置的<times>时间就表示故障转移超时失败。 sentinel failover-timeout mymaster 5000
2.5 测试
- 启动哨兵
- 启动redis,先启动主redis,后启动从redis(不然哨兵就意味主redis挂掉了)
##1. 进入到bin目录中,启动哨兵模式 ./redis-server /usr/local/redis/etc/sentinel.conf --sentinel &
- 这个时候启动了三个redis服务器,如果145主服务器挂掉了,主服务器会转移到从服务器上,如果之前的主服务器恢复了,它会变为从服务器。(如果在集群的时候,之前的主redis同步密码一定要指向。集群的所有服务器都要开启密码)
2.6 疑惑(待解决)
现在我并不知道,配置哨兵的时候是随便配置在那一台服务器上都可以,还是配置在从服务器上,而且如果有哨兵配置的服务器挂掉了,那又会发生什么呢?
来源:https://www.cnblogs.com/haoworld/p/redis-shao-bing-ji-zhi.html