Redis系列深度好文:深入学习Redis
一. 概念
二. 配置方式
2.1 客户端命令
在从服务器上执行 slaveof masterIP masterPort;
2.2 配置文件
在配置文件中配置 slaveof <masterip> <masterport>;除了IP和端口信息外,还可以配置其他主从信息;
三. 旧版复制功能的实现(Redis2.8以前的版本)
slave 向 master 发送 slaveof 命令后,slave先进行同步操作,再进行命令传播;
Redis的复制功能主要分为同步(sync)和命令传播(command propagate)两个操作;
先通过同步将master和slave的数据库状态达到一致,然后通过命令传播实时的将master的变化同步到slave;
同步:将 slave 的状态更新为和 master 一样的状态;
命令传播:master 被修改时将变化实时的同步到 slave;
3.1 同步
- slave向master发送sync命令;
- master收到sync命令后先执行bgsave命令,后台生成一个RDB文件,同时用一个缓冲区记录从现在开始执行的写命令;
- master将生成的RDB文件发送给slave;
- 将缓冲区的写命令发送给slave;
3.2 命令传播
同步操作执行完毕后,master将自己执行的写命令发送给slave,slave执行命令,master和slave保持一致;
3.3 旧版复制功能的缺陷
复制的两种情况:
初次复制:slave没有复制过任何主服务器,或者复制的主服务器和上次的不同;
断线重连后复制:命令传播阶段的master和slave断连,重新连接后重新复制(先进行同步,再进行命令传播),效率较低;
3.4 sync命令非常消耗资源
- maser执行bgsave,耗费大量的CPU,内存和IO资源;
- RDB文件传输耗费网络资源;
- slave载入RDB文件时发生阻塞;
4. 新版复制功能的实现(Redis2.8版本开始)
为了解决断线重连后复制的低效问题,Redis2.8版本开始使用PSYNC命令代替SYNC命令;
4.1 PSYNC的两种模式
- 完整重同步:用于初次复制的情况。和sync命令一样,master创建RDB文件,在缓冲区保存之后的写命令,然后发送给slave;
- 部分重同步:用于断线重连后重复制的情况。master和slave断连后重新建立连接,如果条件允许,master可以只将断连期间的写命令发送给slave,这样也可以完成同步,而且效率很高。
4.2 部分重同步的实现
部分重同步主要由以下三个部分构成:
- master和slave的复制偏移量;
- master的复制积压缓冲区;
- 服务器的运行ID;
重连后slave将自己的偏移量发送给master,master就知道slave需要同步哪些数据。至于是完整重同步还是部分重同步则根据slave的复制偏移量和积压缓冲区的关系进行选择;
4.2.1 复制偏移量
master和slave各自维持一个复制偏移量。根据偏移量即可判断master和slave是否一致。
master每次想slave传播N个字节,就将自己的复制偏移量+N;
slave每次收到N个字节,就将自己的复制偏移量+N;
4.2.2 复制积压缓冲区
复制积压缓冲区是由master维护的一个固定长度的先进先出队列,默认在1MB。用于保存一定数量最新的写命令。
master将命令传播给slave时,还会将命令写入复制积压缓冲区里面;
重连后master收到的slave的复制偏移量在复制积压缓冲区中,表明需要同步的数据全部可以再复制积压缓冲区中取到,则进行部分重同步;否则进行完全重同步。
合理的设置复制积压缓冲区的大小可以有效的利用部分重同步模式;
大小公式:缓冲区大小 = 断连时间秒数 * 每秒的写命令;
4.2.3 服务器运行ID
每个Redis服务器都有自己的运行ID,它在服务器启动时生成,由40个随机的16进制字符组成。
初次复制时,master将自己的运行ID发送给slave并保存;
master和slave断线重连后,slave将保存的master运行ID发送给当前连接的主服务器。
发送的ID和当前主服务器ID一致则尝试进行部分重同步,否则进行完整重同步;
4.3 PSYNC命令的实现
- slave没复制过任何master或者执行过 slaveof no one:slave发送PSYNC ? -1命令,请求完整重同步;
- slave复制过master:slave发送 PSYNC <runid> <offset>,master自己判断进行何种同步;
- master 返回 +FULLRESYNC <runid> <offset> 回复,则进行完整重同步,slave保存这个 runid,并将该 offset 作为自己的初始化 offset;
- master 返回 +CONTINUE 回复,则进行部分重同步,slave等待数据即可;
- master 返回 - ERR,表示master版本低于2.8;则slave发送 SYNC 命令,进行完整重同步;
5. 复制的实现
slave向master发送 slaveof 命令后开始进行复制,以下为详细步骤:
5.1 设置主服务器的IP地址和端口
slaveof 是一个异步的命令。
对slave执行 slaveof masterIP masterPort 后,slave 将 master的信息保存到服务器状态的 masterhost 属性和 masterport 属性,属性设置完成后立即返回 OK,表示复制指令已经被接收,实际的复制工作在OK返回之后开始执行。
5.2 建立套接字连接
slaveof 命令执行后,slave 根据命令设置的IP和端口创建套接字连接,连接建立成功后;
slave 为套接字关联一个处理复制工作的文件事件处理器,负责接收RDB文件以及传播的命令;
master 为该套接字创建相应的客户端状态,将 slave 看作一个连接到 master 的客户端对待;slave 可以向 master 发送命令请求,master 则向 slave 返回命令回复;
5.3 发送PING命令
slave 成为 master 的客户端后,先向 master 发送一个 PING 命令,他有两个作用;
- 检查套接字的读写状态是否正常;
- 检查 master 能否正常处理命令请求;
salve 发送 PING 命令后将遇到以下三种情况之一:
- master 返回一个命令回复, slave 不能再规定时间内取出回复的内容。此时表示网络连接状态不佳,master 和 slave 断开连接后重新建立套接字连接;
- master 返回一个错误。表示 master 暂时不能处理 slave 的命令请求。master 和 slave 断开连接后重新建立套接字连接;
- slave 收到 PONG 回复。表示连接正常,继续执行下一个步骤;
5.4 身份验证
slave 收到 PONG 回复后,下一步决定是否进行身份验证:
- 如果 slave 设置的 masterauth选项,则进行身份验证;
- 否则,不进行身份验证;
若进行身份验证, slave 发送 auth masterauth属性值 命令;
身份验证阶段可能会有以下三种情况:
- master 未设置 requirepass 选项, slave 未设置 masterauth 选项,则继续执行复制工作;
- salve 的 auth 命令发送的密码和 master 设置的 requirepass 相同,复制工作继续执行,否则 返回一个 invalid password 错误;
- master 设置了 requirepass 选项, slave 未设置 masterauth 选项,master 返回一个 NOAUTH 错误;如果master 未设置 requirepass 选项, slave 设置了 masterauth 选项,则master 返回 no password is set 错误;
5.5 发送端口信息
slave 执行命令 REPLCONF listening-port <port-number>,向 master 发送自己的监听端口号;
master 将端口号记录在 slave 对应客户端状态的 slave_listening_port 属性中,唯一作用是在 master 执行 INFO replication 命令时打印出 slave 的端口号;
5.6 同步
这一步 slave 向 master 发送 PSYNC 命令,进行同步操作;
同步操作之前,只有 slave 是 master 的客户端,执行之后 master 也成为 slave 的客户端;
- 若 PSYNC 执行完整重同步,master 成为 slave 的客户端后才能将缓冲区的命令发送给 slave 执行;
- 若 PSYNC 执行部分重同步,master 成为 slave 的客户端后才能向 slave 发送缓冲区的写命令;
master 和 slave 互为对方的客户端,可以互相发送命令请求,互相进行命令回复。
5.7 命令传播
同步之后,master 进入命令传播阶段,master 一直将自己的写命令发送给 salve ,slave 一直接收并执行写命令。
6. 心跳检测
命令传播阶段,salve 默认以每秒一次的频率向 master 发送 REPLCONF ACK <replication_offset(slave的当前复制偏移量)>,主要有以下三个作用;
- 检测主从服务器的网络连接状态;
- 辅助实现 min-slaves 选项;
- 检测命令丢失;
6.1 检测主从服务器的网络连接状态
master 和 slave 通过发送和接收 REPLCONF ACK 命令检测两者之间的网络连接状态;
maser 超过一秒未接收到 slave 发送的 REPLCONF ACK ,master 就知道连接出现问题了;
通过向 master 发送 info replication 命令,在 lag 一栏中可以看到 slave 最后一次发送 REPLCONF ACK 命令距离现在过了多少秒了;
6.2 辅助实现 min-slaves 选项
Redis 的 min-slaves-to-write 和 min-slaves-max-lag 选项可以防止 master 在不安全的情况下执行写命令;
min-slaves-to-write 3
min-slaves-max-lag 10
salve 数量属于3个,或者3个slave 的延迟值都大于等于10秒,master 拒绝执行写命令;
6.3 检测命令丢失
若因为网络故障导致 master 发送的 写命令丢失,则 slave 发送 REPLCONF ACK 时,master 发现复制偏移量不一致,则将复制积压缓冲区的缺失命令补发给 slave;
这和部分重同步不一样,命令补发在没有断线的情况下进行的,部分重同步在断线重连后进行。
来源:https://www.cnblogs.com/virgosnail/p/9858662.html