redis主从复制（2）— replication buffer与replication backlog

博主： cto.wang
发布时间：2015 年 03 月 15 日
378次浏览
暂无评论
1843字数
分类：运维专栏

1、redis主从复制过程 先不解释replication buffer和replication backlog，而先看看redis主从复制的过程。
redis的主从复制分为两个阶段：
1）同步（sync rdb snapshot)：slave复制master的某时间点（t）的全量数据，t为master接收到slave的sync命令后执行rdb bgsave的时间点。2.8增加psync，支持full resync和partial resync命令。master发送rdb文件到slave，slave读取rdb把数据加载到内存。
2）命令传播（commands propagation）：同步时间点t后master上的数据更新到slave上， 发送的数据是redis的命令。
2、replication buffer的作用 redis的slave buffer（replication buffer，master端上）存放的数据是下面三个时间内所有的master数据更新操作。
1）master执行rdb bgsave产生snapshot的时间
2）master发送rdb到slave网络传输时间
3）slave load rdb文件把数据恢复到内存的时间
replication buffer太小会引发的问题：
replication buffer由client-output-buffer-limit slave设置，当这个值太小会导致主从复制链接断开。
1）当master-slave复制连接断开，server端会释放连接相关的数据结构。replication buffer中的数据也就丢失了，此时主从之间重新开始复制过程。
2）还有个更严重的问题，主从复制连接断开，导致主从上出现rdb bgsave和rdb重传操作无限循环。 查看[top redis headaches for devops – replication buffer] 因而推荐把slave replication buffer的hard/soft limit设置成512M
<pre class="brush:python;toolbar:false">config&nbsp;set&nbsp;client-output-buffer-limit&nbsp;&quot;slave&nbsp;536870912&nbsp;536870912&nbsp;0&quot;</pre>
3、replication backlog的出现
在2.8版本，redis使用了新的复制方式，引入了复制积压缓冲（replication backlog）。 查看[Designing Redis replication partial resync] <img src="//cto.wang/usr/uploads/2016/07/20160703180938-10.png" title="1428030898189458.png" alt="1.png" />
上图来自《redis设计与实现》 当主服务器进行命令传播的时候，maser不仅将所有的数据更新命令发送到所有slave的replication buffer，还会写入replication backlog。当断开的slave重新连接上master的时候，slave将会发送psync命令（包含复制的偏移量offset），请求partial resync。如果请求的offset不存在，那么执行全量的sync操作，相当于重新建立主从复制。
4、区分replication buffer 和 replication backlog
1） replication buffer对应于每个slave，通过config set client-output-buffer-limit slave&nbsp;设置。
2） replication backlog是一个环形缓冲区，整个master进程中只会存在一个，所有的slave公用。backlog的大小通过repl-backlog-size参数设置，默认大小是1M，其大小可以根据每秒产生的命令、（master执行rdb bgsave） +（ master发送rdb到slave） + （slave load rdb文件）时间之和来估算积压缓冲区的大小，repl-backlog-size值不小于这两者的乘积。
参考资料：
[1] redis设计与实现（黄健宏）
[2] redis replication(http://redis.io/topics/replication)
[3] [Designing Redis replication partial resync](http://antirez.com/news/31)

最后修改：2021 年 12 月 10 日 10 : 53 AM

如果觉得我的文章对你有用，请随意赞赏