原创作者: 爱可生开源社区
MySQL 的复制延迟在早期版本一直存在,MySQL 5.6.3 版本后开始支持并行复制,并在 5.7进一步完善可用并行复制功能,官方将该功能称为 enhanced multi-threaded slave(简称 MTS),从此复制延迟问题得到很大的改善。
功能背景
DTLE([爱可生数据传输组件])项目组在 2018年9月4日提出内部功能性需求(issue #211)实现支持 MTS 并行回放功能。
https://github.com/actiontech/dtle
1.MTS (MySQL 5.7) 原理三问
1)首要问题:哪些 TX 可以并行回放?(无冲突!!!)
- 同一 group_commit 的 TX 可以并行回放,因为这些 TX 都进入了 prepare 阶段,事务之间无冲突。
2)如何记录同一 group_commit ?
-
每个 TX 都有 sequence number,同一个 binlog file 中 SeqNum 单调递增
-
group_commit 时记录上一次 (group_) commit 的 TX 的 sequence number, 称为 LastCommit (LC)
3)如何并行回放?
-
LC 相同的 TX 可以并行回放
-
LC 更大的 TX 需等待前一组 TX 全部执行完
(MySQL 8.0 引入 WriteSet 并行回放,另议)
想了解更多关于 MTS 的内容可翻阅社区文章
图解MySQL | [原理解析] MySQL组提交(group commit)
2.MySQL 5.7 如何开启 MTS 支持
设置组提交相关参数参数,之前的版本这两个参数不存在。
1. -- group_commit 等待时间. 大则并行度提高, 但可能造成空等导致响应变慢
2. set global binlog_group_commit_sync_delay=10000; -- 10ms
3. -- group_commit 立即提交TX数量: 即使等待时间未达到, 积压的TX达到此数量则立刻提交
4. set global binlog_group_commit_sync_no_delay_count=32; -- less or equal to thread number
3.为 DTLE 配置支持 MTS 的 job
事先配置 一个 DTLE 的 job.json 文件,需要将 ParallelWorkers 参数设置为为并行的线程数
1. {
2. "Type": "Dest",
3. "NodeName": "udup1",
4. "Driver": "MySQL",
5. "Config": {
6. "Gtid": "",
7. "ApproveHeterogeneous":true,
8. "ReplChanBufferSize": 600,
9. "ParallelWorkers": 16,
10. "ConnectionConfig": {
11. "Host":"127.0.0.1",
12. "Port": 3308,
13. "User": "root",
14. "Password": "password"
15. }
16. }
17. }
注意:MTS仅影响增量复制
4.生成 MTS 数据
1. 纯 INSERT(可用于性能 benchmark, 无益于正确性检测)。生成器:
https://github.com/actiontech/dtle/files/3372365/main.go.zip
2. 通过 sysbench 等多线程写入(增+删+改)。
5.观察 MTS Binlog
dtle/helper/mtswatcher/mtswatcher.go
1. cd dtle
2. make mtswatcher
3. # auto get newest gtid
4. ./dist/mtswatcher -host 127.0.0.1 -port 3308 -user root -password password
5. # or assign an (executed) gtid
6. ./dist/mtswatcher -host 127.0.0.1 -port 3308 -user root -password password -gtid "f2a4aa16-c8e6-11e7-9ff0-e19f7778f563:1-860460"
输出:属于同一 LC 的 TX 数量
1. lc: 4065 nTxOfThisLc: 16 totalTx: 4077
2. lc: 4081 nTxOfThisLc: 16 totalTx: 4093
3. lc: 4097 nTxOfThisLc: 6 totalTx: 4099
4. lc: 4103 nTxOfThisLc: 1 totalTx: 4100
5. lc: 4104 nTxOfThisLc: 16 totalTx: 4116
6. lc: 4120 nTxOfThisLc: 16 totalTx: 4132
6.版本注意
- 5.7 -> 5.6
∘依旧可并行回放
- 5.6 -> 5.*
∘如果 seq 为 0,则将其视为 5.6 binlogEntry 并按顺序重播。
7.简单测试
使用如上生成器生成 64000 rows(MySQL 并行度 64)
1. -- 目标端
2. set global binlog_group_commit_sync_delay = 10000; -- 10000us = 10ms
3. set global binlog_group_commit_sync_no_delay_count = 16;
-
回放全部64000行,"ParallelWorkers": 16,花费时间:1m21s
-
在上述时间(1m21s)内,使用MTS代码进行单线程回放可以回放9815 行
-
在上述时间内,使用老版代码回放,可以回放8942 行
MTS回放速度是单线程的6倍左右!!!
8.总结
DTLE 不仅关注数据传输的效率,也可优化数据回放效率,能够很好的支持 MySQL 的MTS功能实现数据的并行回放。在回放过程中,在源端的 MySQL 中提前设置好恰当的 MTS 的参数,再根据 DTLE 的配置,即可利用 MySQL 5.7 的 MTS 机制增加回放速度。
来源:oschina
链接:https://my.oschina.net/u/3883885/blog/3074140