MySQL主从复制,读写分离架构延时长,要怎么优化?

2018-10-1509:41:42数据库教程Comments2,329 views字数 1890阅读模式

MySQL主从复制读写分离是互联网常见的数据库架构,该架构最令人诟病的地方就是,在数据量较大并发量较大的场景下,主从延时会比较严重。

 文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

为什么主从延时这么大?文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

MySQL主从复制,读写分离架构延时长,要怎么优化?
:MySQL使用单线程重放RelayLog。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

 文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

应该怎么优化,缩短重放时间?文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

:多线程并行重放RelayLog可以缩短时间。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

 文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

多线程并行重放RelayLog有什么问题?

MySQL主从复制,读写分离架构延时长,要怎么优化?
:需要考虑如何分割RelayLog,才能够让多个数据库实例多个线程并行重放RelayLog,不会出现不一致。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

为什么会出现不一致?文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

:如果RelayLog随机的分配给不同的重放线程,假设RelayLog中有这样三条串行的修改记录:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

update account set money=100 where uid=58;文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

update account set money=150 where uid=58;文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

update account set money=200 where uid=58;文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

如果单线程串行重放:能保证所有从库与主库的执行序列一致。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

画外音:最后money都将为200。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

如果多线程随机分配重放:多重放线程并发执行这3个语句,谁最后执行是不确定的,最终从库数据可能与主库不同。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

画外音:多个从库可能money为100,150,200不确定。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

 文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

如何分配,多个从库多线程重放,也能得到一致的数据呢?文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

:相同库上的写操作,用相同的线程来重放RelayLog;不同库上的写操作,可以并发用多个线程并发来重放RelayLog。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

MySQL主从复制,读写分离架构延时长,要怎么优化?文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

如何做到呢?文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

:设计一个哈希算法,hash(db-name) % thread-num,库名hash之后再模上线程数,就能很轻易做到,同一个库上的写操作,被同一个重放线程串行执行。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

画外音:不同库上的重放,是并行的,就起到了加速做用。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

 文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

这个方案有什么不足?文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

:很多公司对MySQL的使用是“单库多表”,如果是这样的话,仍然只有一个库,还是不能提高RelayLog的重放速度。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

 文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

启示:将“单库多表”的DB架构模式升级为“多库多表”的DB架构模式。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

画外音:数据量大并发量大的互联网业务场景,“多库”模式还具备着其他很多优势,例如:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

(1)非常方便的实例扩展:DBA很容易将不同的库扩展到不同的实例上;文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

(2)按照业务进行库隔离:业务解耦,进行业务隔离,减少耦合与相互影响;文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

(3)非常方便微服务拆分:每个服务拥有自己的实例就方便了;文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

“单库多表”的场景,多线程并行重放RelayLog还能怎么优化?文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

:即使只有一个库,事务在主库上也是并发执行的,既然在主库上可以并行执行,在从库上也应该能够并行执行呀?文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

新思路:将主库上同时并行执行的事务,分为一组,编一个号,这些事务在从库上的回放可以并行执行(事务在主库上的执行都进入到prepare阶段,说明事务之间没有冲突,否则就不可能提交),没错,MySQL正是这么做的。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

 文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

解法:基于GTID的并行复制。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

从MySQL5.7开始,将组提交的信息存放在GTID中,使用mysqlbinlog工具,可以看到组提交内部的信息:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

20181014 23:52 server_id 58 XXX GTID last_committed=0 sequence_numer=1文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

20181014 23:52 server_id 58 XXX GTID last_committed=0 sequence_numer=2文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

20181014 23:52 server_id 58 XXX GTID last_committed=0 sequence_numer=3文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

20181014 23:52 server_id 58 XXX GTID last_committed=0 sequence_numer=4文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

MySQL主从复制,读写分离架构延时长,要怎么优化?
和原来的日志相比,多了last_committed和sequence_number。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

什么是last_committed?文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

答:它是事务提交时,上次事务提交的编号,如果具备相同的last_committed,说明它们在一个组内,可以并发回放执行。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

 文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

总结

MySQL并行复制,缩短主从同步时延的方法,体现着这样的一些架构思想:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

  • 多线程是一种常见的缩短执行时间的方法;

画外音:例如,很多crontab可以用多线程,切分数据,并行执行。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

  • 多线程并发分派任务时,必须保证幂等性:MySQL提供了“按照库幂等”,“按照commit_id幂等”两种方式,很值得借鉴;

画外音:例如,群消息,可以按照group_id幂等;用户消息,可以按照user_id幂等。文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

 文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

具体到MySQL主从同步延时:文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html

  • mysql5.5:不支持并行复制,大伙快升级MySQL版本;
  • mysql5.6:按照库并行复制,建议使用“多库”架构;
  • mysql5.7:按照GTID并行复制;
文章源自菜鸟学院-https://www.cainiaoxueyuan.com/sjk/6672.html
  • 本站内容整理自互联网,仅提供信息存储空间服务,以方便学习之用。如对文章、图片、字体等版权有疑问,请在下方留言,管理员看到后,将第一时间进行处理。
  • 转载请务必保留本文链接:https://www.cainiaoxueyuan.com/sjk/6672.html

Comment

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

确定