首页 > 技术文章 > MHA高可用和故障切换

zhangyupengzuishuai 2021-09-11 22:27 原文

MHA

概述:

  • 一套优秀的MySQL高可用环境下故障切换主从复制的软件
  • MHA的出现就是解决MYSQL单点的问题
  • MySQL故障过程中,MHA能做到0-30秒内自动完成故障切换
  • MHA能最大程度上保证数据的一致性,以达到真正意义上的高可用

MHA的组成

①MHA Node(数据节点)

  • MHA Node运行在每台MySQL服务器上

②MHA Manager(管理节点)

  • MHA Manager可以单独部署在一台独立的机器上,管理多个master-slave集群;也可以部署在一台slave节点上
  • MHA Manager会定时探测集群中的master节点。但master出现故障的时候,它可以自动将最新数据的slave提升为新的master,然后将所有其他的slave重新执行新的master。整个故障转移过程对应用程序完全透明

MHA的特点

  • 自动故障切换过程中,MHA试图从宕机的主服务器上保存二进制日志,最大程度的保证数据不丢失
  • 使用半同步复制,可以大大降低数据丢失的风险,如果只有一个slave已经收到了最新的二进制日志,MHA可以将最新的二进制日志应用于其他所有的slave服务器上,因此可以保证所有节点数据一致性
  • 目前MHA支持一主多从架构,最少三台服务,即一主两从

搭建MySQL MHA

1、在Master、slave1、slave2节点上安装mysql5.7

 2、修改Master、slave1、slave2节点的主机名

 3、修改节点的MySQL主配置文件

##Master节点

 ##slave1和slave2节点

 4、在Master、slave1和slave2节点上都创建两个软链接

 5、配置mysql一主两从

(1)所有数据库节点进行mysql授权

 (2)在Master节点查看二进制和同步点

 (3)在slave1和slave2节点执行同步操作

 (4)查看数据同步结果

 (5)两个从库必须设置只读模式

 (6)测试

 

 6、安装MHA软件

(1)所有的服务器上都安装MHA的依赖环境,首先安装epel源

 

 (2)安装MHA软件包,先在所有服务器上安装node组件

 

 

 

 (3)在MHA manager节点上安装manager组件

 

 

 

 7、在所有的服务器上配置无密码认证

(1)在manager节点上配置到所有数据库节点的无密码认证

 

 

 

 (2)在 mysql1 上配置到数据库节点 mysql2 和 mysql3 的无密码认证

 

 

 

 (3)在 mysql2 上配置到数据库节点 mysql1 和 mysql3 的无密码认证

 

 (4)在 mysql3 上配置到数据库节点 mysql1 和 mysql2 的无密码认证

 

 8.在 manager 节点上配置 MHA

(1)在 manager 节点上复制相关脚本到/usr/local/bin 目录

 

 (2)复制上述的自动切换时 VIP 管理的脚本到 /usr/local/bin 目录,这里使用master_ip_failover脚本来管理 VIP 和故障切换

 

 (3)修改内容如下:(删除原有内容,直接复制并修改vip相关参数)

 

 (4)创建 MHA 软件目录并拷贝配置文件,这里使用app1.cnf配置文件来管理 mysql 节点服务器

 

 

 9.第一次配置需要在 Master 节点上手动开启虚拟IP

 

 10.在 manager 节点上测试 ssh 无密码认证

11.在 manager 节点上测试 mysql 主从连接情况

 12.在 manager 节点上启动 MHA

13.查看 MHA 状态,可以看到当前的 master 是 Mysql1 节点。

 

 

 14. 查看 MHA 日志,也以看到当前的 master 是 192.168.48.20

 

 15. 查看 Mysql1 的 VIP 地址 192.168.48.111 是否存在,这个 VIP 地址不会因为 manager 节点停止 MHA 服务而消失。

 

 

 

 故障模拟

1、在 manager 节点上监控观察日志记录

 

 2、在 Master 节点 Mysql1 上停止mysql服务

 

 

#正常自动切换一次后,MHA 进程会退出。HMA 会自动修改 app1.cnf 文件内容,将宕机的 mysql1 节点删除。查看 mysql2 是否接管

 

 

 故障切换备选主库的算法

1.一般判断从库的是从(position/GTID)判断优劣,数据有差异,最接近于master的slave,成为备选主。
2.数据一致的情况下,按照配置文件顺序,选择备选主库。
3.设定有权重(candidate_master=1),按照权重强制指定备选主。

  (1)默认情况下如果一个slave落后master 100M的relay logs的话,即使有权重,也会失效。

  (2)如果check_repl_delay=0的话,即使落后很多日志,也强制选择其为备选主。

故障修复

1.修复mysql

 

 2.修复主从

#在现主库服务器 Mysql2 查看二进制文件和同步点

 

 #在原主库服务器 mysql1 执行同步操作

 

 3.在 manager 节点上修改配置文件app1.cnf(再把这个记录添加进去,因为它检测掉失效时候会自动消失)

 

 4.在 manager 节点上启动 MHA

 

 

 

推荐阅读