容灾

Posted by eliooyang on 2023-05-26
Words 313 and Reading Time 1 Minutes
Viewed Times

容灾策略

服务容灾保障

  • 限流
  • 切换
  • 关闭有损服务/服务降级-旁路

数据集容灾保障

  • 数据库跨机房,跨层容灾 - 自制兼容mysql协议兼容方案
  • 开源方案
  • 传统银行

架构

manager meta master-and-slave

manager多->zookeeper选主->MGR跨机房容灾

切换机制可靠性

网关(用于鉴权)

数据库备份

  • 3个副本,挂了,一个还需要备份
  • 断网络
  • 备份数据最多节点
  • 数据校准

故障

  • 灰度故障 -> MGR多套
  • 半网故障

设计层面

监控状态:

  1. 配置类
  2. 状态类
  3. 底层依赖

子机事物集合是主机所有的事物。切换机器时,检查gtid,需常态检查,防止平时操作产生gtid。
agent 探测数据库状态,死,活,半活,分布式探测服务。

备份

  1. 增量备份(实时)
  2. 延迟备机(一天)
  3. 全量备份(一周,离线数据)

?怎么确认备份数据是正确的

  1. 备份 -> 恢复到线上的,数据追平 -> 数据正确
  2. modify_time

容灾压测

网络断容演练

  • 网络全断
  • 网络50%断
  • 部分网段断
  • 抖动性断

你的支持是我加班的动力
微信
支付宝

This is copyright.

...

...

00:00
00:00