容灾策略
服务容灾保障
- 限流
- 切换
- 关闭有损服务/服务降级-旁路
数据集容灾保障
- 数据库跨机房,跨层容灾 - 自制兼容mysql协议兼容方案
- 开源方案
- 传统银行
架构
manager meta master-and-slave
manager多->zookeeper选主->MGR跨机房容灾
切换机制可靠性
网关(用于鉴权)
数据库备份
- 3个副本,挂了,一个还需要备份
- 断网络
- 备份数据最多节点
- 数据校准
故障
- 灰度故障 -> MGR多套
- 半网故障
设计层面
监控状态:
- 配置类
- 状态类
- 底层依赖
子机事物集合是主机所有的事物。切换机器时,检查gtid,需常态检查,防止平时操作产生gtid。
agent 探测数据库状态,死,活,半活,分布式探测服务。
备份
- 增量备份(实时)
- 延迟备机(一天)
- 全量备份(一周,离线数据)
?怎么确认备份数据是正确的
- 备份 -> 恢复到线上的,数据追平 -> 数据正确
- modify_time
容灾压测
网络断容演练
- 网络全断
- 网络50%断
- 部分网段断
- 抖动性断
你的支持是我加班的动力
微信
支付宝
微信
支付宝

...
...
00:00
00:00
This is copyright.