故障切换

最后更新时间:2021-11-30 16:44:07

    自动故障切换

    云数据库 Redis 提供自动故障切换能力,保障服务的可用性,自动故障切换包括 Proxy 节点的故障切换和 Redis Server(Redis 数据存储节点)的故障切换。

    Proxy 故障切换

    云数据库 Redis 标准架构和集群架构都有 Proxy 节点,标准架构的 Proxy 节点数量为3个,集群架构的 Proxy 数量随着分片数量线性增长,Proxy 节点的高可用设计如下:

    • 多个 Proxy 节点保证 Proxy 服务的高可用和负载均衡。
    • Proxy 节点会部署到3个物理设备,以保障高可用。
    • Proxy 节点故障后,拨测系统会检测到节点不可用,并自动补充新的节点。

    Redis Server 故障切换

    Redis 标准架构和集群架构采用的是 Redis Cluster 原生的集群管理机制,依靠集群内节点之间的 Gossip 协议来进行节点状态的判断,节点故障判断的时效性取决于 cluster-node-timeout,默认值是15000ms,建议不要更改该参数。
    节点故障的判断请参考 Redis Cluster 原生设计

    故障模拟

    为了配合业务做故障模拟测试,云数据库 Redis 提供故障模拟功能,您可以在控制台使用故障模拟功能。
    模拟故障原理:通过向所有的 Redis 主节点发送 shutdown 命令,触发系统自动的 HA(High Availability)逻辑来实现故障模拟,仅状态为运行中的实例才能进行故障模拟操作。

    1. 登录 Redis 控制台,在实例列表,单击实例 ID,进入实例管理页面。
    2. 在实例管理页面,选择节点管理页,选择更多操作>模拟故障配置变更>模拟故障

    1. 在弹出的对话框,输入实例密码,单击确定
      注意:

      • 模拟故障将导致 Redis 服务在一定时间范围内不可用,通常故障恢复的时间小于1分钟,如果您正在写入数据,可能会产生数据丢失,请谨慎操作。
      • 故障模拟导致的服务不可用,将不计入 Redis 承诺的服务 SLA 范围内。