华为云计算之双活容灾

Posted 坏坏-5

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了华为云计算之双活容灾相关的知识,希望对你有一定的参考价值。

  • 双活(HyperMetro)

  • 本地双活:距离≤10km

  • 同城双活:距离>10km

  • 没有主备之分,只有本端数据中心和远端数据中心。当一个数据中心的设备故障或数据中心故障,业务会自动切换到另一个数据中心继续运行,不需要人工干预

  • 双活成本较高,需要买远端设备、双活的license,如果两个数据中心距离>10km,还需要买长距离license,超过25km还需要买波分设备

写I/O流程

  • 主机下发写I/O请求到双活管理模块(HM)

  • HM将写I/O请求记录到LOG中

  • HM执行双写操作,向本段和远端的Cache中写I/O

  • 本端和远端的Cache完成写I/O后,向HM返回写I/O的结果

  • 两端Cache都返回结构后,才向主机返回写I/O得结果

  • 如果两端Cache都写成功,则向主机返回写成功,并清理LOG

  • 如果有任意一端写失败,HM则会将LOG转换为DCL(差异位图),记录本端LUN与远端LUN的差异数据

  • 当设备修复后,再根据DCL,将存在差异的数据进行同步,同步完成后,清除DCL,恢复双活

仲裁机制

  • 当双写失败,就会申请仲裁,前提是仲裁服务器没有故障

  • 仲裁过程需要60s

  • 静态优先级模式

  • 适用于在没有第三站点仲裁服务器的场景

  • 当存储系统间链路故障时,优先站点的LUN继续提供服务,非有限站点的LUN暂停提供服务

  • 当优先站点故障时,非优先站点不能自动接管业务,需要人工手动启动非优先站点为主机提供服务

  • 非优先站点故障时,不影响优先站点的业务

  • 仲裁服务器模式

  • 适用于在有第三站点仲裁服务器的场景

  • 当仲裁服务器发生故障,不会影响业务,双活Pair关系也正常,但是仲裁模式会自动变成静态优先级模式

  • 当仲裁服务器与A站点之间的链路故障,不影响业务,双活Pair关系也正常,如果将来A站点和B站点之间的链路发生故障,因为仲裁服务器无法与A站点通信,所以会将业务运行在B站点上

  • A站点发生故障,双活Pair关系断开,双写失败,进行仲裁。B站点继续提供业务,访问A站点的请求会被转移到B站点上

  • A站点与B站点之间的链路出现故障,双写失败,双活Pair关系断开。经过仲裁服务器仲裁后,A站点继续提供业务,B站点会被关闭,所有的数据增长都在A站点

  • 仲裁服务器和A站点都发生故障,双写失败,进行仲裁,但是仲裁服务器发生故障,B站点无法得到仲裁服务器的投票,所以也会关闭自身的服务,业务发生故障,需要人为启动B站点的LUN,提供业务访问

  • 当仲裁服务器与A站点之间的链路故障,A站点与B站点之间的链路故障,双写失败,进行仲裁,A站点关闭自身的业务,B站点将继续运行业务

  • 当A站点故障,仲裁服务器与B站点之间的链路故障,双写失败,进行仲裁,B站点收不到仲裁服务器的投票,关闭自身业务,需要人为启动B站点的LUN,提供业务访问

  • 当仲裁服务器发生故障,AB站点之间的链路发生故障

  • 故障之间的时间间隔在60s以内,静态优先级仲裁模式还没来得及切换,双写失败,进行仲裁,无法得到仲裁服务器的投票,则AB站点都会关闭自身的业务,需要人工启动A站点的LUN,提供业务访问

  • 故障之间的时间间隔在60s以上吗,切换为静态优先级模式,双写失败,进行仲裁,A站内点继续提供业务访问,B站点关闭自身的业务


以上内容均属原创,如有不详或错误,敬请指出。

本文作者: 坏坏

本文链接:http://t.csdn.cn/xdJdc

版权声明: 本博客所有文章转载请联系作者注明出处并附带本文链接!

以上是关于华为云计算之双活容灾的主要内容,如果未能解决你的问题,请参考以下文章

服务器的双活容灾建设如何部署

服务器的双活容灾建设如何部署

混合云应用双活容灾实践

GaussDB(for Redis)双活容灾支持4大应用场景,为业务安全保驾护航

双活容灾的意义

双活容灾的意义