如何基于虚拟化构建双活数据中心——灾备篇
Posted VMware中国
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何基于虚拟化构建双活数据中心——灾备篇相关的知识,希望对你有一定的参考价值。
2015年VMware vForum大会(北京站和上海站)已经在去年的10月和11月圆满结束了。我们的魏新宇和尤贵贤专家在现场与大家分享了《如何基于虚拟化构建双活数据中心》的课题。本文作者魏新宇专家主要负责介绍了VMware灾备与双活方案。很多小伙伴对此表示出来了较大的兴趣,因此将内容共享给大家,由于内容较多,本次先发布关于灾备部分内容。
谈到灾备,首先谈到灾害。在过去几年中,全球各国经历过许多大范围的灾难,如海啸,地震等。这些是我们从新闻上得知的比较重大的示例,但同时还存在很多范围较小的中断示例,如数据中心断电、数据中心网络中断、主机故障等。行业研究显示,那些经历大规模IT中断后, 无法在特定时间内恢复其IT系统的公司将面临破产。对于剩下的公司而言,中断时间每延长一小时,都必将产生严重的财务损失。那么,我们可以考虑一个问题, 1个小时对于企业来讲值多少钱?
根据相关机构统计,媒体行业停机一小时的损失是6.9万美元;对于零售行业停机一小时的损失是11.3万美元;对于金融行业的信用卡授权业务,停机一小时的损失停机一小时的损失高达645万美元。除了经济损失,业务中断还有导致对公司声誉造成无法估量的无形资产的损失。而采取灾难恢复方案的总花费,平均只有100万美元。所以说,IT 业务系统的连续性对于金融行业来讲尤为重要!
谈到容灾,VMware核心的解决方案是Site Recovery Manager,简称SRM。与传统的容灾解决方案相比,SRM有类似的地方,也有它独特的优势。SRM本质来讲,也是通过控制站点间存储底层存储复制关系或VMware VR复制关系来实现灾备切换。其中VR是VMware提供的免费解决方案,它可以通过在站点间相同或不同存储之间复制虚拟机的VMDK来实现数据保护。VR通过网络复制数据,RPO最短15分钟。如果对RPO要求很高的话,可以采用存储同步同步复制。
当一个站点发生故障时,SRM会自动将故障站点的虚拟机在灾备站点重启,实现灾备切换。虚拟机切切换到灾备站点,IP地址可以不变或者改变,站点切换时还可以定义虚拟机切换的优先级。除此之外,SRM还通过快照技术支持切换演练。
至于在SRM方案中,选择使用VR还是底层存储复制,我们需要从成本、管理、性能三个角度进行考量。SRM+VR成本低,易于管理,但RPO最短为15分钟。SRM+存储复制成本高,但RPO低,或者说是0。 但对带宽要求高。因此,我们在设计方案时,首先应充分考量应用SLA的要求。针对不同的应用,采取不同的方案。
在前面也提到,SRM一个很大的优势是继承了VMware机基因,与vCenter统一集成,操作非常简单。下面我们用实际案例进行说明。
1. 模拟主站点发生故障,即给主站点ESXi断电,我们可以看到主站点虚拟机已经断开。
4. 执行恢复计划里的“恢复”操作,“恢复类型”选择“灾难恢复”,“我知道该过程将永久改变虚拟机及受保护数据中心和恢复数据中心的基础架构”
6. 灾备切换开始,过一会,虚拟会在灾备站点重启。
将主站点主机、网络强行断电,在容灾站点执行恢复计划RecoveryPlan01。
2. 执行恢复计划会中止主站点的VM,中止阵列复制。
3. 恢复计划完成后,主站点会被视为已失效,底层阵列的复制也被中止。容灾站点的ESXi会在VC的指挥下挂接之前一直在做同步的LUN(与主站点做同步复制时这些LUN是无法被ESXi挂接的),然后启动受保护的VM。
有一个真实的案例,可以说明客户如何在灾难发生之前,利用SRM将企业应用迁移走, 而使应用免受灾难造成业务损失。
客户两个站点分别位于日本两个城市。主生产在数据中心1,灾备站点在数据中心2。
(1)在某一天下午2:46,距离主数据中心45英里以外的海域发生地震,地震随后引发了海啸。
(2)在3分钟后,主数据中心当地政府发布海啸预警。
(3)几分钟后,该公司IT部门迅速作出决策,进行灾备切换。
切换的时候,根据恢复计划的设置,Tier1关键业务虚拟机先进行切换。关键业务切换后,tier2和tier3虚拟机再进行切换。
(4)当海啸在数据中心1所在地发生之前,客户数据中心1的业务都已经切换数据中心2,也就是灾备中心。成功避免了由于灾害影响到业务。
总结:无论从容灾的成本、可操作性、可维护性来讲,SRM无疑是vSphere虚拟化环境下最好的容灾方案。
关于双活篇的介绍,小编将在下期内容中进行介绍,敬请期待!
VMware中国
VMware中国研发中心
VMware招聘
亨利笔记(henglibiji)
容器和云原生应用
张海宁,研发中心首席架构师
最终用户计算(CHINAEUC)
桌面与应用虚拟化
吴孔辉,VMware架构师
疯云时代(crazycloudtime)
基础架构和应用服务
臧铁军,VMware架构师
大卫分享(david-share)
SDDC与IT管理
魏新宇,VMware金融行业售前
IT那些事儿(IT-Review)
尤贵贤,资深技术顾问
以上是关于如何基于虚拟化构建双活数据中心——灾备篇的主要内容,如果未能解决你的问题,请参考以下文章
服务器的双活容灾建设如何部署
服务器的双活容灾建设如何部署
科技云报道:金融级高可用!天翼云TeleDB数据库如何实现容灾双活?
实战Kafka之异地双活--MirrorMaker1.0
双活数据建设方案
双活数据中心构建方法及实现技术