全栈混合云综合架构方案研究和落地

Posted 天翼云开发者社区

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了全栈混合云综合架构方案研究和落地相关的知识,希望对你有一定的参考价值。

本文分享自天翼云开发者社区《全栈混合云综合架构方案研究和落地》,作者: y****n

 

(一)业务背景

随着云服务的便利性日益被市场接受,企业客户越来越倾向采用公有云服务补充其现有的企业内部部署的数据中心和私有云基础架构的不足。因此,混合云成为云服务市场的重要发展趋势。广义上讲,混合云的形态可以包括云与云的组合、云与传统IT系统的组合、云与虚拟化技术的组合等,它们可根据具体业务场景需求使用混合IT方式解决具体问题;狭义上讲,混合云指的是至少使用了两种不同部署模式(公有云、私有云、社区云)的云服务。当前,应用较多的混合云形式为公有云+私有云的组合。

现有混合云管理方法主要解决以下四方面痛点问题:

(1) 资源管理:将物理上分散的资源构建成逻辑上统一的云资源池,进行计算、存储及网络资源的统一管理和监控。面临异构兼容,控制融合的挑战。

(2) 运维管理:对所有数据中心的资源进行统一运维,提供集中的告警、日志分析等故障定位手段,提供性能、报表、仪表盘等监控方式。

(3) 服务运营管理:将云资源包装成服务,提供基于服务目录的端到端的服务开通、服务监控、服务计量等一系列服务运营支撑能力。

(4) 统一门户:管理员门户提供资源管理和运维管理的统一界面,对云资源进行统一管理和维护,包括虚拟资源和物理资源。自服务门户提供用户订购云服务,并对已有的虚拟化资产进行管理,包括虚拟资源的使用和释放等。

(二)整体技术架构

天翼云全栈混合云云采用原生云架构,以分布式技术和产品为基础,一套体系支撑所有云产品和云服务,提供完整的云平台开放能力,具备完善的企业级服务特性,具备完善的容灾和备份能力,是一个完全自主可控的云平台。面向企业客户提供资源统一开通、统一运营、统一运维等能力,简化云管理,满足企业容灾备份、应用弹性扩展等场景需求;整合天翼公有云、第三方公有云、私有云能力,提供混合多云管理能力。

(三)高可用架构

高可用性(High Availability)通常来描述一个系统经过专门的设计,从而减少停止服务的时间,而保持其服务的高度可用性的状态。全栈混合云平台,基于资源冗余,故障转发得轻量级策略,在保证从底层资源池到上层接入层得全链路高可用得前提下,资源得使用率是最低的,满足部分资源敏捷化的场景,并且资源在云上和云下均可弹性扩展。

资源高可用:底层的自研的CNP 资源池,均以集群的方式进行部署,包含不限于控制器组件,网元组件,计算组件,存储组件等,保证了底层资源池的可用性和可靠性。

数据高可用:云管平台的控制面数据采用数据持久化到数据库中, 并且数据库采用PXC 模式多主集群提供数据层面服务,每个数据节点均可单独提供数据服务,即使部分节点宕机,其他节点仍可对外提供数据持久化服务,保证业务连续性。

服务高可用:云管平台后台服务单元采用微服务的架构,提供服务集群的方式提供管理服务,包括登录服务,资源开通,平台运营,系统管理,统计监控等。

平台高可用:云管的前端控制台采用双活的方式,保证业务用户使用平台的稳定性,减低平台单点故障带来的业务阻塞的风险,同时提供健康检查的机制,能够及时发现不稳定的前端服务,并做熔断处理。降低业务处理的错误率和异常率。

转发高可用:采用高性能的HaProxy 反向代理和负载均衡软件。进行业务流量的服务代理转发。基于双活的架构,对业务流量进行自动负载转发。并可以配置后端服务健康检查探针,及时洞察后端服务健康状态,根据预置策略,自动进行相关处理。

入口高可用:基于虚拟IP方式,采用业界比较流行的方式Keepalive工具,双机主备的部署,保证流量转发到稳定和高可用,主节点例外宕机, 备节点秒级接管转发流量,保证流量高效稳定的转发。

 

(四)标准部署架构

全栈混合云部署架构采用分层部署的架构,入口组件,云管组件,资源池基础组件,安全组件分开部署的模式。在保证每层高可用的前提下,保证组件之间的逻辑/物理隔离,最大程度减轻组件耦合。提高业务的运维的效率,同时提高系统的可维护性,可扩展性。

入口组件: 主要提供管理流量的过滤和转发,基于虚拟IP 和 Keepalived的组合模式,后端级联路由组件Haproxy,保证流量正确的分发到云管区域。组件基本采用双活的部署模式。

云管组件: 主要部署全栈混合云管理平台,全部采用虚机/容器化部署模式,包括前台web组件, 中台Java组件, 后台的混合云适配组件,缓存Redis组件,RabbitMQ 组件和数据库PXC集群组件等,每个组件采用多活的方式,对外提供服务,降低单点故障

CNP资源池组件:标准的CNP组件的部署模式,典型的组件,包括管理组件,网元组件,计算组件,存储组件。根据天翼云深耕多年的技术沉淀,采用慧匠自动化部署工具,根据业务需求,一键式部署底层全部组件。极大提高了部署交付的效率

安全组件:保证平台基本的安全,包括典型的下一代防护墙,抗Dos设备,堡垒机,密码机等。采用硬件,软件,或者软硬融合的组件,在保证业务高效的前提下,达到内部业务系统的审计和安全防护技术要求并且更好的保障系统的安全稳定运行。

 

(五)容灾部署架构

全栈混合云多Region场景下,支持地域内同城容灾、跨地域异地容灾和跨地域备份,可满足不同行业的灾备等级要求。

1)同城/异地容灾

同城容灾:是在同城或相近区域内 <=200K M )建立两个数据中心 : 一个为数据中心,负责日常生产运行 ; 另一个为灾难备份中心,负责在灾难发生后的应用系统运行。同城灾难备份的数据中心与灾难备份中心的距离比较近,通信线路质量较好,比较容易实现数据的同步 复制 ,保证高度的数据完整性和数据零丢失。同城灾难备份一般用于防范火灾、建筑物破坏、供电故障、计算机系统及人为破坏引起的灾难。

异地容灾:主备中心之间的距离较远 >200KM ) , 因此一般采用异步镜像,会有少量的数据丢失。异地灾难备份不仅可以防范火灾、建筑物破坏等可能遇到的风险隐患,还能够防范战争、地震、水灾等风险。由于同城灾难备份和异地灾难备份各有所长,为达到最理想的防灾效果,数据中心应考虑采用同城和异地各建立一个灾难备份中心的方式解决。

 

 

同地域:采用多AZ 方式保证业务和数据的相关备份,保证区域内高可靠。

DC之间:采用私有云为生产站点主中心,提供服务,同城/异地数据中心为灾备中心,基于云专线异步的方式进行数据同步,底层存储数据(弹性文件,云盘,对象存储)可以利用CDP/Relication工具进行同步,系统故障最大数据丢失量趋于0(RTO≈0),系统故障最长停机时间在5分钟到几小时不等。满足系统容灾要求。

2)公有云容灾

概念:为企业提供业务容灾的灾备方案,相比传统容灾具备了多方面的优势。公有云容灾允许用户将传统的采购模式转化为按服务交付使用的方式,云数据中心的各种资源即开即用,能够快速部署,大幅缩短了灾备中心建设的进程,节约了建设传统灾备中心的时间和金钱成本。让云容灾成为一种普惠型的灾备服务,中小型企业也可以享受到灾备服务,让大型企业可以摆脱传统灾备的高成本负担。

 

 

同地域:采用多AZ 方式保证业务和数据的相关备份,保证区域内高可靠。

公有云为灾备中心:采用私有云为生产站点主中心,提供服务,公有云数据中心为灾备中心,基于云专线异步的方式进行数据同步,最大利用公有云资源巨大弹性和免运维的巨大优势,保证了业务连续性。

 

总结

经过一年多团队的刻苦攻坚,目前全栈混合云1.0版本的方案已经落地多个场景,包括(政务云,一城一池,企业云,能源云)等多个场景,已经有超过近百个客户的实践经验,未来全栈混合云将从“可纳管”到“智能纳管”全面迭代,整体架构将想云原生的方向进行全面转化。行而不辍,未来可期。

 

混合云市场现状与发展趋势研究

 

广义的混合云将涉及云计算的技术全部涵盖在内,包括同构云计算,异构云计算,传统 IT 和云计算的混合,以及包括多云在内的云计算能力。狭义的“混合云”定位在通过私有云确保 IT 服务交付和核心业务安全合规的同时,选择云服务提高 IT 对业务创新的响应速度。

 

混合云定义

 

今天定义的混合云是指由本地基础架构、私有云服务和公有云组成的,包含计算、存储和服务的混合性云环境,各个平台之间通过跨平台联通,使用户拥有基于数据中心的公有、本地和私有云服务的混合云基础架构。混合云由一个或多个公有云和私有云环境组合而成。它是一个由管理及自动化软件编排而成的虚拟资源池,允许用户通过自助服务门户(支持自动扩展和动态资源分配)按需访问其中的资源。

 

虽然构成混合云的公有云和私有云环境都是相互独立的资源池和环境,但是有助于传输资源和工作负载的加密应用编程接口(API)可以简化这些实体间的迁移操作。

 

 

正是借助这个独立的互连架构,企业才能在私有云中运行关键工作负载,减少公有云中的敏感工作负载,并根据需要调用任一环境中的资源。这样安排既可将数据泄漏风险降到最低,还能让企业通过自定义灵活安全的可扩展产品组合来交付各种 IT 资源和服务。

 

混合云的工作原理 

 

混合云架构中的关键技术主要包括:云应用架构、混合云网络、混合云管理(资源、业务、计费)、负载迁移、云爆发、云灾备、互操作性以及一些附加的性能优化技术。现今的混合云环境可能包含内部基础架构、传统虚拟化技术、裸机服务器和各种容器。此外,混合云也可能是由提供商托管的多个公有云组合而成。

 

1)云应用架构

 

应用架构及各个组件的部署位置是构建混合云前首先需要考虑的问题。传统非云环境下,应用系统一般采用 3 层(多层)架构,其中主要包括前端会话层、中间业务逻辑层(可细化为多层)、后端数据存储层。服务器虚拟化技术引入后,应用组件从物理服务器迁移至虚拟机,实现了基于虚拟化的资源灵活扩展,但是,单纯的 P2V 转换仍未改变原有架构本质,即假设底层基础设施可用,这与云环境丰富的高可用特性不符。因此,有必要向传统 3 层架构中增加故障应对和处理机制。

 

2)混合云管理

 

混合云管理平台是实现混合云环境业务、资源、安全等全方位管理的核心集成组件。相对于私有云/公有云管理平台,混合云管理平台需重点考虑云间互操作性、云平台集成、云间连接、性能和容量管理、应用生命周期管理、后端业务目录等。

 

3)负载迁移

 

云间负载迁移的主要需求和驱动力在于迁移、扩展和灾备,其关键技术主要包括:应用和数据迁移、迁移策略及管控、应用流量重定向等。出于技术成熟度和实际业务需求等原因,现有负载均衡场景主要围绕简单的应用/数据迁移、灾备等场景。现有混合云业务多数都提供了负载迁移能力和管理工具,如 VMwarevCloudConnector 组件,是专门用于虚拟机、应用、模板等的迁移管理工具;AmazonAWS 和 VMwarevCHS 混合云服务都专门提供了额外的硬件方式的离线大容量数据的复制服务。

 

总体而言,云应用架构以简化、容错、模块化为设计宗旨,以实现在虚拟化、弹性、多租户云环境中的完美适配。

 

 

混合云平台为组织提供了许多优势,例如更大的灵活性、更多的部署选项、更高的安全性和符合性,并能从其现有基础结构获得更多价值。当计算和处理需求发生变化时,混合云计算使企业能够将其本地基础结构无缝扩展到公有云以处理任何溢出,而无需授予第三方数据中心访问其完整数据的权限。通过在云中运行特定工作负载,组织可以获得公有云提供的灵活性和创新能力,同时将高度敏感的数据保存在自己的数据中心内,满足客户需求或监管要求。

 

混合云用户需求分析

 

当前可以将混合云用户需求分为管理和安全两大类,并具体细分成相关内容。

 

➢ 混合云管理能力体现在以下几方面:

 

1)统一门户:管理员门户提供资源管理和运维管理的统一界面,对云资源进行统一管理和维护,包括虚拟资源和物理资源的统一管理。自服务门户提供用户订购云服务,并对已有的虚拟化资产进行管理,包括虚拟资源的使用和释放等。

 

2)统一云管理:为满足成本、按需、隐私、合规、避免供应商锁定等目的,企业常常会采用多个公有云或私有云,这会造成基础设施资源池多样化,还要面临同时管理物理机、虚拟化等异构资源环境。因此,如何更好地管理多云平台是混合云的关键能力之一。

 

3)资源管理:将物理上分散的资源构建成逻辑上统一的云资源池,进行计算、存储及网络资源统一管理和监控。

 

4)运维管理:对所有数据中心的资源进行统一运维,提供集中的告警、日志分析等故障定位手段,提供性能、报表、仪表盘等监控方式。

 

5)服务运营管理:将云资源包装成服务,提供基于服务目录的端到端服务开通、服务监控、服务计量等一系列服务运营支撑能力。

 

➢ 混合云安全能力体现在以下几方面:

 

1)网络和传输安全:通过安全域划分、虚拟防火墙、VXLAN 等软件定义网络进行网络隔离,避免不同平面的网络间相互影响;通过 HTTPS等安全通信协议、SSL/TLS 等安全加密协议保证传输安全;通过VPN/IPSec,VPN/MPLS 等安全连接方式保证网络连接的可靠性;通过安全组、防火墙、IPD/IDS 等保证边界安全,同时对进出各类网络行为进行安全审计;通过对通信的网络流量进行实时监控,针对 DDoS、Web 攻击进行防御,实现对流量型攻击和应用层攻击的全面防护。

 

2)数据和应用安全:在存储、备份和传输过程中应该对数据进行加密,防止数据被篡改、窃听或者伪造;通过数字签名、时间戳等密码技术保证数据完整性,并在检测到完整性被破坏时采取必要的恢复措施;使用安全接口和权限控制等手段对数据访问权限进行管理,从而避免敏感数据的泄露。

 

3)访问和认证安全:通过基于密码策略、基于角色的分权分域等方式对访问进行控制,防止非授权或越权访问;采用随机生成、加密分发、权限认证方式进行密钥的生成、使用和管理,避免因密钥丢失导致的用户无法访问或数据丢失的风险。

 

4)其他安全:包括但不限于保障主机等基础设施的安全以及通过日志审计等方式对混合云安全进行统一管理。

 

混合云厂商分类 

 

目前国内混合云市场已经成为各厂商竞争的重点,针对混合云市场的解决方案纷纷出台,涉及到虚拟化、云管理平台、服务器、存储、云网络等多个方向的相关解决方案层出不穷。由于混合云建设的复杂性,往往一家厂商很难全面覆盖用户全部需求,因此在一个项目中往往会有多家供应商。当前混合云市场竞争特点也呈现出你中有我,我中有你的态势,市场竞争焦灼,并没有绝对的领先者出现。

 

混合云市场参与厂商众多,竞争逐渐呈现多元化趋势。从厂商来源来看,互联网厂商、IT 厂商、电信运营商、系统集成商等几类厂商都已经参与到了混合云市场的竞争中。目前在混合云市场中还缺乏统一的产业标准,因此互联网公司、IT 公司以及电信运营商之间各有各的技术特点和优势,相互融合程度尚待提高。

 

 

中国混合云产品应用的成长和成熟将取决于两方面。一方面,在应用上,混合云会是大多数企业尤其是中大型企业的长期策略和现实,业务的公有云和私有云分布并非一成不变,企业会根据业务、环境和法规需求动态在公有云和私有云之间平衡应用与数据的分布。同时考虑到混合云在国内企业的采用度跟全球比仍处于较低水平,可以预计在未来几年中国的混合云市场仍将保持高速发展或者迎来爆发。

 

另一方面,在技术上,国内人工智能和大数据产业的快速发展,也为混合云的应用提供了新的契机。近几年,人工智能技术上不断获得突破,行业进入了应用落地和商业化的阶段,针对不同应用场景的技术研发投入持续扩大,AI 算法训练和大数据处理成为企业 IT 的新需求。在这一场景下,数据量大且对计算性能要求较高,但由于仅涉及生产和测试环境,公有云部署显得非必要,且成本相对更高。

 

在实践中,越来越多的企业选择离线训练 AI 算法,将公有云部署的生产环境转为混合云方案。这并不影响正常的研发工作,同时又能够大幅度地节省用云成本,该场景下对算力和性能的高要求又催生出软硬件一体的混合云解决方案。

 

《中国混合云市场现状与发展趋势研究报告》 下载和内容如下:

下载:中国混合云市场现状与发展研究报告

第一章 混合云行业概述 

1、混合云定义 

2、混合云的工作原理 

3、混合云的演化和发展   

4、混合云的优劣势 

第二章 混合云市场发展概述 

1、混合云产品应用场景 

2、混合云用户需求分析 

3、混合云厂商分类 

4、混合云市场厂商评价

第三章 混合云产品市场发展分析 

1、2020 年整体市场规模 

2、2019 年区域结构 

3、2019 年行业结构

4、2019 年市场竞争力象限 

第四章 混合云产品重点厂商介绍 

1、新华三 

2、华为   

3、青云 QingCloud 

4、中国电信 

7、京东智联云

8、九州云 

第五章 混合云产品典型案例介绍 

1、国家电网建立电力云平台 

2、华东勘探院智慧轨交混合云解决方案

3、汽车集团云上统一纳管 

4、天佑儿童医院以混合云提升服务与管理 

5、太平洋保险实现业务快速上线

6、原力动漫云实现网融合远程协助

第六章 2020-2024 年混合云产品发展趋势分析

1、2020-2024 年混合云产品规模 

2、2020-2024 年混合云产品发展趋势

附录 

 

 

相关下载:2021混合云架构改变IT生态

灵云混合多云管理平台白皮书

京东云:私有云和混合云白皮书

云计算2020:多云趋势下的挑战和应对

 

转载申明:转载本号文章请注明作者来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。

 

推荐阅读

更多架构相关技术知识总结请参考“架构师全店铺技术资料打包”相关电子书(37本技术资料打包汇总详情可通过“阅读原文”获取)。

全店内容持续更新,现下单“全店铺技术资料打包(全)”,后续可享全店内容更新“免费”赠阅,价格仅收198元(原总价350元)。

 

温馨提示:

扫描二维码关注公众号,点击阅读原文链接获取架构师技术全店资料打包汇总(全)”电子书资料详情。

以上是关于全栈混合云综合架构方案研究和落地的主要内容,如果未能解决你的问题,请参考以下文章

商业银行混合型数据仓库架构的应用

戴尔和国产虚拟化的故事

云原生实战峰会,云效发布云原生DevOps落地5部曲

华云数据升级发布“信创云基座“ 用“全芯全栈”支持“信创强国”

云原生应用安全落地,你需要了解的容器安全体系

混合云市场现状与发展趋势研究