云上精益运维,ChinaMSP用工具链优化云上管理

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了云上精益运维,ChinaMSP用工具链优化云上管理相关的知识,希望对你有一定的参考价值。

技术分享图片
著名的发明家及工程师、戴森电器品牌创始人詹姆斯·戴森曾说过一句话:“我们的使命很简单,就是解决其他人容易忽略的问题。”这句话不仅对有着110年历史的真空吸尘器有重大价值,也对于有着12年历史的云计算产业来说有着重要意义。随着全球进入云计算的第二个十年,企业对于上云、用云和管云的需求,从最开始的粗放型也逐渐走向精益型,而云计算精益运维的核心就是解决容易被忽略的各种云上问题。

企业上云都遇到了哪些容易被忽略的问题?根据RightScale在2018年初发布的第7次全球云计算状况调查,当时的结果是全球26%的企业每年在公共云上花费超过600万美元、52%的企业每年花费超过120万美元,而20%的企业计划在2018年使公共云支出增加一倍以上、71%的企业将公共云花费增加20%以上。与此同时,云用户低估了云支出的浪费,受访者估计有30%的浪费,而RightScale已经测量了实际浪费达35%。

2018年全球企业上云的前四大需求(超过40%)是优化已用云成本(58%)、把更多的工作负载向云迁移(51%)、更好的财务报表(44%)、面向治理的自动化策略(42%),这些需求的解决方案并不是很高深的技术创新,但正如詹姆斯·戴森所言而是属于“其他人容易忽略的问题”,又是云上精益运营所必须的,正因为如此也导致了整个云管软件的高度碎片化。ChinaMSP是一家2017年11月成立的中国创业公司,该公司的理念就是以“瑞士×××”的方式提供一系列云管工具,而底层是打通的技术平台,解决碎片化云管需求的同时又可扩展。

云原生的迁移工具

技术分享图片
(ChinaMSP CTO 窦雪峰)

在企业上云、用云和管云三部曲中,上云是第一步也是最重要的一步。在RightScale的2018年调查中,81%的企业选择多云策略,公共云采用率从2017年的89%增加到2018年的92%,而2018年私有云采用率则从2017年的72%上升到75%。

无论是私有云还是公有云,企业都面临从原有虚拟机环境向云环境迁移的过程,这个过程的成功与否,直接决定了企业未来在云上能否成功。ChinaMSP CTO窦雪峰在2018年11月24日“打造舒适云途之旅 ——云迁移及管理架构实践与探秘(北京站)”上表示,企业IT服务如果有一个标准的话,那就是业务或者整个数据中心迁移的能力。向云迁移过程中,涉及到从原有虚拟机环境向公有云或私有云的迁移,或者私有云向公有云的迁移,那么如何降低对业务的影响、如何降低迁移的成本、迁移之后能否获得云的敏捷性,决定了上云是否成功。

窦雪峰在加入ChinaMSP之前曾是恒丰银行的技术骨干,参与了恒丰银行包括核心银行系统在内的150余个应用系统向金融云数据中心迁移项目,实现了主要应用系统的云化升级,网上银行、手机银行等面向互联网的应用整体上云。恒丰银行是国内大中型银行中第一个实现生产环境下主要应用系统运行在基于开源OpenStack云平台,也是第一家全面投产上线软件定义网络(SDN)和多租户行业云的大中型银行。
技术分享图片
(向云迁移的五种方式)

窦雪峰表示,企业的向云转型,云迁移是开端,这不仅涉及虚机的迁移,还有数据以及应用的迁移,只有三者都完成了迁移才能是业务的整体迁移,最终实现云上的业务敏捷性。企业的云迁移是云转型的重要支撑,转型的过程要保障三个目标,即:保障业务连续性,降低资源的消耗;改造整个运维体系,特别是形成自服务的云原生运维体系;监控云的运行,以保障故障诊断、定位和排错。

从具体迁移的技术角度来看,企业向云迁移面临三个大难点:

  1. 工程上如何实现灵活组合,企业IT有不同的应用、应用之间还有相互依赖的关系,如何对不同的应用采用更适合的迁移方案,从而保证顺利的迁移过程以及迁移过程中的数据通讯;

  2. 如何实现场景化+标准化,也就是从MSP云服务商的角度来说,在面临更多客户的云迁移工程时,如何批量化操作;

  3. 如何保证业务的稳定,即迁移前后的数据一致性,迁移造成的业务中断时间尽量控制在切换窗口期内、RPO恢复点要尽量为零,以及对源端无影响。

窦雪峰强调,很多企业在迁移上云以后仍然采用应用重装的方式,为什么?原因有多种,其中一条就是工具不成熟。此前已有的各种开源方案和技术,但或多或少都存在着工程上的问题,有的从原数据中心传输到云数据中心时需要中断业务,有的采用安装Agent代理程序的侵入型方案带来风险,有的存在数据丢失的可能性,因此需要更完善的解决方案。

MigFlash是ChinaMSP推出的云原生迁移工具,配合ChinaMSP的云迁移服务,可以较好的解决企业从虚拟化数据中心向云数据中心的整体迁移工作。窦雪峰介绍,MigFlash云迁移工具的特点包括“Any to Any”的全能迁移、“All Online”的业务零影响、Agentless的零侵入方案以及Automated的智能化迁移。其中,“Any to Any”即对迁移源、目标都无限制,一套自动化迁移方案适合物理、虚拟、混合以及基于云的所有工作负载,无论是上云、下云、云间飘移均可高效支持;“All Online”即确保迁移后系统可正常运行,实现业务不停机完成迁移,最大程度消除业务风险;Agentless即对源生产环境更友好,源客户操作系统不需要安装任何代理或其他软件,对企业的生产环境无任何影响;Automated即够自动识别应用、智能匹配资源规格、自动执行包含数十项检查点的迁移预验证,自动启动迁移成功的资源等。

实际上,针对企业上云根据云化成熟程度不同,MigFlash也有不同的子版本。具体来说,向云迁移一共有五种方式,Rehost(云上重新托管)、Replatform(云上环境再造)、Refactor(云上应用重新设计)、Retain(不迁移)、Replace(替换应用)。MigFlash支持其中的Rehost、Replatform、Refactor三种。而对于当前企业最需要的Rehost方式,MigFlash的自动化程度最高。而MigFlash工具配合ChinaMSP的迁移分析、规划、选择路径、迁移执行、建立云管平台、云化改造等完整的云迁移服务,能够保障企业的上云之旅。

云原生的管理与优化工具链

技术分享图片
(ChinaMSP COO 岑义涛)

作为一家成立于2017年11月的MSP云管理服务创业公司,ChinaMSP的商业模式很明确:工具+服务。Gartner对于云MSP的能力定义是:需要在超大规模云服务提供商方面拥有深厚的技术专长,拥有功能强大的云管理平台,尽可能利用自动化的托管服务,能够交付针对云优化的解决方案,不管客户在部署新的云原生应用程序,还是从现有的传统数据中心迁移原有的工作负载。

ChinaMSP选择专注于云迁移和云优化工具领域,而云管平台方面则与国内的另一家创业公司FIT2CLOUD飞致云合作,这两家公司都有网宿科技参与投资。实际上,网宿科技之前的主营业务为CDN业务,也有数据中心IDC资源,随着近几年多云环境和多云管理需求的兴起,网宿科技也投资了ChinaMSP和FIT2CLOUD,通过三家公司的联邦形式组成中国版的RackSpace,为企业提供托管服务、云迁移服务、云管理服务、云管平台等综合云服务。
技术分享图片
(ChinaMSP总结的“公有云费用优化最佳实践”九步路径)

作为提供云管理服务的ChinaMSP,需要设计出一个可以满足企业上云过程中不断演进的工具链,这就是云原生的流程管理工具链。ChinaMSP COO岑义涛在“打造舒适云途之旅 ——云迁移及管理架构实践与探秘”上介绍,ChinaMSP的云原生工具链分为三层:底层是驱动层,通过多云接口适配,连接多云资源,包括AWS、阿里云等公有云以及OpenStack和VMware等私有云和虚拟化环境;中间为能力层,提供FarTag标签策略及自动化以及Cloud DWH云数据仓库,作为一个通用技术平台向上支撑工具层;而上层的工具层,目前则提供了CostVision成本分析与容量规划工具、IAM Manager自动化授权管理工具、云上资产管理的云运维地图工具和云灾备工具。

基于自有的工具链,ChinaMSP可以满足云资源与费用优化、安全监控与审计、云运维和云备份与恢复等精益云管理。ChinaMSP的云原生运维工具链还可以与第三方的云管平台、CMDB运维数据库、服务流程工具、DevOps工具等连通,满足企业用云和管云的全面需求。

作为云计算精益化管理的基础,对云计算资源打标签是必不可少的环节。不少公有云服务都提供粗粒度的资源打标签功能,比如对弹性云服务器、云硬盘、弹性伸缩等资源打标签,但如果要精细化运营和管理云资源,就要更加细腻化的对云资源打标签:一种方式是手工打标签,另一种方式是智能化打标签。ChinaMSP的智能打标签FarTag产品,基于智能映射的方式,优化分组结果:可秒级确认云资源归属的个人、组织、业务,同时发现僵尸资源、无主资源;提供集中化的资源标签展示与管理,无需在不同账号、角色之间切换;且能实现运维自动化及敏捷云管,并与DevOps流程集成,自动化匹配云资源;权限自适应,自动分配资源访问权限,业务变更时也可自适应。

正是基于FarTag产品,向上支撑了精细化的成本分析与容量规划、自动化授权管理、云上资产管理等。岑义涛以AWS公有云的成本与容量规划为例,理论上EC2采购可能出现170万种组合,其费用相差巨大。即使在中国只有宁夏与北京两个区域可选,余下的组合中采用按需付费还预留实例,仍有很多费用可优化的点。

岑义涛强调,建议企业要重视云成本与容量的规划与优化,因为云费用优化的难点在于要懂整个公有云IaaS计费方式,还要懂全栈IT知识、架构优化和业务关系。所以企业需要组成一个懂财务、懂DevOps、懂应用架构设计、懂公有云服务和计费的专家团队,当然也可以选择ChinaMSP的服务。

细腻化的打标签和智能化标签管理,是帮助企业用好云、管好云的第一步。FarTag按技术类、业务类、自动化类、安全类等自适应打标签,然后再把账单按标签拆分到每一个组、每一个人。“只要标签足够多,就可以拆分到更细的颗粒度”,岑义涛表示。此外,还可以把一个企业内不同的账号整合起来做“集合竞价”,也就是AWS对大客户的阶梯计价自动折扣模式。而当AWS的实例升级换代时,费用也有所降低,即使不降低也提高了实例性能,因此也属于成本与容量规划要考虑的范畴。这些其实都是“容易忽略的问题”。

ChinaMSP目前的客户以互联网公司和运营商为主,岑义涛介绍,未来看好传统行业的上云和管云业务。其中互联网公司为ChinaMSP提供了打磨产品的机会,而制造业和工业互联网将是ChinaMSP真正的战场。工具类业务是ChinaMSP坚持的方向之一,目前开发的工具类产品主要针对中国市场用户的需求,同时也在积极争取把自己的工具上架到AWS的全球云市场。

岑义涛表示,ChinaMSP希望成为企业将业务从旧世界迁移到新世界的桥梁,帮助金融、制造、运营商等行业客户站在云端,更舒适、轻松的迈向数字化转型之旅。“尽管新世界并不完美,但它有蓬勃的生命,将在技术和应用双轮驱动下持续生长——云世界正在呼啸而来。”(文/宁川)

以上是关于云上精益运维,ChinaMSP用工具链优化云上管理的主要内容,如果未能解决你的问题,请参考以下文章

云时代,用对工具就能让云上运维工作事半功倍!

阿里云发布多款云管工具,任何角色都可以轻松完成云上运维

基于开源打造智能云上自动运维

龙蜥利器:系统运维工具 SysAK的云上应用性能诊断 | 龙蜥技术

阿里巴巴:云上应用自动化运维管理的最佳实践 | 活动通知

云上Prometheus监控运维最佳实践