大型集团企业云管平台建设参考架构

Posted 华为云开发者社区

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大型集团企业云管平台建设参考架构相关的知识,希望对你有一定的参考价值。

摘要:本文通过对不同的集团企业及国家机构IT治理组织架构提出华为云管平台集中部署、分布式部署、分散独立部署三种方式,实现集团企业IT云时代的治理管控诉求。

本文分享自华为云社区《【华为云Stack】【大架光临】第6期:大型集团企业云管平台建设参考架构》,作者: 华为云Stack云管平台首席架构师 熊洪槐。

一、集团企业云化IT建设及管理问题及诉求

集团企业由于具有多层次组织结构、多元化业务、多地域产业布局等诸多特点,在管理方面面临很大挑战,IT平台已成为集团企业运营管理运作必不可或缺的重要组成部分,是当前集团企业数字化管理升级及数字化生产及创新的核心支撑系统,所以,集团企业IT建设及治理一直是集团企业的投资重点,特别是近5年,在业务数字化转型及云化IT技术驱动之下的建设投资不断增加,据Gartner预测:2021年中国IT支出预计将增长7.2%,2021年全球IT支出预计将增长4%,另外,据iThome 2020年数字化转型领先企业调查报告,数字化领先企业2020年IT投资比例最高达到营收的5.1%(平均4.1%)。然而,另一方面,2019年埃森哲对中国企业IT调查报告显示,具有三分之二的企业对IT投资回报不满意,如何建设好IT、运营好IT、使能企业数字化转型战略实现,是当前政企在数字化、云化IT转型时代面临很大的挑战,对于集团企业尤甚。

对于集团企业,当前云化IT建设过程中存在技术和管理两大问题:

1、“零、散、乱”问题突出,存在重复建设及资源浪费等现状:过去几年,集团企业内部为了满足业务数字化转型诉求,“ 千帆竞渡, 百舸争流“ ,集团、各分支组织纷纷建设各种私有资源池或云平台,满足了当时集团企业起初的IT敏捷和创新诉求,然而它并没有完全彻底改变集团企业IT的孤岛现象,依然存在一系列的业务、数据断点,IT运维及运营管理复杂度反而因为新技术的引入增加了,各分支组织云资源不能共享,资源利用率低,存在较大的浪费。

2、缺少云运营管理体系建设,集团企业云管平台建设能力不足:依然还是采用过去重IT建设及管控、轻运营IT治理管控思路,缺少针对云化IT时代面向集团企业整体的IT服务流程设计及云管平台建设的重视,对“实时体验、敏捷创新、共建共享”的IT云化、服务化目标践行不足,以至于依旧对IT建设价值回报说不清楚,资源占用空转浪费,用户抱怨的周期长,过程繁琐等问题依然存在。

以上两大问题,其实质是要求解决集团企业在近几年业务驱动之下的IT云化大建设中IT治理管控及职责转型问题,需要集团企业IT建设和管理部门回答:

  • 如何打通集团现有或未来分支组织的各个云平台,让IT资源及服务能力在集团企业内部协同共享、甚至能力溢出;
  • 如何支持集团总部及各分支组织之间的责、权、利流程承载,实现集团企业IT有效治理管控,实现放而不乱,活而有序,满足数字化转型时代集团企业对IT敏捷创新,安全稳定兼收良好局面;
  • 如何支持IT职能部门从建、管、维的重复及低效的工作中释放出来,通过云化IT能力平台建设,成为业务数字化转型的技术赋能者和业务创新的推动者
  • 如何从过去只建不营、依靠经验的粗放式IT经营管理模式,转变数据驱动&价值驱动IT精益管理模式

二、华为云管平台ManageOne介绍

如何满足云化时代集团企业IT治理管控诉求,一个匹配集团企业管控架构的IT治理组织及流程、一个好的IT总体架构规划是集团企业是前提,当然顺应IT云化转型时代的IT管理及承载IT治理流程的云管平台是核心,云管平台承载集团企业多云整合、资源自动发放、资源调度及优化,全栈运维管理、服务自助、计量计费、服务支持及等IT管理业务及IT服务流程。

华为公司云管平台ManageOne产品借鉴和吸收华为公司自身数字化转型多年的云化IT管理实践,以数字化驱动引擎、智能化流程引擎及云联邦技术为核心,针对政企IT打造了运维中心、服务中心、运营指挥中心三位一体的云管平台,围绕应用、云服务,云资源全生命周期构筑了面向云化IT时代政企IT全栈、全场景数字化IT作业及管理平台,并以灵活的部署架构可以满足不同集团企业IT组织架构诉求。

ManageOne云管平台包括OC、SC、OCC三个子系统:

运维中心OC:提供开放式、数据驱动的运维框架,集成和整合各个云厂商的运维管理系统,支持8大厂商14类云或虚拟化平台集中运维管理能力,支持统一资源、统一拓扑、统一监控、统一巡检、统一(自动)作业、统一运维报表等运维管理能力,并实现了运维能力向租户(业务IT部门)服务化,实现了业务运维及系统/平台运维数据打通及流程协同,解决了以前系统运维及业务运维数据孤岛及流程断点,通过数字化流程实现了云化全栈数据中心集中运维、智能化协作管理能力,极大提升日常运维管理效率及故障诊断效率。

自助服务中心SC:结合以应用为中心,以企业IT项目运作管控为手段政企IT管理思路,实现了对IT应用、IT基础资源、IT服务生命周期管理及流程支持,通过资源发放及时率KPI为驱动,打造云资源在线交付业务流程,流程高效、责任清晰,通过IT能力服务化、在线化,打造有效的云服务管控流程,实现IT管理部门与业务部门IT服务共建、共享、共治。

运营指挥中心OCC:基于政企IT运营及治理视角,提供人、项目、部门、应用等不同维度的云化数据中心IT资源及IT服务全方位精细化可视分析,为云数据中心高效运营及改进提供科学决策提供支撑;基于一套智能化流程引擎打通IT运维部门、业务IT部门、IT运营部门之间的协同关系,为政企云化IT转型组织提供云化时代的值班监控、事件管理、问题管理、变更管理等领先的IT服务管理流程,并融实时监控大屏、自动决策引擎一起为政企云化IT提供一套联动指挥、察打一体数字化指挥作战平台,使能IT运营从传统管控作战模式转变为以服务为中心的数字化、价值驱动作战模式。

对于集团企业,根据集团企业中央集权、联邦及分散自治三种不同IT治理组织,ManageOne三个子系统提供了灵活的部署能力,满足不同集团企业IT治理管控诉求。

(1)分散独立部署模式,分支云各自运维及运营

分散独立部署模式,集团企业各个分支组织各自建云和独立云管平台,各分支组织独立负责IT项目规划、投资、建设,IT运营及管理由各分支组织自行决定。

此部署模式适应于分散、弱管控IT治理组织集团企业,此部署模式需求响应更为及时,其主要问题是IT资产不能共享,长期来看会导致成本上升,也不能满足集团企业数字化转型对云化IT平台要求。

为了改善集团对各分支组织的IT监督及统筹能力,集团总部建设统一IT运营指挥中心ManageOne OCC,实现集团IT数字化在线可视化运营能力,实现对集团各分支组织IT的监督、集团IT统筹规划及质量运营能力。

(2)集中部署模式,实现集团企业统一运营,统一运维

集中部署模式,就是集团企业建设统一的集团云管平台ManageOne,实现整个集团统一运营,统一运维,如下图:

此部署模式适应于中央集权制IT治理组织架构集团企业,集团公司IT(信息)组织作为和独立分支组织/子公司平行组织存在,其特点是集团对各个分支组织(业务组织)的信息部门具有强有力的管理,集团IT平台采用统筹规划、集中建设,各分支组织只有使用权,并下设子组织实现对各个分支组织或业务部门进行业务支撑。

集中部署模式的优势能够很好地整合及集成集团企业内所有云平台资源及非云化IT资源,实现集团企业IT资源统一共享统一的IT服务台统一IT数字化运营及运维,实现集团内IT资源、平台及人力最大共享,保持集团IT技术架构及标准的一致性,并可以很好提升统一集团IT品牌,提升IT用户体验,甚至为集团IT能力对外溢出打下基础。

(3)分布式部署模式,实现集团企业统一运营,分级运维

分布式部署模式,就是集团企业统一统筹规划云平台及云管平台建设,通过云管平台分布式以,实现整个集团统一运营,分级运维,如下图:

此部署模式适应于联邦制IT治理组织架构集团企业,由IT部门与分支组织联合进行IT管理,各自负有明确的职责。IT治理决策由多部门在衡量各种影响因素之后,此类集团企业的IT准则是强调流程、技术和数据模型等方面的共享和重用,通过IT治理机制及流程协调全局和局部控制之间的关系。

分布式部署模式的优势兼容分散部署及集中部署两种优势,能够实现集团企业IT资源有限共享,并建设集团企业统一的IT服务台及值班管理,实现统一IT数字化运营指挥能力,让集团总部履行IT监督及协调角色,并支撑集团IT的统筹规划,分支组织也具有一定的自主控制权利,快速响应分支组织业务IT诉求。

ManageOne云管平台对集团企业的各个分支云支持完全纳管和联邦接入两种管理方式,完全纳管接入方式只部署ManageOne OC运维中心,保留本地运维能力,自助服务统一接入集团总部ManageOne SC;联邦接入方式则同时保留ManageOne SC和OC,分支组织具备对分支组织内的云服务及资源的发放自主经营权利,跨分支IT资源则到集团云管平台申请。

三、华为云管平台ManageOne的成功实践

2020年初,华为与某国有大行共同建设部署了华为云Stack解决方案,支撑该行总行云、测试云、研发云、分行云、SaaS金融生态云落地。华为ManageOne作为云管理平台,对该行金融云进行服务供应、运营运维,当前该行已实现100%核心业务上云,并经历了多次高峰业务锤炼。

ManageOne提供的AutoOps自动化运维平台,将日常运维如打补丁、巡检、修改密码等动作标准化为场景脚本,部署到海量需维护的设备中,通过立即/定时的批量执行脚本/命令,一键完成维护。当前该行已实现了万级主机批量运维,颠覆了传统运维模式,同时专家的运维经验得到了沉淀和传递。此外,ManageOne提供服务构建器来进行复杂云服务的构建。在双11、纪念币秒杀等大型业务高峰场景前,业务部署效率从小时级缩短为秒级。

点击关注,第一时间了解华为云新鲜技术~

以上是关于大型集团企业云管平台建设参考架构的主要内容,如果未能解决你的问题,请参考以下文章

金融企业云管平台架构设计及难点探讨

某大型金融机构新一代云运营平台的架构设计和实施经验分享

一周活动早知道|多云统一管理平台架构云管平台统一监控数据库智能化运维基于容器云平台的微服务改造等主题线上交流

某集团BI决策系统建设方案分享

集团企业混合多云平台架构设计

Paas云管平台技术架构