基于云原生的电信云管理平台的实践与思考
Posted SDNLAB
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于云原生的电信云管理平台的实践与思考相关的知识,希望对你有一定的参考价值。
作者简介:张岩,中国联通企业博士后,现就职于中国联通智网创新中心,目前负责云资源监控管理平台的设计和研发相关工作;李铭轩,中国联通研究院高级工程师,从事技术研发和标准跟踪工作。
本文分别从通信云的机遇和挑战、统一云管平台的部署实践以及通信云未来云原生演进的思考等三个方面讲述中国联通在持续推进网络云化以及云原生演进等方面的经验和思考。
统一云管作为联通运营支撑系统的重要组成部分,在资源管理方面,负责云资源基础设施层(物理资源、虚拟资源)的统一管理,实现对多云资源池的统一纳管。平台提供统一的监控运维管理界面,在对多厂商云池的统一适配下,提供集中监控并管理虚拟化资源和物理资源的拓扑、告警、性能、容量等信息。
随着开源技术在全球范围内的广泛应用,中国联通作为开源社区的参与者和贡献者,实际生产建设项目中积极拥抱开源技术。统一云管的监控功能正是基于Prometheus开源系统实现,用两级架构搭建电信云的初步监控体系架构。Prometheus二级节点负责各个云池内资源信息和数据采集,一级Prometheus集群汇总全部资源池数据,提供数据展示接口,同时支持告警信息订阅,在前端实现各种分类管理功能。整个系统采用云化架构,在联通自建天宫容器云平台内完成搭建,基于开源系统和中间件开展系统研发,目前已成功接入联通5GC云资源池,实现了初步的云资源池管理;未来,统一云管会逐步丰富自身功能,在统一资源管理方面发挥更大的作用。
随着云资源池规模和服务器数量迅速增长,在通信云的管理上带来的挑战主要包括:
遍布全国的DC资源池,需要整体统一的资源调配优化机制;
统一的运维监控,快速故障定位,这方面强调的就是运维功能的挑战;
异构资源池需要统一的运营、运维门户,屏蔽差异,提升服务质量;
云平台数据统一治理,支持自定义扩展,按需开放,租户自服务。
为了应对这些问题,对通信云的架构做出了一些相应设计,设立了统一云管平台来实现统一管理的目标,在管理架构方面,制定了“区域+本地”两级DC架构的布局,在区域DC,用来部署大区级的管理平台如集团OSS、NFVO,各种创新业务平台,以及统一云管平台;另外还包括VNFM以及区域级控制面网元等;本地DC,主要承载转发面网元下沉、边缘计算及接入类网元的按需部署。
portal:统一服务门户,统一认证鉴权
资源管理:负责所有通信云基础设施层(NFVI)资源的统一管理,资源全景视图随时掌控整体资源调配,提供最优云资源配置
统一监控:集中监控并管理虚拟资源和物理资源的拓扑、告警、性能、容量等信息,资源级故障快速定界定位
运维管理:提供统一的运维功能,集中数据治理统一北向接口适配:屏蔽底层不同厂家VIM、PIM的差异性,进行采集接入
作为第一期工作,首先实现统一监控功能和统一北向接口适配层两个组件,在技术选型上,以开源Prometheus为基础,用两级架构搭建电信云的初步监控体系架构。Prometheus二级节点负责各个云池内资源信息和数据采集,一级Prometheus集群汇总全部资源池数据,提供数据展示接口,同时支持告警信息订阅,在前端实现各种分类管理功能。
整个系统采用云化架构,在联通自建天宫容器云平台内完成搭建。基于开源系统和组件开展系统研发任务,实现基础监控功能。
平台采用容器化部署,Prometheus主备模式,实现指标上收及存储、指标数据查询,redis采用三主三备集群模式部署,负责登录认证、数据缓存;mysql采用主备模式部署,负责存储告警明细数据、系统管理数据;kafka采用3节点集群模式部署,负责告警信息接收汇总及向工单系统转发。
统一云管平台设计的难点与NFV三层解耦的难点类似,都面临多厂家云平台接入的问题,设计了基于适配层的多云接入方案来解决这个问题。
适配层首先要支持数据的实时和离线采集,还要做到数据模型的实时转换,驱动和平台分离,插件可以自运维,而且可以单独升级,最后,由于数据敏感,要自主可控,实现厂商中立。那么由这些设计原则,适配层实现了异构数据的采集功能,北向接口的标准化,以及资源数据模型的标准化。
由于工程原因,适配层率先建设完成,在确定Prometheus监控技术栈之后,适配层的性能数据+资源数据接口升级为Prometheus exporter模式,由Prometheus进行拉取,适配层告警数据接口按照统一告警格式要求,实时推送至监控平台Kafka组件,汇总CT云资源告警数据。第三方平台系统通过订阅相应topic来实现实时处理告警数据,实现告警的压缩和故障工单流程。
随着未来以5G、云计算为基础的“新基建”为重点发展方向的推动,以OpenStack为代表的一大批开源社区的项目势必会得到很好的发展和落地,而作为运营商的中国联通也将在实现基础设施架构的全面升级和数字化转型的过程中,积极拥抱开源社区,并将相关成果反馈至开源社区,为开源社区贡献更多更好的实践案例和技术分享。
11月28日,第三届中国SD-WAN峰会将于北京如期召开,扫描下方海报上的二维码报名参会。
若转载文章为原创文章,可在相应文章下或公众号后台留言;
其他非转载类文章须在文首以不小于14号字体标明
转载自SDNLAB
。
欢迎SDN、NFV、边缘计算、SD-WAN、TSN、5G 网络切片等网络方向的观点类、新闻类、技术类稿件。
以上是关于基于云原生的电信云管理平台的实践与思考的主要内容,如果未能解决你的问题,请参考以下文章
云原生架构下复杂工作负载混合调度的思考与实践
构建云原生架构版图:安信证券服务化平台实践
企业数字化转型最佳实践案例:基于云的数字化平台系统安全措施简介与参考
企业数字化转型最佳实践案例:基于云的数字化平台系统安全措施简介与参考
深度解读!阿里统一应用管理架构升级的教训与实践
微博云原生技术的思考与实践