技术一个自动化运维案例:通信工程师的噩梦?

Posted 移动Labs

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了技术一个自动化运维案例:通信工程师的噩梦?相关的知识,希望对你有一定的参考价值。

也许你认为要实现“无人驾驶”的网络尚需时日,但这一天并不遥远,我们今天就来讲一个鲜活的案例。

【技术】一个自动化运维案例:通信工程师的噩梦?


网络自动化运维已成为通信业的热门话题之一,毋庸讳言,这将逐渐减少网络运维人工作业,淘汰大量传统通信工程师。


也许你认为要实现“无人驾驶”的网络尚需时日,但这一天并不遥远,我们今天就来讲一个鲜活的案例。


Elisa是芬兰最大的移动运营商,这两年有点“不务正业”,把自己搞得像家设备商,像个传教士一般逢人便推销他们的无人值守网管中心和SON网络解决方案。


面对数据流量快速增长、网络日益复杂、网络质量越来越难于优化和人工成本不断高涨的多重压力,Elisa早在10多年前,也就是3G时代,就开始部署网络自动化系统。

【技术】一个自动化运维案例:通信工程师的噩梦?

2010年,Elisa实现网管中心全自动化,也就是说,我们熟悉的24小时全天候值守的网管中心只需要一人管理即可。


这家运营商表示,自从网管中心实现全自动化,客户投诉量下降了15%,网络异常事件下降了50%(比如主动预防基站空开跳闸停电一类的异常事件)。


电信领域早已实现无人值守基站,但无人值守网管中心还是头一回听说,当Elisa在某次自动化运维论坛上向全球运营商展示他们的成果之时,台下一片惊讶。


这简直有点“毁三观”,基站无人值守是小事,网管中心是网络的心脏,你说无人值守就无人值守,要是自动化流程卡壳,出了大故障怎么办?


Elisa的解释如下:


所谓的无人值守,是指网管中心不再需要网络监控工程师,但维护工程师严阵以待是不可缺少的。也就是说,网络告警和指标异常不再需要人工监控,它通过自动化流程直接通知维护工程师进行处理。不过,该无人网管中心也可自动执行一些简单的操作,比如:


发现基站退服告警后,先通过自动重启基站的方式来预处理。


一群夜以继日坚守网管中心的监控工程师们终于被整得失业了,但Elisa下一步把矛头又对准了那些网优和维护工程师。


这就是Elisa最引以为豪的SON网络。


SON,就是自组织、自管理、自优化,电信领域早在2008年就提出这一概念,SON的终极目标是全闭环的SON,网络运维全自动化,无需人力介入,以大力降低运维成本。


但坦白而言,这玩意一直很失败,究其原因,无非三点:


  • ①运营商不放心将全部工作都交给机器完成。


  • ②运营商以前日子还算过得不错,网络也不是太复杂,对SON的需求不是太迫切。


  • ③涉及多厂家互操作,实现复杂度高。当然,也许设备商也并不愿积极推动。


尽管困难重重,但Elisa一柱擎天,硬是搞出了一个SON样板间,并向全球运营商不遗余力的推销其作品。


他们是怎样推销的呢?


Elisa宣称自己开发了超过60个用例用于网络自动优化和维护,2017年实现75%的网络异常事件自动化解决,正计划在2020年实现网络100%全自动化,也就是著名概念“Zero Touch”网络。


名词解释:Zero Touch是电信领域在向NFV/SDN转型中提出的一个新流行词,你可以把它理解为超级自动化网络。NFV/SDN解耦了传统专用电信设备、打通了网络烟囱式的构架,使能网络更加灵活敏捷,这注定了未来网络部署将工作于高度动态的环境之下,以至于靠人力来决策和操作根本无力满足其动态性和敏捷性,因此有了Zero Touch这一概念。要实现Zero Touch,需要闭环的网络自治系统和无缝的互操作性来实现实时响应网络事件和服务请求。


Elisa表示,他们的SON网络就像装备了魔棒一样发挥着神奇的魔力,每天自动执行超过300万次网络体检和3000次网络配置和参数修改,而这项庞大工程仅需一名优化工程师监督完成即可。


仅需一名优化工程师,简直是赶尽杀绝的节奏。


路测工程师也是不需要的。Elisa通过收集MR数据和智能手机APP来进行“路测”,实现更全面、精准的网络规划。


自从Elisa实施SON以来,不但节省了运维成本,网络质量也得到了大幅提升。


来自Elisa的报告显示,他们的自动化无线接入网运维系统主要从硬件、KPI和Counter三个维度进行自动化分析和执行,如下图:

【技术】一个自动化运维案例:通信工程师的噩梦?


自2014年实现自动化运维以来,靠人工操作的比例大幅下降到10%(下图黄线),网络自动操作数量大幅上升(下图蓝柱)。

【技术】一个自动化运维案例:通信工程师的噩梦?


同时,自动化网络由“被动型”演进为“主动预防型”,因而网络异常事件大幅下降,降低了网络投诉,提升了网络质量(如下图)。

【技术】一个自动化运维案例:通信工程师的噩梦?


Elisa举了一个网络流量均衡的案例。


众所周知,每一个基站地处的环境各不相同,且每周7天、每天24小时内,不同基站下的用户行为是不断变化的,若全网按一套通用参数模板进行调整,显然太过粗犷,传统的做法是依靠经验丰富的网优工程师对每个小区逐一进行分析和调整,这将耗费大量的人力,而随着5G网络致密化和异构化,这一工作量简直无法想象。


为此,Elisa启动了一个项目,通过自动算法对网络中每个小区进行精确的动态调整后,繁忙时段的网络用户速率提升了40%,4G用户投诉率下降50%,网络NPS得分大幅提升,提升了网络效率和质量,改善了用户体验(如下图)。

【技术】一个自动化运维案例:通信工程师的噩梦?

值得一提的是,Elisa表示,尽管取得了可喜的成果,但他们还没有引入人工智能,引入人工智能是他们的下一步计划,并将不断改进SON中的算法。


在全球电信市场陷入持续低迷的困境下,降低运维成本已成为运营商们不得已的选择,Elisa的成绩让绝望的运营商们双眼射了出亮光,这位自动化运维的排头兵不失时机地将其推销大会推向了高潮。


Elisa早在2011年便推出了“不限流量”套餐,这估计是全球最早的“不限流量”套餐。自推出“不限流量”套餐以来,其网络流量逐年成倍上涨,截止2017年底,网络数据流量已增长到6年前的16倍,平均每用户每月消费流量14.8GB(如下图)。

【技术】一个自动化运维案例:通信工程师的噩梦?


可想而知,如此高速的流量增长背后,网络运营成本必然水涨船高,但这家运营商却奇迹的实现了OPEX保持平稳,始终维持低运营成本。

【技术】一个自动化运维案例:通信工程师的噩梦?


如上图,如果单看OPEX支出(蓝色曲线),有些轻微上涨趋势。但如果将其与收入相关联,总OPEX占收入比却呈现下滑趋势。


Elisa认为,正因得益于稳定的OPEX支出,他们每年的利润率始终保持在35%左右。这是他们钱赚的秘密绝招。

【技术】一个自动化运维案例:通信工程师的噩梦?

▲Elisa的收入和EBITDA曲线图


赚钱是大事,但网络自动化之后,通信工程师需求大幅减少,这要裁员多少人?这同样是大事。


Elisa不愿意透露这一敏感数字,只表示他们在网络自动化的同时,一直坚持对员工进行再培训,要求他们能够熟练使用Python语言进行编程,学会编写用于SON的算法,以适应从人工运维向自动化运维全面转型。


Elisa认为,自动化转型的最大挑战在于向企业灌输软件文化,这家运营商对自有员工还算厚道,并没有大量招募软件工程师而抛弃老员工,他们集中精力对现有人员进行再培训,因为网络自动化过程要求工程师们既具备通信网络经验,也要具备编程能力,对现有人员进行编程培训是最佳的选择。


未来已来,只是尚未流行。


在无限流量大战打得火热,量收“剪刀差”持续增大和网络越趋复杂的压力之下,降本增效是必然趋势,国内三大运营商也均提出了智能网络或自动化运维转型的目标,同时,在人工智能、大数据、NFV/SDN等技术趋势之下,我们有理由相信,这一步伐将加速迈进,也许不用像Elisa那样等10年。


要么改变,要么被淘汰,这是一个不得不考虑的问题。


【技术】一个自动化运维案例:通信工程师的噩梦?
世界读书日

WORLD BOOK DAY

2018年4月23日

往期精选:





以上是关于技术一个自动化运维案例:通信工程师的噩梦?的主要内容,如果未能解决你的问题,请参考以下文章

雄文DevOps 能力模型演进及案例剖析 | 高效运维

《Ansible自动化运维:技术与最佳实践》图书已上架,欢迎大家阅读

自动化运维工具---SaltStack安装部署及简单案例

互联网时代的网络自动化运维

新浪微博自动化运维平台实践

程序员应知应会之自动化运维那些事儿