AIOps大神之路

Posted 数据中心D1net

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了AIOps大神之路相关的知识,希望对你有一定的参考价值。

关键讯息,D1时间送达!



不管是AI还是自动化脚本终究都是为运维服务的,最关键的还是必须要搞清运维的工作内容,懂得哪些工作适合用AIOps,哪些工作不适合,不能什么工作都寄希望于AI。


AIOps最近在数据中心圈里常被人所提及,AIOps是何方神物?AIOps的英文全名叫Artificial Intelligence for IT Operations,即智能化运维,目标是基于已有运维数据(日志、监控信息、应用信息等),通过机器学习方式来进一步解决自动化运维所未能解决的问题,提高系统预判能力、稳定性、降低运维成本,提高数据中心竞争力。AIOps是AI、运维和自动化三者的结合体。简单说:AIOps = AI+运维数据+ 自动化处理= AI+Devops,其实就是将AI技术运用到数据中心运维中去,解放人力,这将给数据中心带来翻天覆地的变化,同时也将产生新的岗位需求。数据中心运维一旦插上了AI的翅膀,会飞得越来越高。当然,前提是要掌握飞行的要领。如何迅速成长为一名优秀智能化运维的技术专家,本文将揭开AIOps大神的成长之路。


要想成为一名AIOps技术大神,对AIOps成长史必须是要了解的。AIOps最开始并不叫AIOps,从最原始的人工运维开始,这时主要是利用单独脚本或者一些简单工具,完成数据中心设备的运维;接着不断引入一些工具,通过大量运维工具,提高了运维效率;然后是引入了自动化,将工具交给计算机,由计算机按照既定程度来运行,这比人工方式效率提升很多,往往一次要是通过人手工完成可能需要几个小时,而通过自动化工具和脚本,几秒钟就可以完成,这个阶段叫做Devops,也是目前最为主流的运维方式;紧接着随着AI技术的火爆,AIOps开始出现,AIOps是通过机器的自我学习、自行分析决策和自动化去执行脚本。


AIOps首先要有AI,这是和以往运维最大的区别,AI就是机器学习,这是一门非常复杂的多门类交叉学科,核心是各种各样的技术算法,这些算法可以让机器对输入的数据进行学习和判断,最终形成自己的理解,让机器像人一样去思考遇到的各种问题。AI技术有很多算法,比如分类算法、线性回归、逻辑回归、决策树、关联规则、深度学习等等。数据中心每天产生设备日志、故障表项、配置管理等海量数据,这些都是AI学习的基础数据,这些数据能否学好,AI的算法最为关键,已有的AI算法并不适用于所有数据中心,这就需要在AI学习数据中心运维数据的过程中不断调整算法,所以AIOps大神需要懂AI,最好是AI专业走出的高材生,并愿意走入数据中心运维的岗位中来。数据中心的海量数据各种都有,需要根据不同的数据特征设计算法,达到学习的目的。比如数据中心的所有设备端口流量,通过历史流量模型,可以预测下一次的流量洪峰到来的时间,以便做好预防和保护工作,还可以根据流量模型的异常变化,提前发现网络故障,甚至可通过AI自动地化解危险。AIOps大神要懂得如何将这些AI技术运用到数据中心的运维工作中去,并起到作用。


光有AI显然不够,其次还需要脚本语言。自动化脚本已是数据中心运维不可缺少的重要部分,大量运维的工作都需要通过自动化脚本来监控、操作和变更等,大型数据中心拥有海量设备,单靠人海战术是行不通的。脚本语言比如Python、SQL、TCL等等,这些语言简单易懂,好上手,不会写脚本的运维不算是真正的运维专家,这也是提升运维效率的直接武器,必须要掌握。自动化脚本会被应用到数据中心的各种数据和设备监控中去,有些也可以用于变更操作、网络切换、信息采集甚至故障定位。现在市场上对Python脚本技术人员缺口很大,这类人员的收入也比较高。AIOps也需要脚本,用脚本来采集信息和执行动作,所以脚本语言必须掌握。


不管是AI还是自动化脚本终究都是为运维服务的,最关键的还是必须要搞清运维的工作内容,懂得哪些工作适合用AIOps,哪些工作不适合,不能什么工作都寄希望于AI。在做数据中心运维时,要知道各种指标如何去监控,知道异常检测的方法,知道故障如何去发现,知道性能如何调优等,对数据中心运维的工作了如指掌。数据中心里有很多IT设备,功能各不相同,有搞服务器的,有搞网络的,还有搞安全的等等,网络架构各不相同,这些都需要长时间的接触和沉淀,逐渐找到针对一个数据中心的运维方法。数据中心的运维内容非常庞杂,性能分析、流量监控、设备运行状态采集、故障感知、变更扩容等等,都是运维的工作内容,在数据中心运维的过程中也输出了运维的管理理念和技术办法,部分运维内容还形成了行业标准,运维的工作伴随着数据中心出现就开始了,俨然已经发展成了一门技术学科。数据中心运维不仅是要确保业务长期平稳运行,还要考虑数据中心的经济效益,如果数据中心的业务增长,运维支出也随之增长,那数据中心依然获得不到利润增长,这就要对运维内容做深入剖析,AIOps面对的就是这些运维工作,所以要对运维内容研究透,AIOps才能有的放矢。要想成为AIOps大神,提前必须是一位出色的数据中心运维的技术专家。


这些年,数据中心规模已经变得非常庞大,承载的业务也越来越多和复杂,这都给运维的工作带来了巨大挑战,数据中心运维的工作内容越来越庞杂,也在不断变化,运维成本和压力越来越大,只有引入AIOps才有可能缓解,充分释放人力。看看这两年全球数据中心运维的技术大会内容,基本上讲的都是AIOps,AIOps技术火了,自然对AIOps技术人才需求也多了,趁着AIOps还未普及,赶紧学习,练好AI、脚本和运维三大斧,就离成为AIOps技术大神不远了。


(来源:企业网D1net)


如果您在企业IT、网络、通信行业的某一领域工作,并希望分享观点,欢迎给企业网D1Net投稿AIOps大神之路AIOps大神之路 投稿邮箱:editor@d1net.com

点击蓝色字体关注
企业网D1net已推出企业应用商店(www.enappstore.com),面向企业级软件,SaaS等提供商,提供陈列,点评功能,不参与交易和交付。现可免费入驻,入驻后,可获得在企业网D1net 相应公众号推荐的机会。欢迎入驻。
扫描下方“ 二维 ”即可注册,注册后读者可以点评,厂商可 免费入

以上是关于AIOps大神之路的主要内容,如果未能解决你的问题,请参考以下文章

抓住成本和效率,AIOps 在 360 的探索实践之路

在线教育行业从0到1的 AIOps 之路

从传统运维到AIOps的必经之路

青铜到王者:AIOps 平台在腾讯的升级之路

阿里巴巴智能数据中心 AIOps 演进之路

腾讯专家:AIOps 从 0 到 1,我的学习之路