面对自动化运维智能化运维,我们应该开始学习什么?

Posted twt企业IT社区

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了面对自动化运维智能化运维,我们应该开始学习什么?相关的知识,希望对你有一定的参考价值。






早期的运维工作大部分是由运维人员手工完成,这种运维模式不仅低效,也消耗了大量的人力资源。利用工具来实现大规模和批量化的自动化运维,能极大地减少人力成本,降低操作风险,提高运维效率。但是自动化运维的本质依然是人与自动化工具相结合的运维模式,受限于人类自身的生理极限以及认识的局限,无法持续地面向大规模、高复杂性的系统提供高质量的运维服务。智能化运维AIOps(Artificial Intelligence for IT Operations)将人工智能应用于运维领域,基于已有的运维数据(日志、监控信息、应用信息等),通过机器学习的方式来进一步解决自动化运维没办法解决的问题。
近年来,自动化运维在企业逐步广泛应用,并最终将向智能化运维发展,在此过程中,运维人员应该如何确保跟上技术趋势,不失去自身的价值?以下内容来自社区金融行业专家分享及部分文章摘录,谨为大家提供参考和启发。


运维人员需要学习哪些知识去提高自己的价值?自动化运维的要求很高,不仅仅需要具备开发能力,对网络、硬件、操作系统这些也要具备才可以。但是不知道如何下手?从何开始?

个人建议专业的人做专业的事,能够各个专业领域通达兼济是难得的。从传统企业来说,自动化运维的建设需要一个团队或者多个团队协作,而且也应该将各方面力量拉拢一起做这件事。

从自己熟悉的专业领域做起,了解日常工作中重复事项哪些可以由机器替代,可以采用什么技术替代。在开发能力上可以关注shell或Python等语言,工具搭建上可以从ansible等开源软件熟悉。(@zjwy82 某银行系统架构师)

运维人员能力要求可大可小,最好是对业务与技术都了解,对开发能力要求其实并不高。但对数据库和脚本编程最好精通些,这样各种运维才能得心应手。@mornsky 某银行架构师)


自动化运维人员需要具备哪些基本技能?对于传统运维人员如何需要加强那些方面知识的学习。

从我们目前的实施应用情况来看,自动化运维工作在基础平台搭建完成后,更多的是脚本开发能力,从初期来看需要关注各类脚本的编写能力。同时,自动化运维后需要运维人员对方案制定与评估更为审慎,那么对业务系统架构与关联分析要更严谨。

因此建议传统运维人员在脚本开发能力(shell、python)、应用架构设计(网络控制、集群管理、负载均衡等)等方面多做些了解。(@zjwy82 某银行系统架构师)


金融业智能运维开始兴起?前段时间,收到行业组织的智能运维调研,大数据、自学习、AIOps,怎么感觉是还没走稳,就开始准备跑了的节奏呢?

个人浅见,技术发展过程中必然会有一些先驱探索,智能运维、自动化运维、传统运维之间并无很明显的界限划分。就我们情况而言,自动化运维并未发展到完全成熟的阶段,也已经在监控领域探索一些智能化的衍进,比如对于海量告警的压缩提取有效告警、告警的根因分析、利用大数据拟合动态基线替代静态阈值进行系统运行态监控等等。(@zjwy82 某银行系统架构师)


智能化运维有哪些核心技术?

智能化运维的技术主要组成是运维大数据平台、智能分析决策组件、自动化工具。

运维大数据平台如同眼一样,能采集、处理、存储、展示各种运维数据。智能分析决策组件如同大脑,它以眼睛感知到的数据作为输入,作出实时的运维决策,从而驱动自动化工具实施操作。自动化工具如同手一样,能根据运维决策,实施具体的运维操作,如重启、回滚、扩缩容等。

1、运维大数据平台

(1)运维大数据组成

(2)运维大数据平台

面对自动化运维、智能化运维,我们应该开始学习什么?

2、智能分析决策组件

(1)运维知识图谱类组件

运维知识图谱类的组件是通过多种算法挖掘运维历史数据,从而得出运维主体各类特性画像和规律,以及运维主体之间的关系,形成运维知识图谱。示意图:

面对自动化运维、智能化运维,我们应该开始学习什么?

(2)动态决策类组件

动态决策类组件则是在已经挖掘好的运维知识图谱的基础上,利用实时监控数据作出实时决策,最终形成运维策略库。实时决策主要有异常检测、故障定位、故障处置、故障规避等,如下图所示:

3、自动化工具


DBA如何转型才能跟上AIOps的大趋势?传统运维DBA应该学习实践哪些额外技能?

我希望 AIOps 带来的结果就是人人都是 DBA 。智能运维将数据采集,把数据库当前发生的问题告知用户,并且提供对应的解决方案。我做的 DB2 数据库智能场景算是个雏形。这样无论是开发或者运维看到智能平台的内容就知道怎么去解决。那么传统运维的 DBA 是不是就不需要了?其实不是。传统运维 DBA 在智能运维的帮助下会更了解数据库,更清楚数据的内部运行情况,更早发现隐藏的问题并预先解决问题。所以智能运维和 DBA 是相辅相成的。传统 DBA 需要像 DB 数据分析师去转型,需要借助 AIOps 去分析数据,需要更前瞻性的规划和运维数据库。(@孔再华 银行架构专家)


AIOps需要的知识面广,技能繁多,如何开始学习?

我从吴恩达的视频开始启蒙的。他讲得很好,条理清楚。然后里面发现会用到很多数学的东西,主要是微积分和线性代数。所以后来又把这些温习了一遍。其实老了还是记不住,算是记住原理吧,公式扔了。然后开始系统看机器学习到深度学习,也是走马观花,不值得借鉴。因为工作中与 AI 强项视觉、自然语言等实在不相关,所以神经网络深度学习那些看的多用的少。智能运维里还是在用机器学习的各种基础算法来实现。建议看西瓜书吧。(@孔再华 银行架构专家

觉得本文有用,请转发或点击“在看”,让更多同行看到


 资料/文章推荐:



社区正在进行“传统数据库系统如何实现智能化运维?”在线技术交流,点击文末阅读原文即可参与↓↓↓


长按二维码关注公众号

以上是关于面对自动化运维智能化运维,我们应该开始学习什么?的主要内容,如果未能解决你的问题,请参考以下文章

智能运维监控工具怎么选

Gartner:AIOps「智能运维」真的来了,并且是趋势

自动化运维可不只是说说而已!

京东数据库运维自动化体系建设之路

小米自动化运维平台演进设计思路

智能运维 | 为何说自动化运维三大要素是标准化工程化和智能化?