2020年AIOps:新手指南

Posted CloudMSP社区

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2020年AIOps:新手指南相关的知识,希望对你有一定的参考价值。

摘要

尽管AIOps对于IT运营而言是一个巨大的变革,但它并不是分析和机器学习的根本应用。当股票经纪人从手动交易转移到机器交易时,也采用了类似的机器学习方法。Analytics和ML用于社交媒体以及Google Maps,Waze和Yelp等应用程序,以及Amazon和eBay等在线市场。这些技术在需要对动态变化的条件和用户自定义进行实时响应的环境中可靠且广泛地使用。

AIOps是将经过验证的技术和流程应用于ITOps的过程。ITOps人员通常较慢采用新技术,因为出于必要,我们的工作一直比较保守。ITOps的工作是确保灯一直亮着并为支持组织应用程序的基础结构提供稳定性。但是,我们已经超过了临界点,而采用AIOps是数字企业发展轨迹的关键指标。


当我在2017年首次写有关AIOps的文章时,Gartner预测IT运营(ITOps)人员将在未来几年发生重大变化。传统的IT管理技术被认为无法应对数字业务转型。Gartner预测,ITOps程序将发生重大变化,我们的IT生态系统管理方式也将发生重组。他们称将在这些平台上进行这些更改的不断发展的平台称为“ AIOps”。


在过去的几年中,IT的变化已证明Gartner是正确的。随着组织寻求实现创新,抵制破坏者以及管理超出人类规模的数字数据的速度,数量和种类,AIOps的兴趣和采用呈指数增长。该博客介绍了AIOps的原始和当前市场驱动因素及其组成部分和优势。


数字化转型与AIOps之路

重要的是要了解数字化转型如何促成了Gartner的AIOps平台。数字化转型包括DevOps以及对云和容器等新技术的采用。它代表了从集中式IT到应用程序和开发人员的转变,创新和部署步伐的加快以及新数字用户(机器代理,物联网(IoT)设备,应用程序接口(API)等)的获取以前不需要组织的服务。所有这些新技术和用户都在将传统的性能和服务管理策略和工具推向极限。AIOps是处理这些数字转换问题所需的ITOps范式转换。


什么是AIOps?

AIOps代表用于IT运营的人工智能。它是指通过分析和机器学习(ML)自动化和增强IT操作的多层技术平台。AIOps平台利用大数据,从各种IT运营工具和设备中收集各种数据,以便实时自动发现并响应问题,同时仍提供传统的历史分析。


Gartner通过使用图1中的图说明AIOps平台的工作原理。AIOps具有两个主要组件:大数据和ML。它需要远离孤立的IT数据,以便将观察数据(例如在监视系统和作业日志中找到的数据)与参与数据(通常在故障单,事件和事件记录中找到的数据)以及大数据平台内的数据进行汇总。然后,AIOps针对合并的IT数据实施全面的分析和ML策略。理想的结果是自动化驱动的见解,可以不断进行改进和修复。可以将AIOps视为核心IT功能的持续集成和部署(CI / CD)。

   

图1:Gartner的AIOps平台可视化  


AIOps桥接了三个不同的IT学科-服务管理(“ Engage”),绩效管理(“ Observe”)和自动化(“ Act”),以实现持续洞察和改进的目标。AIOps制定了一个游戏计划,该计划认识到在我们新的加速IT环境中,必须有一种新方法,该方法由大数据和ML的进步所支持。


是什么在驱动AIOps?

AIOps是IT运营分析(ITOA)的发展。它源自影响ITOps的几种趋势和需求,包括:

  • 超过人类规模的IT环境。传统的IT复杂性管理方法(离线,需要人工干预的手动工作)在动态,弹性的环境中不起作用。不再可能通过人工监督来跟踪和管理这种复杂性。ITOps已经超过了人类的规模,并且持续恶化。

  • ITOps需要保留的数据量呈指数级增长。性能监控正在生成指数级的事件和警报。随着IoT设备,API,移动应用程序以及数字或机器用户的引入,服务凭单数量经历了逐步增加的功能。同样,对于手动报告和分析,它变得太复杂了。

  • 基础设施问题必须以越来越高的速度解决。随着组织数字化其业务,IT成为业务。技术的“消费化”已经改变了用户对所有行业的期望。必须立即对IT事件(无论是真实的还是可感知的)做出反应,尤其是当问题影响用户体验时。

  • 更多的计算能力正在移向网络的边缘。轻松采用云基础架构和第三方服务已授权业务线(LOB)功能来构建自己的IT解决方案和应用程序。控制和预算已从IT核心转移到边缘。外部核心IT部门还增加了更多的计算能力(可以利用)。

  • 开发人员拥有更大的权力和影响力,但问责制仍由核心IT负责。正如我在以应用程序为中心的基础架构中所谈到的那样,DevOps和Agile迫使程序员在应用程序级别承担更多的监视责任,但要对IT生态系统的整体运行状况以及应用程序,服务和基础架构之间的交互负责仍然是核心IT领域。随着网络变得越来越复杂,ITOps承担了更多的责任。


应该注意的是,承认ITOps管理已超出人类的规模,并不意味着这些机器正在取代人类。这意味着我们需要大数据,AI / ML和自动化来应对新现实。人们并没有被取代,但是ITOps人员将需要发展新技能,并且将出现新的角色。


AIOps的要素

我将在这里花点时间仔细阅读上面Gartner图表中所示的AIOps元素。在我鼓励大家阅读《市场指南》的同时,以下内容应成为AIOps难题的关键内容以及它们如何发挥作用的充分基础。

  • 广泛而多样的IT数据:AIOps被黑色和蓝色V形符号所枚举,旨在将来自IT运营管理(ITOM)(指标,事件等)和IT服务管理(ITSM)(事件,变更,等等。)。这通常被称为“打破数据孤岛”-将来自不同工具的数据汇集在一起,以便它们彼此“交谈”并加速根本原因识别或实现自动化。

  • 聚合的大数据平台:大数据位于平台的中心(在图形的中心)。由于数据是从孤立的工具中解放出来的,因此需要将它们放在一起以支持下一级分析。这不仅需要离线进行(例如在使用历史数据进行的法医调查中),而且还需要在数据提取后实时进行。有关AIOps和大数据的更多信息,请参见我的其他文章

  • 机器学习:大数据使ML的应用能够分析大量不同数据。在将数据汇总在一起之前或人工操作下这是不可能的。ML自动执行现有的手动分析,并启用对新数据的新分析-所有这些都在没有AIOps的情况下以规模和速度进行。

  • 观察:这是传统ITOM领域的演进,该领域集成了开发(痕迹)和其他非ITOM数据(拓扑,业务指标),从而实现了关联和环境化的新模式。结合实时处理,可能的原因识别与问题生成同时发生。

  • 参与:传统ITSM域的发展包括与ITOM数据的双向通信,以支持上述分析并自动创建用于审核和合规性/监管要求的文档。AI / ML在这里以认知分类,路由和智能在用户接触点(例如聊天机器人)中表达自己。

  • 行动:这是AIOps价值链的“最后一英里”。如果将行动的责任交到人手中,则自动化分析,工作流和文档将变得毫无意义。法案包括将人为领域的知识编纂为补救和响应的自动化和编排。


AIOps的未来

了解推动AIOps的因素以及如何做出反应,可以使我们了解当前的市场状况。随着IT超越人员规模,IT工具需要适应。但是,仅仅采取防御措施是不够的。拥抱AIOps的组织将把它面临的挑战视为增长,发展,创新和颠覆的机会。启用AIOps的组织可以通过以下几种方式在未来五年内转变其业务。

  • 技术变得更加人性化:分析和编排可提供无摩擦的体验,并提供无处不在的自助服务。

  • 技术和业务流程的自动化:降低成本,提高速度,减少错误,同时释放人力资本以实现更高水平的成就。

  • 企业ITOps获得DevOps敏捷性:持续交付扩展到运营和业务。

  • 数据成为货币:大量未开发的业务数据被资本化,释放出高价值的用例和获利机会。


在BMC,我们将这种实现AIOps的未来愿景称为“自主数字企业”。我们的使命是使我们的客户能够持续不断地进行创新和差异化,以提供客户驱动的价值。明天成功的组织将是采用智能,技术支持的系统的组织,这些组织可以让它们蓬勃发展,而其他组织则可以在发生巨大变化时步履蹒跚。


原文链接:

https://www.bmc.com/blogs/what-is-aiops/

(加管理员微信:cloudmspcn,和企业IT管理者一起交流运维和云管理)

以上是关于2020年AIOps:新手指南的主要内容,如果未能解决你的问题,请参考以下文章

听云入选Gartner《AIOps中国市场指南》,获评代表厂商

Gartner中国智能运维市场指南发布,擎创再次成为AIOps代表供应商

Scrum指南 最新版 2020年新版 敏捷权威指南

2020年敏捷开发人员生存指南

敏捷漫画#55-Scrum指南

权威解读《企业级 AIOps 实施建议》白皮书 | 活动通知