腾讯运维总监带你探索 AIOps(活动通知)
Posted 高效运维
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了腾讯运维总监带你探索 AIOps(活动通知)相关的知识,希望对你有一定的参考价值。
腾讯运维十年,最重要的一件事情就是建立规则和次序。
这其中的过程可以分成几个阶段,包括:交付->组件->架构->监控;而这两年最重要的事情就是智能化。
交付
交付:在腾讯SNG可以认为十年前运维主导了交付标准,PKG包管理、CMDB配置管理、CC配置管理、ARS发布等一些列交付标准被严格执行,确保了十年来的研发和运维的效率与质量。而大家经常听到的自动化运维无非是标准交付的一种技术实现。
组件
第二个质的飞跃是组件的规范,简单理解很像2000年前的“书同文、车同轨”,一个业务进入规模化甚至海量后,这点是必然之路。
架构
近些年火灾灾害比过去少了很多很多,我认为是更加重视灾害的危险而加大了在城市建设阶段的消防考虑和要求。而作为救火队员的运维在产品业务建设初期参与架构规划也是减少后期运维灾难的重要手段。15年“天津大爆炸”事件,腾讯运维在无感知的情况下将7000万QQ用户迁移出天津机房,就是运维参与架构建设带来的业务能力提升。这也是运维建设的最重要的阶段之一,也是持续时间最常的一个阶段。
监控
贯穿运维建设全程而不算一个阶段,之所以放做一个阶段是因为这几年的大数据和机器学习让监控成为了运维技术的新方向。监控上的飞跃让整个运维技术上了一个新的阶段。
智能化
运维本来就是在解决各种场景下的问题,智能化技术是一些新手段帮助运维解决过去解决不了的问题,我认为能利用好这个技术手段解决问题的就算是智能运维了。在这个领域我们比较早就开始探索,较早的可以追溯到12年左右。比如:ROOT:基于业务架构的链路关联算法;DLP:业务核心生死指标;大数据:通过机器有监督学习的方式来优化告警;全链路:利用海量数据关系来拓展纬度。
AIOps 并非万能,但它的的确确能让运维彻底脱离重复低效的手工作坊式的工作。从运维升级成技术运营,因此焕发第二春。
腾讯在智能运维应用上有哪些套路和高招?
作为一名伴随腾讯十年的运维老兵,腾讯运维总监聂鑫有话对你说...
个人简介:
从开发到运维,伴随腾讯社交网络运营部成长的十年,负责过腾讯社交产品所有业务运维工作。目前主要负责 QQ、空间等产品运维团队管理工作。经历多个业务产品的诞生到蓬勃,伴随着运维团队的成长和成熟,见证着腾讯一代代运营技术的创新和发展。作为运维界老兵有好多故事想和大家讲,也特别愿意听听各位经历的酸甜苦辣。
2018年5月26日,高效运维 AIOps 北京沙龙,腾讯运维总监聂鑫老师将来到现场,并分享腾讯在智能运维领域的实践经验。
除此之外,另一位来自京东的老师:张晨@京东金融 资深研发工程师也将带来演讲《 智能运维之异常检测与根因分析 》
主题简介:
智能运维的应用在运维监控中的应用。在运维监控系统中,每时每刻会产生大量应用监控数据,日志数据,主机数据,网络数据,如何识别出这些信息那些是有问题,如何排除一些干扰信息,发送出准确的报警。有了异常检测所产生的异常报警数据,又如何找到这些数据之间的关联,找到产生问题的最根本原因,准确的定位,其实一次数据库访问的失败可能是由于交换机问题引起。
个人简介:
目前任职京东金融,曾任职于搜狐畅游等互联网公司,擅长Java底层技术的研发及疑难问题的定位。从2015年开始从事智能运维监控平台的研发与实践,参与并主导了APM等产品的研发与应用,经历了多次618和双11的千万级TPS的运维保障,支撑了京东金融的大量业务应用。
活动通知
扫码参与报名
点击阅读原文,更多精彩
以上是关于腾讯运维总监带你探索 AIOps(活动通知)的主要内容,如果未能解决你的问题,请参考以下文章