荐书丨智能运维:从0搭建大规模分布式AIOps系统

Posted 程序人生

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了荐书丨智能运维:从0搭建大规模分布式AIOps系统相关的知识,希望对你有一定的参考价值。

第一时间关注程序猿(媛)身边的故事


首著惊爆降临 荟萃微博自动化实践精华

腾讯|滴滴|美团|清华产学界翘楚瞩目力荐

智能运维即未来 AIOps时代开启


互联网刚兴起的时候,运维还只是一个简单的服务安装管理及监控工作,没人会想到人类在互联网上建立了如此庞大的业务生态。从衣食住行到教育金融,服务器的规模在急剧膨胀,从简单的人力可管控,逐渐进化到依赖自动化体系来管理,但是另一方面,仅依赖工具已经不能很好地解决运维场景的需求。


智能运维是建立在运维基础上,通过一定策略和算法来进行智能化诊断决策,以更快、更准确、更高效地完成运维工作的技术体系。要实现智能运维的目标,需要有平台支撑,这也是DevOps很火的原因,很多运维工程师都掌握了开发工具和平台的本领,因此建立了高效的自动化运维平台。所以说智能运维是运维发展的高级阶段,也是互联网时代发展到一定阶段的产物。 


目前市面上与运维相关的书籍更多的是介绍某个单一技术的运维方法,少有对智能运维进行全面介绍的书籍,因此,我们觉得非常有必要梳理编写一本大数据场景下的智能运维技术的书籍,全面完整地为读者介绍智能运维的技术体系,以及在大企业的运维实践经验,让读者更加了解运维的技术方向,在实践中能够有所借鉴。同时,也能帮助运维工程师在一定程度上了解机器学习的常见算法模型,以及如何将它们应用到运维工作中。 

 


主要内容

结合大企业的智能运维实践,全面完整地介绍智能运维的技术体系,让读者更加了解运维技术的现状和发展。同时,帮助运维工程师在一定程度上了解机器学习的常见算法模型,以及如何将它们应用到运维工作中。


本书共分4篇。第1篇运维发展史,重点阐述当前运维的发展现状及面临的技术挑战;第2篇智能运维基础设施,重点讲述大数据场景下的数据存储、大数据处理和分析的方法与经验,以及海量数据多维度多指标的处理分析技术;第3篇智能运维技术详解,重点关注在新时期大数据时代下智能化的运维技术,包括数据聚合与关联、数据异常点检测、故障诊断和分析、趋势预测算法;第4篇技术案例详解,为大家梳理了通过开源框架ELK快速构建智能监控系统的整体方案,还将分享微博平台和微博广告两个不同业务场景下智能监控系统的技术实践。


为什么值得推荐

√ 直接来自新浪微博智能运维团队多年前瞻探索与生产实践,技术思路可落地,解决方案有说服力。

√ 面向运维热点方向,详细分析底层原理,全面梳理技术体系,完整呈现从方法创新到工具化实践。

√ 以微博监控为例,从运维平台大数据处理到架构设计原理,从运维工程师到自动化智能监控专家。

√ 有 AIOps 模型|算法,有异常检测|根因分析|时序预测等运维实践,完美结合工程架构与算法实践。


作者简介

博广告智能监控报警平台和服务治理等项目的建设与研究。


刘俊:微博平台部监控技术负责人,负责微博平台、PC微博大规模监控系统的建设,主要关注实时大数据、运维自动化、智能化方向。2014年加入微博,之前曾在新浪、搜狐等公司从事运维监控方面的工作。


王莉:University of Georgia硕士研究生,主要研究用机器学习方法,识别植物被水淹没的季节性规律,研究成果已发表在SCI高影响因子期刊。2017年加入微博广告团队,致力于用数据分析和机器学习模型,优化广告业务策略,洞悉商业价值。


陆松林:微博广告数据仓库负责人,高级研发工程师,先后就职于搜狐、爱奇艺,主要研究数据仓库、数据治理相关技术。


车亚强:微博广告大数据开发工程师,曾在百度外卖负责实时流、微服务相关研发工作,目前主要研究方向为实时流、微服务架构设计。


大咖推荐

本书是对AIOps的深度细化和技术补充,相关实践可落地,很有说服力。

—— 萧田国  高效运维社区发起人 AIOps标准及白皮书发起人


AIOps是运维领域的极大热点,本书对底层技术进行详细分析,并结合微博场景提供大量实战案例,非常有参考价值。

—— 裴丹 清华大学计算机系长聘副教授 青年千人 美国AT&T研究院前主任研究员 智能运维算法专家


本书作者对智能运维技术体系进行全面梳理,完整呈现从思路到工具再到实践的全过程。

—— 王鹏云  多盟联合创始人  蓝色光标技术创新孵化中心总经理


本书从大数据技术讲到AI运维,详细介绍实施智能运维依赖的基础设施和架构技术,兼具参考性与实操性。

—— 梁定安  腾讯运维技术总监 专家工程师


本书可作为运维工程师提升运维水平的重要参考,也可作为通过运维+AI向自动化智能运维发展的依据。

—— 钟华  美团打车技术研发部负责人


本书介绍异常检测、根因分析、时序预测等智能运维实践经验,并梳理了其两大基石:大数据和机器学习。

—— 饶琛琳  日志易产品总监  前新浪微博系统架构师


从运维平台大数据处理到架构设计原理,再到AIOps相关模型和算法,将智能运维工程架构与算法实践完美结合。

—— 陈晓峰  火币集团副总裁


本书系统介绍大数据采集、存储、处理、计算及策略应用各环节,并以微博监控为案例展示了监控平台建设实践。

—— 陆沛  滴滴打车SRE团队负责人 技术专家


本书写给谁看

《智能运维:从0搭建大规模分布式AIOps系统》适合运维、开发、架构、DevOps工程师及广大互联网技术爱好者研读和借鉴。

 

扫码购书


点击文末「阅读原文」,发现更多好书。


本期评奖规则

在本文下方留言,说说你想要这本书的理由是什么~

我们会从留言用户中,按照留言点赞数,抽取排名在第2、4和6名的3位幸运者,送出本书。


开奖时间:8月6日当天(以当天小编开奖时看到的名次顺序为准)


以上是关于荐书丨智能运维:从0搭建大规模分布式AIOps系统的主要内容,如果未能解决你的问题,请参考以下文章

智能运维:从 0 搭建 AIOps 系统

013.智能运维AIOps

我们离 AIOps 的理想王国还有多远?

荐书丨从零开始构建企业级推荐系统

微博大规模分布式AIOps系统探索与实践(赠重磅好书)

荐书丨Kubernetes权威指南——企业级容器云实战