Google SRE系列第三部来了!

Posted turingbooks

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Google SRE系列第三部来了!相关的知识,希望对你有一定的参考价值。

如果系统非常安全,那么它一定可靠吗?

Google曾遭遇一个有关安全性和可靠性的死循环。最终,Google的工程师用一把电钻破解了死循环。

是的,你没看错,用一把电钻

2012年9月27日,Google向乘坐旧金山湾区各园区巴士的数千名员工发了一条消息,告知巴士WiFi密码变更了。很稀松平常的一条消息,对吧?这能掀起多大风浪呢?

可是,Google员工用的内部密码管理系统竟然就这样崩溃了!这个系统原本是为少数系统管理员设计的,已经用了五年,从未遭遇过停机。

原来,收到消息的数千名员工在短时间内集中访问了密码管理系统,导致系统主机和备机接连失效。

你可能会想,重启一下不就行了?没错,Google的值班工程师也是这样想的。不过,这个系统设计得非常安全,重启需要用硬件安全模块智能卡。

智能卡存放在哪里呢?哦,在一个保险箱里,安全极了!可是,值班工程师不记得保险箱密码了。

密码又存储在哪里呢?呵呵,在已经崩溃的密码管理系统里。

当然,蛮力法总能派上用场。一小时后,工程师用电钻打开了保险箱……

以上来自《Google系统架构解密》的开篇小故事。作为处理万亿级流量的超大型公司,Google在这本书中一开篇就“自揭伤疤”,意在强调:

要使系统真正值得信赖,安全性和可靠性都不可或缺,但要构建既安全又可靠的系统是相当困难的。

好在有这一本书。

封面是中国水龙。若环境适中,这种蜥蜴可健康地生活20年之久。软件系统亦如此

Google SRE系列第三部

这是Google公司SRE系列的第三本书。前两本的主题是SRE(Site Reliability Engineering,网站可靠性工程):

SRE是Google自创的一个工种,国内大厂也已经开始设置SRE岗位。简单地说,当把运维视作解决软件问题时,你就是在做SRE。

作为这个系列的第三本书,《Google系统架构解密》则聚焦于SRE与安全性的结合。Google公司安全工程副总裁Royal Hansen在为这本书所作的序中写道:

自SRE的书出版以来,我时常赞赏和推荐它们。当发现公司内部有一本专注于安全性和可靠性的书正在编写时,我非常兴奋。

我发现SRE领域出现的问题与安全性问题很相近。一些团队已将这两项工作合二为一,称为DevSecOps。

在这个越来越依赖技术的世界中,一本从Google和整个行业的经验中汲取有关安全性和可靠性方法论的书,会对软件开发、系统管理和数据保护的发展做出重要贡献。

强大阵容 + 大厂方法论

本书由Google的SRE团队和安全团队撰写,内容贡献者多达150人,主要作者的阵容十分强大。

★ 希瑟·阿德金斯(Heather Adkins)是在Google有近20年工作经验的“老兵”,也是Google安全团队的创始成员。

★ 贝齐·拜尔(Betsy Beyer)毕业于斯坦福大学,是Google SRE技术作者。

★ 保罗·布兰肯希普(Paul Blankinship)是Google技术写作团队负责人,同时服务于Google安全与隐私工程团队。

★ 彼得·莱万多夫斯基(Piotr Lewandowski)是Google安全生产技术负责人,负责促成SRE与安全团队紧密协作。

★ 阿那·奥普雷亚(Ana Oprea)负责安全、SRE及Google技术基础设施的战略规划。

★ 亚当·斯塔布菲尔德(Adam Stubblefield)是Google安全领域的技术负责人,他协助建立了Google大部分核心安全基础设施。

本书分享了许多精彩案例,提炼出总体原则和解决方案,并推荐了被认为是业界最佳实践的工具和技术。你可以根据自己公司的具体情况,设计和实现自己的解决方案。

左右滑动查看目录

亚马逊4.6分,获业内佳评

本书在亚马逊上获得4.6分的高分,72%的读者给出5分好评,有人甚至称它是“软件行业的任何从业人员都必读的书”。

业内人士也纷纷给出佳评。

#

Eric Grosse
Google前安全工程副总裁

我有幸与作者共事多年,非常惊讶于他们毫无保留的分享。虽然这本书并非面面俱到,但我认为像它这样丰富的实用技巧和对权衡取舍的坦率讨论无可替代。

#

郄小虎
腾讯公司副总裁

在当今万物互联的时代,在线服务的安全性与可靠性愈发引人关注。本书的作者基于在Google多年的实践与思考,体系化地介绍了如何在早期对系统的安全性和稳定性进行顶层设计,同时把相应策略的执行贯穿系统的全生命周期。本书为互联网开发和运维人员提供了具有实践价值的指导。

#

杨勇
腾讯云副总裁、腾讯安全平台部负责人

Google把重点聚焦在安全主题上,并将可靠性和安全性深度结合,总结出了一套有效的方法,这套方法就是你手中这本书的精髓。

#

胡珀
腾讯安全平台部应用运维安全中心总监

这本书系统地介绍了DevSecOps的理念和实践。落地DevSecOps是庞大的工程,来看看Google是怎么做的吧!

#

林锐林
腾讯PCG安全总监

Google的技术和理念在业内一直比较先进,安全方面也是如此。这本书提到的很多实践值得参考和尝试。推荐国内安全从业者一读。

#

ThreatSource
(鸟哥)

Google拥有开放的分享经验,其安全团队在这本书中分享了众多先进的观点和解决方案,并提供了关于基础设施安全“解坑”和安全设计的宝贵参考。

一线DevSecOps工程师翻译

周雨阳
就职于腾讯安全平台部研发安全团队,参与DevSecOps的一线建设工作,对业务研发流程、编码安全及漏洞检测有深入了解,曾发现并报告Google、Apple、Mozilla等的产品漏洞,另译有《黑客攻防技术宝典:反病毒篇》。

刘志颖
高级安全工程师,现就职于腾讯PCG应用安全团队,担任研发安全方向负责人,主导应用漏洞风险治理和DevSecOps落地工作,在研发与架构安全、安全漏洞发现与防护等方向有较多实战经验。

直 播 预 告

9月28日,下周二晚20:00,欢迎来图灵直播间听两位一线DevSecOps工程师畅聊Google如何铸造安全可靠的系统。

互动福利

欢迎参与以下小调查,并留言说说你对软件系统安全性和可靠性的疑惑。我们会选出3位上墙的同学,每人赠送《Google系统架构解密》1册。截止日期:2021年9月25日。

以上是关于Google SRE系列第三部来了!的主要内容,如果未能解决你的问题,请参考以下文章

读SRE Google运维解密有感

SRE Google 运维解密读书笔记一:SRE 方法论概述

我们离 Google SRE 还有多远?

《SRE:Google运维解密》读书笔记

读SRE Google运维解密有感

SRE:源自Google的DevOps最佳实践 | 学在GOPS