聊聊技术专家谈阿里云史诗级故障

Posted 运维Linux和python

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了聊聊技术专家谈阿里云史诗级故障相关的知识,希望对你有一定的参考价值。

序言

    什么是技术专家,其实也是很懂,是做的时间足够长呢,还是说经历的厂比较多,还是说纸上谈兵比较牛逼?

    专家嘛,大家都懂的。。。只会弹别人,喔。。。是谈别人,原来不是弹,有本事技术专家谈谈自己呗。

风言风语

    阿里云出现史诗级故障,处理的时间足够长,然后各个技术专家就给出了很多建议:

    例如建议做什么status page来降低沟通成本,原因是其他的云厂商都有。。。从技术上来看,实现这个很简单,为什么没做,应该内部也会有各种原因,此处不去猜测。但是从各个技术专家来说,你们没办法解决这个问题吗?随便自己写个脚本,就算是crontab的定时任务去探测,那也是可以解决的吧,自己不想做的事情,就让别人去做?自己的业务,自己不去负责探测好与坏,依赖云厂商?就算一个云厂商有了这种监控,然后你又会相信了?会不会说哎呀,我的服务就是出问题的,那肯定是云厂商的锅。。。不要试图甩锅,业务是你自己的,在指责别人的同时,你作为一个技术专家,你做了什么?至少人家出问题了,出故障了,赔偿了。。。那你负责的业务,你赔偿给你的客户了吗?

    例如建议什么提供API帮助客户尽快启动故障预案,这个就更加搞笑了,so funny,作为技术专家,你应该有了故障预案了,为什么需要别人提供???是出问题的时候,你没有装API?还是找不到API?云故障本来就是不可预见的,单zone作为一种集中式的存储,集中式的服务,你强依赖它,不出问题你以为百分百SLA。出了问题你说怀疑人家不可靠,那你咋不多云灾备?那你咋不多region灾备?又想省钱又想做到百分百的好,are you kidding me????尽快启动,卧槽,自己的业务,你不知道有没有故障?你没有告警?你没有监控?你的业务访问不通了,你作为一个技术专家,你自己不知道???还要让别人来告诉你,说服务出问题了?果然是专家哈。。。。

    例如建议故障处理过程中及时更新信息,有点意思,每个人都想获取第一手信息,就像在路边看人打架,好好吃瓜。。。你作为技术专家,你会第一时间对你的客户纰漏故障信息吗?处理故障的时候一个人做事,十几个人指挥,几百人围观,那种压力多嗨,还要面对你这种沙雕吃瓜群众,还要去解释,简直是日了狗。。。

    试想一下,你们敢指责阿里云,但是你们不会去指责空调,但是你们不会去指责业务挂了的一方为啥不做灾备,哦吼。。。最后是一个无限递归的游戏,但是你们很聪明,你们知道谁可以骂,骂了谁没事,简直是高明的技术专家,专家被你们玩明白了,但是技术你们也是一套一套的哈。。。

    选择一个云厂商,作为技术专家你们就可以甩锅了???还能说别的云怎么样怎么样,那你在开始技术选型的时候你咋没选择其他云呢?是什么原因逼迫你们选择了这个史诗级故障??作为技术专家,你心里没点数???

    作为一个云厂商,承诺了出问题就赔偿了,已经尽到了义务。。。。技术专家们,你们承担了你们应该承担的责任了吗???还是因为你们的客户对你们比较宽容????

    骂别人只要动动嘴,自己改起来。。。好累的,简直是。。。史诗级别的技术专家。

    专家已经渗透到技术领域了吗???专家一直都在,只是你没发现它。

    其实。。。偷偷的告诉你们,我也是技术专家,哈哈哈

以上是关于聊聊技术专家谈阿里云史诗级故障的主要内容,如果未能解决你的问题,请参考以下文章

一行小错为何产生巨大破坏-Facebook史诗级故障大反思

一行小错为何产生巨大破坏-Facebook史诗级故障大反思

一行指令造成 60 亿美元蒸发,更让 Facebook 遭遇史诗级故障!

Apache Log4j曝史诗级漏洞,Spring boot修复教程

Flink等多组件受影响,Apache Log4j曝史诗级漏洞

Flink等多组件受影响,Apache Log4j曝史诗级漏洞