阿里云故障有感

Posted 码不停Ti

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了阿里云故障有感相关的知识,希望对你有一定的参考价值。

2304阿里云故障有感

为什么会写一个如此奇怪的议题。
人的生活轨迹,不一定只有唯一的叙事方式,可以不那么苦,不那么累,不那么怕,不那么憋屈。
不再去追求宏大的叙事,而是去关心自己的感受,吃没吃饱,穿没穿暖。

上周的新闻阿里云换了老板,因为他们前几周的香港机房故障,当时我还在社交媒体上看到了事件当时很多用户都在骂这个问题,导致他们的服务完全不可用了。受影响最长的公司似乎有十五个小时不可用,原因因为机房散热系统故障,触发了消防设施,喷了自来水到服务器上降温,导致不能启动,处理完了才启动的。

稳定性对于这种 基础云服务,可以说是一旦出过一次问题,就永远的定在耻辱柱上了,对于客户而言,肯定是希望购买了云服务,不能出任何的线上问题,影响生产使用。但是作为一个程序猿来说,谁又能保证自己的代码,永远没有bug和故障呢?

我个人的视角,如何成为某个领域的专家,要把所有的错误都犯一遍,其他人都没遇到过的问题,你遇到了,成功解决了,就可以成为专家。当然这个没有任何理论依据,都是凭空想象的。

在商业化的工作里,是没有容错性的,上线了代码就要保证正确,出了问题就要走人。在这种高压下,会有什么成长呢?会变得畏手畏脚,同事之间,部门之间会互相甩锅,时刻都顶着压力,不能出现任何事故。击鼓传花,看谁能挺到最后,挺到最后的人会赢吗?不会,只是会进入下一轮的循环,继续淘汰。

大公司,需要的是员工能成为一个稳定的螺丝钉,可以站好每一班岗,做好每一件事。
创业团队,个人开发者,可以自由的去做各种创造性的工作,可能会成功,可能会失败,但是不会要求百分百成功,不需要做好每一件事,可能这就是不同。

ps

看了下我的 GitHub 年终总结,可以说是 彻彻底底的 是一个 markdown 工程师了。
基本上全部的提交都是 自己写的 markdown 文档,以及拿不出手的 demo 项目,从起步到烂尾

以上是关于阿里云故障有感的主要内容,如果未能解决你的问题,请参考以下文章

阿里云故障有感

故障公告阿里云抢占式实例服务器被释放引发全站故障

阿里云的服务器居然泡在“水”里?| 数据中心参观有感

故障公告博客站点一台阿里云负载均衡被DDoS攻击

云计算之路-阿里云上-容器难容:容器服务故障以及自建 docker swarm 集群故障

因bug禁用内部IP导致链路不通,阿里云大面积瘫痪!Intel处理器又曝漏洞;Tomcat 9.0.10发布