故障公告下班前的一场暴风雨,爬虫爬至园宕机

Posted 博客园官方博客

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了故障公告下班前的一场暴风雨,爬虫爬至园宕机相关的知识,希望对你有一定的参考价值。

下班前的一场暴风雨,让园子一片狼藉。顶着暴风雨,加了服务器,但无济于事。情急之中,断蛛求生立转机。今天下班前的 17:00~17:30 左右,身份未明的爬虫暴风雨般地袭击园子,造成数据库连接过万,全站宕机,由此给您带来很大的麻烦,请您谅解。最终我们通过给百度蜘蛛断网才恢复正常,造成暴风雨的爬虫不一定是百度蜘蛛,由于缺乏足够的数据,这次袭击园子的爬虫身份无法确认。

下班前的一场暴风雨,让园子一片狼藉。顶着暴风雨,加了服务器,但无济于事。情急之中,断蛛求生立转机。

今天下班前的 17:00~17:30 左右,身份未明的爬虫暴风雨般地袭击园子,造成数据库连接过万,全站宕机,由此给您带来很大的麻烦,请您谅解。

最终我们通过给百度蜘蛛断网才恢复正常,造成暴风雨的爬虫不一定是百度蜘蛛,由于缺乏足够的数据,这次袭击园子的爬虫身份无法确认。

给百度蜘蛛断网,是为了减少服务器的总负载,在上次故障时我们只屏蔽了一个网段(255个IP)的百度蜘蛛,还有大量百度蜘蛛每天在园子里爬来爬去,虽然这些蜘蛛被关在笼子里(限制了带宽),但依然会给服务器带来不小的压力,让园子在暴风雨来袭时格外弱不禁风。

百度蜘蛛专用负载均衡 QPS 监控图:

非常抱歉!园子这段时间故障有点多。

曾经的一系列故障公告,是我们鲁莽走进云计算时代初期的痛苦代价。

现在还未成系列的故障公告,也许是 AI 时代即将到来的被代价。

不管怎么样,不管是代价还是被代价,AI 时代真的要来了。

以上是关于故障公告下班前的一场暴风雨,爬虫爬至园宕机的主要内容,如果未能解决你的问题,请参考以下文章

故障补牢贪吃的 Bing 爬虫,限量供应的应对措施

暴风雨中的 online :.net core 版博客站点遭遇的高并发问题进展

故障公告阿里云抢占式实例服务器被释放引发全站故障

故障公告龙卷风继续袭击,服务器们顽强抵抗

github宕机了,可能的原因曝光!

云计算宕机 五朵云宏愿路漫漫