ElasticsearchElasticsearch 最佳实践系列之分片恢复并发故障

Posted 九师兄

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ElasticsearchElasticsearch 最佳实践系列之分片恢复并发故障相关的知识,希望对你有一定的参考价值。

在这里插入图片描述

1.概述

参考:https://cloud.tencent.com/developer/article/1370318

这个实验,我在6.8 版本上,没有测试出来

大家好,今天为大家分享一次 ES 的填坑经验。主要是关于集群恢复过程中,分片恢复并发数调整过大导致集群 hang 住的问题。

场景描述
废话不多说,先来描述场景。某日,腾讯云线上某 ES 集群,15个节点,2700+ 索引,15000+ 分片,数十 TB 数据。由于机器故障,某个节点被重启,此时集群有大量的 unassigned 分片,集群处于 yellow 状态。为了加快集群恢复的速度,调整分片恢复并发数,将默认值为2的 node_concurrent_recoveries 调整为100:

PUT /_cluster/settings
{<

以上是关于ElasticsearchElasticsearch 最佳实践系列之分片恢复并发故障的主要内容,如果未能解决你的问题,请参考以下文章