ElasticsearchElasticsearch 最佳实践系列之分片恢复并发故障
Posted 九师兄
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ElasticsearchElasticsearch 最佳实践系列之分片恢复并发故障相关的知识,希望对你有一定的参考价值。
1.概述
参考:https://cloud.tencent.com/developer/article/1370318
这个实验,我在6.8 版本上,没有测试出来
大家好,今天为大家分享一次 ES 的填坑经验。主要是关于集群恢复过程中,分片恢复并发数调整过大导致集群 hang 住的问题。
场景描述
废话不多说,先来描述场景。某日,腾讯云线上某 ES 集群,15个节点,2700+ 索引,15000+ 分片,数十 TB 数据。由于机器故障,某个节点被重启,此时集群有大量的 unassigned 分片,集群处于 yellow 状态。为了加快集群恢复的速度,调整分片恢复并发数,将默认值为2的 node_concurrent_recoveries 调整为100:
PUT /_cluster/settings
{<
以上是关于ElasticsearchElasticsearch 最佳实践系列之分片恢复并发故障的主要内容,如果未能解决你的问题,请参考以下文章