kibana启动失败all shards failed,无法连接elasticsearch

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了kibana启动失败all shards failed,无法连接elasticsearch相关的知识,希望对你有一定的参考价值。

参考技术A 现象:

本地集群启动3个Node,es都启动正常,search-head也都能连接上,但是有警告日志:

2019-12-31T08:54:46,320][WARN ][o.e.c.r.a.DiskThresholdMonitor] [node1] high disk watermark [90%] exceeded on [wYsY5n5QRduREAAZvA5Biw][vipnode2][/node-2/data/nodes/0] free: 17.8gb[7.6%], shards will be relocated away from this node

然后启动kibana,启动报一堆的红色日志,控制台打不开,关键错误日志:

elasticsearch - SearchPhaseExecutionException[Failed to execute phase [query], all shards failed]

statusCode: 503,

    payload:

      statusCode: 503,

        error: 'Service Unavailable',

        message: 'Request Timeout after 30000ms' ,

    headers: ,

  reformat: [Function],

  [Symbol(SavedObjectsClientErrorCode)]: 'SavedObjectsClient/esUnavailable'

  log  [00:44:10.647] [info][plugins-system] Stopping all plugins.

  log  [00:44:10.648] [info][plugins][translations] Stopping plugin

解决:

参考了https://www.jianshu.com/p/443cf6ce87d5排查问题ap,https://www.elastic.co/guide/en/elasticsearch/reference/5.5/cluster-allocation-explain.htmli,

最后确定了关键的参数cluster.routing.allocation.disk.threshold_enabled

(es可以根据磁盘使用情况来决定是否继续分配shard。默认设置是开启的).

为了在本地单机上测试,我自己电脑磁盘空间剩下没多少了,修改elasticsearch.yml,设置cluster.routing.allocation.disk.threshold_enabled: false。

然后删除了data,logs的文件,重启es,kibana,一切都正常,从red到green.

总结:

1.系统启动的warm日志也很重要,关注每一个细节,能快速定位问题。

 2.这次问题的几个关键参数,具体含义可以去官网查:cluster.routing.allocation.disk.threshold_enabled,cluster.routing.allocation.disk.watermark.low,cluster.routing.allocation.disk.watermark.high

Elasticsearchelasticsearch All Shards Failed


在这里插入图片描述

1.场景1

1.1 概述

在 Elasticsearch 搜索时,可能会遇到 “All Shards Failed” 的错误消息。

在这里插入图片描述

发生 All Shards Failed 的几种情况:

  1. 当读取请求无法从分片获得响应时

  2. 当由于集群或节点仍处于初始启动过程而无法搜索数据

  3. 当分片丢失或处于恢复模式并且集群为红色时

造成 All Shards Failed 可能的原因:

  1. 节点可能已断开连接或重新连接

  2. 正在查询的分片可能正在恢复中,因此不可用

  3. 磁盘可能已损坏

搜索query 语句可能写的有问题。例如ÿ

以上是关于kibana启动失败all shards failed,无法连接elasticsearch的主要内容,如果未能解决你的问题,请参考以下文章

kibana 操作

Hadoop2.0 datanode启动不成功:All specified directories are failed to load

spark启动失败:localhost failed to add the host to the list of known hosts

spark启动失败:localhost failed to add the host to the list of known hosts

启动 kibana 失败

triton-inference-server启动报Internal - failed to load all models