ElasticSearchES 的 path.data 配置多个盘的路径,查询效率与单个存储盘的效率比,哪个效率高些?

Posted 九师兄

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ElasticSearchES 的 path.data 配置多个盘的路径,查询效率与单个存储盘的效率比,哪个效率高些?相关的知识,希望对你有一定的参考价值。

在这里插入图片描述

1.概述

想最大程度发挥磁盘读写 io,还是推荐 RAID0。

使用多路径不一定会提升读写速度,和集群 shard 的数量有关系;主要是因为一个 shard 对应的文件,只会放到其中一块磁盘上,不会跨磁盘存储。比如一个极端的场景,集群 shard 数量比较少,每个结点上就一个shard,那么读写只会有一块磁盘发挥作用,其他磁盘都空闲的。

多路径对读写有提升比较大的场景,是每个结点上 shard 数量至少比盘的数量多,并且 shard 大小也差别不太多;shard 数量比较少,shard 大小差别太大,可能产生读写热点问题,即有的磁盘磁盘很忙,有的很闲。

ES 不会将一个索引的主副分片分配到同一台机器,所以即使一台机器的 RAID0 坏了,不会导致数据丢失,仅仅是副本没有了。

用 RAID0 的负面影响主要是磁盘损坏的时候,需要恢复的数据比较多;多路径磁盘,坏一块只会丢一部分数据,恢复数据会比较快;但是他也有缺陷,比如容易出现读写热点问题以及磁盘空间使用不均匀问题。

以上是关于ElasticSearchES 的 path.data 配置多个盘的路径,查询效率与单个存储盘的效率比,哪个效率高些?的主要内容,如果未能解决你的问题,请参考以下文章

Elasticsearches 各种查询 详解

ElasticSearchEs 源码之 PeerRecoverySourceService 源码解读

Elasticsearches node 节点

Elasticsearches 远程调试

ElasticSearchEs 源码之 AliasValidator 源码解读

ElasticSearchEs 源码之 MetadataIndexUpgradeService 源码解读