Elasticsearch我们如何在 5 天内在同一个 Elasticsearch 集群中重新索引 360 亿份文档

Posted 九师兄

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Elasticsearch我们如何在 5 天内在同一个 Elasticsearch 集群中重新索引 360 亿份文档相关的知识,希望对你有一定的参考价值。

在这里插入图片描述

1.概述

翻译:https://thoughts.t37.net/how-we-reindexed-36-billions-documents-in-5-days-within-the-same-elasticsearch-cluster-cd9c054d1db8

这篇文章以及更多内容现在是我的免费电子书的一部分,可以在 Github 上找到运行 Elasticsearch for Fun and Profit 的内容。分叉它,给它加星标,打开问题并发送 PR!

在Synthesio,我们在各个地方使用ElasticSearch来运行复杂的查询,眨眼间从数百亿个文档中获取多达 5000 万个丰富的文档。Elasticsearch 使其快速且易于扩展,其中在多个 mysql 集群上运行相同的查询需要几分钟,并且在途中会导致一些服务器崩溃。每一天,我们都在进一步推动 Elasticsearch 的边界,深入了解其内部结构会带来更多的爱。

上周,我们决定使用全新的映射重新索引 136TB 数据集。在大型索引上更新 Elasticsearch 映射很容易

以上是关于Elasticsearch我们如何在 5 天内在同一个 Elasticsearch 集群中重新索引 360 亿份文档的主要内容,如果未能解决你的问题,请参考以下文章

ElasticSearch第5天 es实现分页查询的几种方式

vreinterpret NEON 内在问题

ES 译文之如何使用 Logstash 实现关系型数据库与 ElasticSearch 之间的数据同

如何使用 UIKit 在 Swift 5 中创建具有内在高度的 UITableView?

如何在5秒内在PyQt5中隐藏statusBar?

Elasticsearch使用Elasticsearch实现同段和同句搜索