Elasticsearch我们如何在 5 天内在同一个 Elasticsearch 集群中重新索引 360 亿份文档
Posted 九师兄
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Elasticsearch我们如何在 5 天内在同一个 Elasticsearch 集群中重新索引 360 亿份文档相关的知识,希望对你有一定的参考价值。
1.概述
这篇文章以及更多内容现在是我的免费电子书的一部分,可以在 Github 上找到运行 Elasticsearch for Fun and Profit 的内容。分叉它,给它加星标,打开问题并发送 PR!
在Synthesio,我们在各个地方使用ElasticSearch来运行复杂的查询,眨眼间从数百亿个文档中获取多达 5000 万个丰富的文档。Elasticsearch 使其快速且易于扩展,其中在多个 mysql 集群上运行相同的查询需要几分钟,并且在途中会导致一些服务器崩溃。每一天,我们都在进一步推动 Elasticsearch 的边界,深入了解其内部结构会带来更多的爱。
上周,我们决定使用全新的映射重新索引 136TB 数据集。在大型索引上更新 Elasticsearch 映射很容易
以上是关于Elasticsearch我们如何在 5 天内在同一个 Elasticsearch 集群中重新索引 360 亿份文档的主要内容,如果未能解决你的问题,请参考以下文章
ElasticSearch第5天 es实现分页查询的几种方式
ES 译文之如何使用 Logstash 实现关系型数据库与 ElasticSearch 之间的数据同