Elasticsearch消除 Elasticsearch 中的重复文档

Posted 九师兄

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Elasticsearch消除 Elasticsearch 中的重复文档相关的知识,希望对你有一定的参考价值。

在这里插入图片描述

1.概述

翻译:消除 Elasticsearch 中的重复文

参考:【Elasticsearch】如何在 Elasticsearch 中查找并移除重复文档

在 Reddit 上分享 在领英上分享 在脸书上分享 分享到Twitter 复制网址
避免 Elasticsearch 索引中的重复总是一件好事。但是您可以通过消除重复获得其他好处:节省磁盘空间、提高搜索准确性、提高硬件资源管理效率。也许最重要的是,您减少了搜索的获取时间。

令人惊讶的是,关于此主题的文档很少,因此我们提供本教程,为您提供识别和管理索引中重复项的正确技术。

对于这篇文章,我们将在 Qbox.io 上使用托管的 Elasticsearch。您可以在此处注册或启动您的集群,或单击标题导航中的“开始使用”。如果您在设置方面需要帮助,请参阅“配置 Qbox Elasticsearch 集群”。“

示例数据

这里有四个简单的文档,其中一个是另一个的副本。我们在 name

以上是关于Elasticsearch消除 Elasticsearch 中的重复文档的主要内容,如果未能解决你的问题,请参考以下文章

docker安装elasticsearch

ElasticSearch(站内搜索)

elasticsearch的安装部署

Elasticsearch消除 Elasticsearch 中的重复文档

elasticsearch配置文件详解

elasticsearch配置文件详解