Elasticsearch消除 Elasticsearch 中的重复文档
Posted 九师兄
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Elasticsearch消除 Elasticsearch 中的重复文档相关的知识,希望对你有一定的参考价值。
1.概述
参考:【Elasticsearch】如何在 Elasticsearch 中查找并移除重复文档
在 Reddit 上分享 在领英上分享 在脸书上分享 分享到Twitter 复制网址
避免 Elasticsearch 索引中的重复总是一件好事。但是您可以通过消除重复获得其他好处:节省磁盘空间、提高搜索准确性、提高硬件资源管理效率。也许最重要的是,您减少了搜索的获取时间。
令人惊讶的是,关于此主题的文档很少,因此我们提供本教程,为您提供识别和管理索引中重复项的正确技术。
对于这篇文章,我们将在 Qbox.io 上使用托管的 Elasticsearch。您可以在此处注册或启动您的集群,或单击标题导航中的“开始使用”。如果您在设置方面需要帮助,请参阅“配置 Qbox Elasticsearch 集群”。“
示例数据
这里有四个简单的文档,其中一个是另一个的副本。我们在 name
以上是关于Elasticsearch消除 Elasticsearch 中的重复文档的主要内容,如果未能解决你的问题,请参考以下文章