Elasticsearches 查询 去重

Posted 九师兄

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Elasticsearches 查询 去重相关的知识,希望对你有一定的参考价值。

在这里插入图片描述

1.概述

转载:Elasticsearch6.X 去重详解

1、题记

Elasticsearch有没有类似mysql的distinct的去重功能呢?

1)如何去重计数?
类似mysql: select distinct(count(1)) from my_table;
2)如何获取去重结果。
类似mysql:SELECT DISTINCT name,age FROM users;

2、需求

1)对ES的检索结果进行去重统计计数。
2)对ES的检索结果去重后显示

3、分析

1)统计计数需要借助ES聚合功能结合cardinality实现。
2)去重显示结果有两种方式:
方式一:使用字段聚合+top_hots聚合方式。
方式二:使用collapse折叠功能。

4、DSL源码

1)统计去重数目。

GET books/_search
{
  "size": 0,
  "aggs": {
    "books_count": {
      "cardinality": {
        "field": "title.keyword"
      }
    }
  }
}

2)返回去重内容
方式一:top_hits聚合

GET books/_search
{
  "query": {
    "match_all": {}
  },
  "aggs": {
    "type": {
      "terms": {
        "field": "title.keyword",
        "size": 10
      },
      "aggs": {
        "title_top": {
          "top_hits": {
            "_source": {
              "includes": [
                "title"
              ]
            },
            "sort": [
              {
                "title.keyword": {
                  "order": "desc"
                }
              }
            ],
            "size": 1
          }
        }
      }
    }
  },
  "size": 0
}

方式二:折叠

GET books/_search
{
"query": {
"match_all":{}
},
"collapse": {
"field": "title.keyword"
}
}

方式二较方式一:
1)简化;
2)性能比aggs的实现要好很多。
更多DSL详见:http://t.cn/RmafXMJ

5、注意事项&小结
1、折叠功能ES5.3版本之后才发布的。
2、聚合&折叠只能针对keyword类型有效;
3、只要思想不滑坡,方案总比问题多!

以上是关于Elasticsearches 查询 去重的主要内容,如果未能解决你的问题,请参考以下文章

Elasticsearches 各种查询 详解

Elasticsearches keywods 类型数据 写入后查询不到

ElasticsearchES 慢查询 profile 参数

Elasticsearches 模糊查询导致Elasticsearch服务宕机

ElasticSearchES5新特性-keyword-text类型-查询区别

ElasticsearchES 7.8 写入 查询 Normalizer 忽略 大小写