Elasticsearch Elasticsearch 多字段查询 best_fieldsmost_fieldscross_fields,傻傻分不清楚?

Posted 九师兄

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Elasticsearch Elasticsearch 多字段查询 best_fieldsmost_fieldscross_fields,傻傻分不清楚?相关的知识,希望对你有一定的参考价值。

在这里插入图片描述

1.概述

转载:Elasticsearch 多字段查询 best_fields、most_fields、cross_fields,傻傻分不清楚?

1.1 题记

Multi-match query 的目的多字段匹配,但 Multi-match query 中的 best_fields, most_fields, cross_fields 分不清楚,都什么含义?

下面我们一一举例解读。

1.1.1 best_fields

为默认值,如果不指定,默认best_fields 匹配。
含义:多个字段中,返回评分最高的。
类似:dis_max query

等价举例:(两个一起看,加深理解)

默认 best_fields 与 dis_max等价
POST blogs/_search
{
  "query": {
    "multi_match": {
      "type": "best_fields",
      "query": "Quick pets",
      "fields": [
        "title",
        "body"
      ],
      "tie_breaker": 0.2
    }
  }
}

与上述best_fields等价

POST blogs/_search
{
  "query": {
    "dis_max": {
      "queries": [
        {
          "match": {
            "title": "Quick pets"
          }
        },
        {
          "match": {
            "body": "Quick pets"
          }
        }
      ],
      "tie_breaker": 0.2
    }
  }
}

1.1.2 most_fields

含义:匹配多个字段,返回的综合评分(非最高分)

类似:bool + 多字段匹配。

等价举例:(两个一起看,加深理解)

most_fields 与下面的 bool 查询等价。

GET /titles/_search
{
  "query": {
    "multi_match": {
      "query": "barking dogs",
      "type": "most_fields",
      "fields": [
        "title^10",
        "title.std"
      ]
    }
  }
}

与上面的most_fields等价

GET titles/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "match": {
            "title": {
              "query": "barking dogs",
              "boost": 10
            }
          }
        },
        {
          "match": {
            "title.std": "barking dogs"
          }
        }
      ]
    }
  }
}

1.1.3 cross_fields

含义:跨字段匹配——待查询内容在多个字段中都显示。

类似:bool + dis_max 组合。

等价举例:(两个一起看,加深理解)

与下面的bool查询逻辑一致

GET test003/_validate/query?explain=true
{
  "query": {
    "multi_match": {
      "query": "Will Smith",
      "type": "cross_fields",
      "fields": [
        "first_name",
        "last_name"
      ],
      "operator": "and"
    }
  }
}
 
 
GET test003/_validate/query?explain=true

返回:

"explanation" : "+blended(terms:[first_name:will, last_name:will]) +blended(terms:[first_name:smith, last_name:smith])"

与上面的cross_fields 基本等价,评分不一致,待深究

POST test003/_validate/query?explain=true
{
  "query": {
    "bool": {
      "must": [
        {
          "dis_max": {
            "queries": [
              {
                "match": {
                  "first_name": "Will"
                }
              },
              {
                "match": {
                  "last_name": "Will"
                }
              }
            ]
          }
        },
        {
          "dis_max": {
            "queries": [
              {
                "match": {
                  "first_name": "Smith"
                }
              },
              {
                "match": {
                  "last_name": "Smith"
                }
              }
            ]
          }
        }
      ]
    }
  }
}

2.小结

类似辨识度不好区分的 Elastic 知识点,考虑通过实战例子加以区分,实战一把,有助于提升选型效率。

N.参考:

1、https://zhuanlan.zhihu.com/p/24832190

2、https://github.com/mingyitianxia/deep_elasticsearch

以上是关于Elasticsearch Elasticsearch 多字段查询 best_fieldsmost_fieldscross_fields,傻傻分不清楚?的主要内容,如果未能解决你的问题,请参考以下文章

elasticsearch使用笔记

ElasticSearch技术文档

ElasticSearch 5.4 自定义插件

spark 怎么去连接 ElasticSearch

elasticsearch 性能监控基础(转)

ElasticSearch核心概念