ES 父子文档查询

Posted 小鱼#

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ES 父子文档查询相关的知识,希望对你有一定的参考价值。

父子文档的特点

1. 父/子文档是完全独立的。

2. 父文档更新不会影响子文档。

3. 子文档更新不会影响父文档或者其它子文档。

父子文档的映射与索引

1. 父子关系 type 的建立必须在索引新建或 update-mapping 时候确定好

PUT /company
{
  "mappings": {
    "branch": {},             //父文档 type
    "employee": {            
      "_parent": {
        "type": "branch"      //子文档 type
      }
    }
  }
}

2. 父文档的索引和普通文档索引一样。

POST /company/branch/_bulk
{ "index": { "_id": "london" }}
{ "name": "London Westminster", "city": "London", "country": "UK" }

3. 子文档索引必须指定其对应的父文档 ID,作用:

  • 建立父子文档之间的关联
  • 确保子文档能够被索引到父文档所在分片(parent id 作为 route)
PUT /company/employee/1?parent=london     //指定 id = london 的父文档
{
  "name":  "Alice Smith",
  "dob":   "1970-10-24",
  "hobby": "hiking"
}

4. 如果要更改文档的父文档,不能仅仅 update 或者 reindex 旧文档(新的父文档可能在不同分片上),需要先删除旧文档再重新索引。

 

父子关系的应用

看到 parent-child 关系,我们很容易想到的是像 SQL 那样的各种 JOIN 操作——比如查询某个文档并一并取回所有的父或子文档等。

然而,ES 中不支持类似的 JOIN 查询。

在 ES 中的 parent-child 关系基本可以理解为仅仅是一个过滤条件,如下:

//查询某文档,只有该文档有"父文档"且满足一定条件才算匹配
{"has_parent": {                //文档是否有 parent
      "type": "branch",         //其 parent 所在 type 必须是 branch
      "query": {                //其 parent 必须满足以下 query 条件
        "match": {
          "country": "UK"
        }
      }
    }                           //如果满足以上条件,hit 该文档
}
//查询某文档,只有该文档有"子文档"且满足一定条件才算匹配
{
"has_child": {                       //文档是否有 child
      "type":       "employee",      //其 child所在 type 必须是 employee
      "query": {                     //其 parent 必须满足以下 query 条件
        "match": {
          "name": "Alice Smith"
        }
      }
    }                                //如果满足以上条件,hit 该文档
}

 

1. has_child:基于子文档的内容,查找父文档

//请求
GET /company/branch/_search
{
  "query": {
    "has_child": {                                //基于 child 的内容,查询满足条件的 parent 文档
      "type":       "employee",
      "query": {                                   //在 child 中执行 match query操作
        "match": {
          "name": "Alice Smith"
        }
      }
    }
  }
}
//结果
{
  "took": 2,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "failed": 0
  },
  "hits": {
    "total": 1,
    "max_score": 1,
    "hits": [
      {
        "_index": "company",
        "_type": "branch",                     //注意!!!返回的是 parent 的文档
        "_id": "london",
        "_score": 1,
        "_source": {
          "name": "London Westminster",
          "city": "London",
          "country": "UK"
        }
      }
    ]
  }
}

2. has_parent:基于父文档的内容,查找子文档

//请求 GET /company/employee/_search
{
  "query": {
    "has_parent": {                       //基于 parent 的内容,查询满足条件的 child 文档
      "type": "branch", 
      "query": {                             //在 parent 中执行 match query 查询
        "match": {
          "country": "UK"
        }
      }
    }
  }
}
//结果 
{
  "took": 2,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "failed": 0
  },
  "hits": {
    "total": 1,
    "max_score": 1,
    "hits": [
      {
        "_index": "company",
        "_type": "employee",              //注意!!!返回的是 child 的文档
        "_id": "1",
        "_score": 1,
        "_routing": "london",
        "_parent": "london",
        "_source": {
          "name": "Alice Smith",
          "dob": "1970-10-24",
          "hobby": "hiking"
        }
      }
    ]
  }
}

3. children aggregation:

以上是关于ES 父子文档查询的主要内容,如果未能解决你的问题,请参考以下文章

Elasticsearch学习-父子文档

Elastic认证特训营 难点解读09——父子关联查询实战搞不定怎么办?

Elasticsearch 指定特定分片进行存储或者查询

跟我学Elasticsearch(7) es的嵌套聚合,下钻分析,聚合分析

干货 | Elasticsearch Nested类型深入详解

ES7-Es8 js代码片段