Elasticsearch 7 探索之路文档的 CRUD 和批量操作

Posted tfengstorm

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Elasticsearch 7 探索之路文档的 CRUD 和批量操作相关的知识,希望对你有一定的参考价值。

上一篇,我们介绍了什么是 Elasticsearch,它能做什么用以及基本概念(索引 Index、文档 Document、类型 Type)理解。这篇主要对 文档的基本 CRUD 和 倒排索引进行讲解。下面让我们进入正题。

一、文档的 CRUE

Create 文档

支持自动生成文档 Id 和指定文档 Id 两种方法

#create document. 自动生成 Id
POST songs/_doc
{
  "name":"说好不哭",
  "author":"周杰伦",
  "price":3
}

#create document. 指定Id。如果 Id 已经存在,报错
PUT songs/_create/1
{
  "name":"说好不哭",
  "author":"周杰伦",
  "price":3
}

Get 文档

#找到文档
Get songs/_doc/1

result:
{
  "_index" : "songs",
  "_type" : "_doc",
  "_id" : "1",
  "_version" : 1,
  "_seq_no" : 0,
  "_primary_term" : 1,
  "found" : true,
  "_source" : {
    "name" : "说好不哭",
    "author" : "周杰伦",
    "price" : 3
  }
}
  • 找到文档,返回 HTTP 200
    • 文档元信息
      • _index/_type/,_type 在版本7中只有 _doc 类型
      • _version 版本信息,同一个 Id 的文档被删除了,版本号也会增加
      • _source 中默认包含文档的原始信息
  • 找不到,返回 HTTP 404

Index 文档

Index 也是用于创建文档的方法,和 Create 不同有一些不同,如果文档不存在情况,直接创建新文档,否者删除原来的文档,新文档被索引,_version 版本加一。

PUT songs/_doc/1
{
  "name":"说好不哭",
  "author":"周杰伦",
  "price":0
}

result:
{
  "_index" : "songs",
  "_type" : "_doc",
  "_id" : "1",
  "_version" : 2,//+1
  "result" : "updated",
  "_shards" : {
    "total" : 2,
    "successful" : 2,
    "failed" : 0
  },
  "_seq_no" : 1,
  "_primary_term" : 1
}

Update 文档

  • Update 不会删除原来文档,而是实现真正更新
  • Post 方法和 Payload 需要包含在 "doc" 中
#在原文档上增加字段
POST songs/_update/1
{
    "doc":{
        "update" : "2019-05-15T14:12:12"
    }
}

GET songs/_doc/1
{
  "_index" : "songs",
  "_type" : "_doc",
  "_id" : "1",
  "_version" : 3,
  "_seq_no" : 2,
  "_primary_term" : 1,
  "found" : true,
  "_source" : {
    "name" : "说好不哭",
    "author" : "周杰伦",
    "price" : 0,
    "update" : "2019-05-15T14:12:12"
  }
}

Delete 文档

#Delete by Id
#删除文档
DELETE users/_doc/1

Bulk 批量操作

  • Bulk 支持再一次调用中,对不同索引进行操作
  • 支持 Index、Create、Update、Delete 类型操作
  • 单条错误不影响其他操作进行
  • 每一条操作都会有对应的执行的结果显示
POST _bulk
{ "index" : { "_index" : "test1", "_id" : "1" } }
{ "field1" : "value1" }
{ "delete" : { "_index" : "test1", "_id" : "2" } }
{ "create" : { "_index" : "test2", "_id" : "3" } }
{ "field3" : "value3" }
{ "update" : { "_index" : "test1","_id" : "1"} }
{ "doc" : {"field2" : "value2"} }

mget 批量读取

顾名思义就是可以对不同索引的文档进行批量读取,只需要提供索引名称和 Id 就可以在一次 API 中全部读取,减少网络开销。

GET /test1/_mget
{
    "docs" : [
        {
            "_id" : "1"
        },
        {
            "_id" : "2"
        }
    ]
}

msearch 批量查询

同样 ES 也提供了 msearch 对不同索引进行批量查询。

# msearch 操作
POST kibana_sample_data_ecommerce/_msearch
{}
{"query" : {"match_all" : {}},"size":1}
{"index" : "kibana_sample_data_flights"}
{"query" : {"match_all" : {}},"size":2}

注:kibana_sample_data_ecommerce 可以在 kibana 的样例数据,需要手动点击添加。

本篇主要对文档的 CRUD 以及批量操作 API 进行讲解。在这里提一点,批量操作可以帮助我们提高对 API 调用性能,但如果一次提交过多数据,也是有可能会导致 ES 过大的压力,反而造成性能下降。

系列文章

【Elasticsearch 7 搜索之路】(一)什么是 Elasticsearch?

以上是关于Elasticsearch 7 探索之路文档的 CRUD 和批量操作的主要内容,如果未能解决你的问题,请参考以下文章

ElasticSearch探索之路实战:环境搭建RESTCRUDSearch

ElasticSearch探索之路实战:环境搭建RESTCRUDSearch

ElasticSearch探索之路分布式原理:分布式路由存储搜索原理

ElasticSearch探索之路分布式原理:分布式路由存储搜索原理

ElasticSearch探索之路初始ElasticSearch:特点应用场景架构设计基本概念

ElasticSearch探索之路初识ElasticSearch:特点应用场景架构设计基本概念