Elasticsearch7.8.0版本进阶——文档搜索

Posted 小志的博客

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Elasticsearch7.8.0版本进阶——文档搜索相关的知识,希望对你有一定的参考价值。

目录

一、文档搜索的概述

  • 早期的全文检索会为整个文档集合建立一个很大的倒排索引并将其写入到磁盘。 一旦新的索引就绪,旧的就会被其替换,这样最近的变化便可以被检索到。
  • 倒排索引被写入磁盘后是不可改变的,它永远不会修改。

二、倒排索引不可变的优点

  • 不需要锁:如果你从来不更新索引,你就不需要担心多进程同时修改数据的问题。
  • 一旦索引被读入内核的文件系统缓存,便会留在哪里,由于其不变性。只要文件系统缓存中还有足够的空间,那么大部分读请求会直接请求内存,而不会命中磁盘。这提供了很大的性能提升。
  • 其它缓存(像 filter 缓存),在索引的生命周期内始终有效。它们不需要在每次数据改变时被重建,因为数据不会变化。
  • 写入单个大的倒排索引允许数据被压缩,减少磁盘 I/O 和 需要被缓存到内存的索引的使用量。

三、倒排索引不可变的优点

  • 倒排索引是不可变的,你不能修改它。
  • 如果需要让一个新的文档可被搜索,你需要重建整个索引。会对一个索引所能包含的数据量造成了很大的限制,或者对索引可被更新的频率造成了很大的限制。

以上是关于Elasticsearch7.8.0版本进阶——文档搜索的主要内容,如果未能解决你的问题,请参考以下文章

Elasticsearch7.8.0版本进阶——倒排索引

Elasticsearch7.8.0版本进阶——近实时搜索

Elasticsearch7.8.0版本进阶——分片控制

Elasticsearch7.8.0版本进阶——分布式集群(故障转移)

Elasticsearch7.8.0版本进阶——持久化变更

Elasticsearch7.8.0版本进阶——数据更新流程