ElasticSearch Scroll 游标搜索
Posted @SmartSi
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ElasticSearch Scroll 游标搜索相关的知识,希望对你有一定的参考价值。
ElasticSearch版本:2.x
1. 深分页
在ElasticSearch 分页搜索一文中,我们了解到分布式系统中深度分页。在这里我们再具体的了解一下深度分页,可能带来的问题,以及 ElasticSearch 给出的解决方案。
在 ElasticSearch 内部原理之分布式文档搜索 一文中我们了解到分布式搜索的工作原理,分布式搜索这种先查后取的过程支持用 from
和 size
参数分页,但是这是有限制的。需要注意的是,每个分片必须构建一个长度为 from+size
的优先级队列,所有这些队列都需要传递回协调节点。协调节点需要对 number_of_shards *(from + size)
个文档进行排序,从而正确找到 size
个文档。
取决于你的文档的大小,分片的数量和你使用的硬件,给 10,000 到 50,000 的结果文档深分页( 1,000 到 5,000 页)是完全可行的。但是如果 from
值比较大,排序过程代价可能会非常大,会花费大量的CPU、内存和带宽。因为这个原因&#x
以上是关于ElasticSearch Scroll 游标搜索的主要内容,如果未能解决你的问题,请参考以下文章
ElasticSearch操作之游标查询Scroll Search