Elasticsearch实用BM25 -第1部分: shard 如何影响Elasticsearch中的相关性评分

Posted 九师兄

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Elasticsearch实用BM25 -第1部分: shard 如何影响Elasticsearch中的相关性评分相关的知识,希望对你有一定的参考价值。

在这里插入图片描述

1.概述

翻译:https://www.elastic.co/cn/blog/practical-bm25-part-1-how-shards-affect-relevance-scoring-in-elasticsearch

这是三部分实用BM25系列中关于相似度排名(相关性)的第一个帖子。下一篇文章链接在底部。

背景

在Elasticsearch 5.0中,我们将Okapi BM25作为默认的相似度算法,这是用于对与查询相关的结果进行评分的算法。我不会在这篇博客中过多地介绍BM25与其他方法的对比,但如果你想了解BM25的理论论证,你可以跳转到Elastic{on} 2016的BM25解神秘化演示。相反,我将为您介绍BM25的实际用法,包括可用的参数和影响评分的因素。

请记住,这个博客主要是为文本文档评分的。也就是说,它真正专注于帮助我们的搜索用户。如果您正在为日志或指标建立索引,并返回按某个明确的元数据/数字顺序(如时间戳)排序的结果,那么这个博客主要是为了满足您的好奇心。

理解sh

以上是关于Elasticsearch实用BM25 -第1部分: shard 如何影响Elasticsearch中的相关性评分的主要内容,如果未能解决你的问题,请参考以下文章

ElasticSearch实战-TF/IDF/BM25分值计算(文本搜索排序分值计算,全文检索算法,文本相似度算法)

Elasticsearch使用篇 - 查询排序

搜索之BM25和BM25F模型

bm25

BM25算法语义相似度计算

超级好看的大数据电子书分享《从Lucene到Elasticsearch:全文检索实战》