Elasticsearch实用BM25 -第2部分:BM25算法及其变量

Posted 九师兄

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Elasticsearch实用BM25 -第2部分:BM25算法及其变量相关的知识,希望对你有一定的参考价值。

在这里插入图片描述

1.概述

转载:https://www.elastic.co/cn/blog/practical-bm25-part-2-the-bm25-algorithm-and-its-variables

这是实用BM25系列三部分中关于相似度排名(相关性)的第二篇文章。如果您刚刚加入,请查看第1部分:碎片如何影响Elasticsearch中的相关性评分。

2. BM25算法

我将在这里尝试深入研究数学,只是在解释发生了什么绝对必要的情况下,但这是我们查看BM25公式的结构,以获得一些见解发生了什么。首先我们来看一下公式,然后我将把每个部分分解成可以理解的部分:

在这里插入图片描述
我们可以看到一些常见的分量,比如
在这里插入图片描述

以及一些关于字段长度的东西。以下是这些内容的全部内容:

  1. q

以上是关于Elasticsearch实用BM25 -第2部分:BM25算法及其变量的主要内容,如果未能解决你的问题,请参考以下文章

ElasticSearch实战-TF/IDF/BM25分值计算(文本搜索排序分值计算,全文检索算法,文本相似度算法)

Elasticsearch使用篇 - 查询排序

搜索之BM25和BM25F模型

bm25

BM25算法语义相似度计算

超级好看的大数据电子书分享《从Lucene到Elasticsearch:全文检索实战》