在 Elasticsearch 中计算相关性评分与 Couchbase 有何不同?

Posted

技术标签:

【中文标题】在 Elasticsearch 中计算相关性评分与 Couchbase 有何不同?【英文标题】:How does calculating relevance scoring in Elasticsearch differ from Couchbase? 【发布时间】:2020-06-22 06:08:04 【问题描述】:

我想知道elasticsearch中的相关性分数是否与couchbase有差异?

【问题讨论】:

【参考方案1】:

根据this 2019 couchbase 线程,看起来他们仍在使用tf/idf 进行评分,而 Elasticsearch 曾经使用相同的算法,但现在移至BM25 algorithm for score calculation from 5.0。

注意:TF/IDF 是一种非常流行的计算相关性分数的算法,基于词频和逆文档频率,而 BM25 是最新的基于概率的即兴形式评分更多细节可以在 here 和 here 找到它们。

注意:在问题中,没有提到您比较系统相关性的目的是什么,我的两分钱是如果您正在构建一个成熟的搜索系统并且相关性对您很重要,那么您应该选择Elasticseaech 的主要功能是搜索,在选择不同的算法和不同的方式来定义评分机制方面具有很大的灵活性,这在 Couchbase 等 NoSQL 解决方案中是不存在的。

【讨论】:

@badboy,您能否接受并投票赞成答案,如果它对您有帮助,这将激励我们帮助社区。​​span>

以上是关于在 Elasticsearch 中计算相关性评分与 Couchbase 有何不同?的主要内容,如果未能解决你的问题,请参考以下文章

ElasticSearch探索之路权重计算与文本分析:布尔模型TF/IDF向量空间模型分析与分析器

ElasticSearch探索之路权重计算与文本分析:布尔模型TF/IDF向量空间模型分析与分析器

Elasticsearch学习笔记(十四)relevance score相关性评分的计算

Elasticsearch系列---相关性评分算法及正排索引

Elasticsearch系列---相关性评分算法及正排索引

Elasticsearch系列---相关性评分算法及正排索引