lucene vs solr 评分

Posted

技术标签:

【中文标题】lucene vs solr 评分【英文标题】:lucene vs solr scoring 【发布时间】:2011-04-04 04:53:53 【问题描述】:

谁能用更简单的语言解释(或引用参考)比较 SOLR 和 LUCENE 使用的评分机制。 它们有什么区别吗?

我不太擅长 solr/lucene,但我的发现表明它们似乎不同。

P.S:我只是尝试了一个简单的查询,比如“+Contents:risk”,没有使用任何过滤器。

【问题讨论】:

【参考方案1】:

Lucene 使用来自Vector space model 的概念来计算文档的分数。总之,查询和文档可以看作是向量。为了计算特定查询的文档得分,Lucene 计算每个文档的向量与查询向量的距离。在 VSM 中,文档越靠近查询,得分越高。您可以通过查看 Lucene 的 Similarity 类和 Lucene 的 Scoring 文档来了解更多详细信息。

【讨论】:

【参考方案2】:

实际公式可以在Similarity javadocs中找到。

Here's 所涉及参数的摘要及其含义的简要说明。

Solr 在后台使用 Lucene,默认使用 Solr uses the default Lucene similarity algorithm。

【讨论】:

以上是关于lucene vs solr 评分的主要内容,如果未能解决你的问题,请参考以下文章

如何标准化 solr/lucene 分数?

Elasticsearch VS Solr

lucene自定义过滤器

lucene 的评分机制

SOLR源码分析—edismax检索打分机制

如何实现Solr自定义评分查询