如何使用特定领域短语的字典/模型调整检索和排名排名器?

Posted

技术标签:

【中文标题】如何使用特定领域短语的字典/模型调整检索和排名排名器?【英文标题】:How can I tune the Retrieve and Rank ranker with a dictionary/model of domain specific phrases? 【发布时间】:2016-08-10 15:45:35 【问题描述】:

我们正在尝试将短语组合在一起以改善结果。

例如,如果用户提出“我什么时候必须更换空调过滤器?”之类的问题。对于特定领域的短语,例如“空调”,R&R 返回一些包含术语“空气”但没有“空调”的答案,或者它返回包含其他术语(如气囊或空气过滤器)的答案。

这可以使用原始 Solr 实例并在引号之间设置短语来完成。因此,Solr 查询如下所示:

...     
"debug": 
    "rawquerystring": "When do I have to change the filter of my \"air conditioning\" ?",
    "querystring": "When do I have to change the filter of my \"air conditioning\" ?",
    "parsedquery": "text:when text:do text:i text:have text:to text:change text:the text:filter text:of text:my PhraseQuery(text:\"air conditioning\") text:?",
    "parsedquery_toString": "text:when text:do text:i text:have text:to text:change text:the text:filter text:of text:my text:\"air conditioning\" text:?",      
...

但是,R&R guide 声明:

语法与标准 Solr 语法不同如下:

您可以搜索单个词或短语。你不需要 与 Solr 一样,用双引号将短语括起来,但你 可以在查询中包含短语,它们由 排名模型。

我们无法找到有关上述声明的更多详细信息。

但是,据我们了解,排名器应该识别短语。如果是这样的话,我们想知道是否有一种方法可以设置短语字典来调整排名? 或者,我们可以设置自己的法律短语模型吗?实现这一目标有哪些选择?

谢谢

【问题讨论】:

【参考方案1】:

目前 RnR 不支持严格的短语查询,但有些功能会考虑术语排序和相邻术语。我们正在开发一个新版本的服务,用户将能够使用完整的常规 solr 查询语法(包括指定短语)来检索文档。

【讨论】:

以上是关于如何使用特定领域短语的字典/模型调整检索和排名排名器?的主要内容,如果未能解决你的问题,请参考以下文章

从短文本中提取和排名关键字

如何调整我的NoSQL查询以显示正确的结果?预期结果是显示软件的最高销售排名

使用 google play 游戏检索玩家排名

ASO检索规则-热词覆盖如何来做?

如何让 sql 排名查询工作以查找特定 id 的排名

web of science使用之如何迅速找到植物科学相关领域内的SCI期刊及排名