如何使用特定领域短语的字典/模型调整检索和排名排名器?
Posted
技术标签:
【中文标题】如何使用特定领域短语的字典/模型调整检索和排名排名器?【英文标题】:How can I tune the Retrieve and Rank ranker with a dictionary/model of domain specific phrases? 【发布时间】:2016-08-10 15:45:35 【问题描述】:我们正在尝试将短语组合在一起以改善结果。
例如,如果用户提出“我什么时候必须更换空调过滤器?”之类的问题。对于特定领域的短语,例如“空调”,R&R 返回一些包含术语“空气”但没有“空调”的答案,或者它返回包含其他术语(如气囊或空气过滤器)的答案。
这可以使用原始 Solr 实例并在引号之间设置短语来完成。因此,Solr 查询如下所示:
...
"debug":
"rawquerystring": "When do I have to change the filter of my \"air conditioning\" ?",
"querystring": "When do I have to change the filter of my \"air conditioning\" ?",
"parsedquery": "text:when text:do text:i text:have text:to text:change text:the text:filter text:of text:my PhraseQuery(text:\"air conditioning\") text:?",
"parsedquery_toString": "text:when text:do text:i text:have text:to text:change text:the text:filter text:of text:my text:\"air conditioning\" text:?",
...
但是,R&R guide 声明:
语法与标准 Solr 语法不同如下:
您可以搜索单个词或短语。你不需要 与 Solr 一样,用双引号将短语括起来,但你 可以在查询中包含短语,它们由 排名模型。
我们无法找到有关上述声明的更多详细信息。
但是,据我们了解,排名器应该识别短语。如果是这样的话,我们想知道是否有一种方法可以设置短语字典来调整排名? 或者,我们可以设置自己的法律短语模型吗?实现这一目标有哪些选择?
谢谢
【问题讨论】:
【参考方案1】:目前 RnR 不支持严格的短语查询,但有些功能会考虑术语排序和相邻术语。我们正在开发一个新版本的服务,用户将能够使用完整的常规 solr 查询语法(包括指定短语)来检索文档。
【讨论】:
以上是关于如何使用特定领域短语的字典/模型调整检索和排名排名器?的主要内容,如果未能解决你的问题,请参考以下文章