多词包含全文搜索仅在 SQL Server 中部分工作
Posted
技术标签:
【中文标题】多词包含全文搜索仅在 SQL Server 中部分工作【英文标题】:Multi-word CONTAINS full-text search only working partially in SQL Server 【发布时间】:2016-04-15 10:52:33 【问题描述】:我正在使用 SQL Server 2012 并为 COMPANY 表中的 NAME 列创建了全文索引。我测试过的所有搜索都采用以下格式(要搜索的字数不定),以任意顺序的字首匹配:
select id, name from company where contains(name, '"ka*" AND "de*"')
问题是在某些情况下,即使它应该是完美匹配,这个查询也不会返回任何结果。例如,当公司名称为“ka de we oy”时,上面的示例返回匹配项,但“ka*” AND “de*” AND “we*”' 没有,也没有使用所有四个“单词”进行搜索。
还有其他一些情况,奇怪的是,即使使用精确的单词,搜索也不会返回结果。这似乎与非常短(两个字母)的单词有关。使用许多 (6+) 字词进行搜索也存在一些问题。
对单个查询中的单词数量或它们的长度是否有明确的限制?我该如何解决或解决此问题?
编辑:似乎某些常见的英语单词完全被排除在索引之外(例如示例中的“我们”)。这是一个问题,因为它要求一些常用词绝对应该是可搜索的。有没有办法改变哪些词没有被索引或例如更改索引的“语言”以应用不同的常用词集?
【问题讨论】:
【参考方案1】:显然,这只是定义正确的停用词/停用词列表的一个案例:
https://msdn.microsoft.com/en-us/library/ms142551.aspx
https://msdn.microsoft.com/en-us/library/cc280405.aspx
或者将列的全文索引语言设置为实际语言,这样英文单词就不会引起问题。
编辑:实际上,完全禁用表格的停止列表是最简单的:
ALTER FULLTEXT INDEX ON company SET STOPLIST = OFF
希望这对其他人有帮助
【讨论】:
以上是关于多词包含全文搜索仅在 SQL Server 中部分工作的主要内容,如果未能解决你的问题,请参考以下文章