多词包含全文搜索仅在 SQL Server 中部分工作

Posted

技术标签:

【中文标题】多词包含全文搜索仅在 SQL Server 中部分工作【英文标题】:Multi-word CONTAINS full-text search only working partially in SQL Server 【发布时间】:2016-04-15 10:52:33 【问题描述】:

我正在使用 SQL Server 2012 并为 COMPANY 表中的 NAME 列创建了全文索引。我测试过的所有搜索都采用以下格式(要搜索的字数不定),以任意顺序的字首匹配:

select id, name from company where contains(name, '"ka*" AND "de*"')

问题是在某些情况下,即使它应该是完美匹配,这个查询也不会返回任何结果。例如,当公司名称为“ka de we oy”时,上面的示例返回匹配项,但“ka*” AND “de*” AND “we*”' 没有,也没有使用所有四个“单词”进行搜索。

还有其他一些情况,奇怪的是,即使使用精确的单词,搜索也不会返回结果。这似乎与非常短(两个字母)的单词有关。使用许多 (6+) 字词进行搜索也存在一些问题。

对单个查询中的单词数量或它们的长度是否有明确的限制?我该如何解决或解决此问题?

编辑:似乎某些常见的英语单词完全被排除在索引之外(例如示例中的“我们”)。这是一个问题,因为它要求一些常用词绝对应该是可搜索的。有没有办法改变哪些词没有被索引或例如更改索引的“语言”以应用不同的常用词集?

【问题讨论】:

【参考方案1】:

显然,这只是定义正确的停用词/停用词列表的一个案例:

https://msdn.microsoft.com/en-us/library/ms142551.aspx

https://msdn.microsoft.com/en-us/library/cc280405.aspx

或者将列的全文索引语言设置为实际语言,这样英文单词就不会引起问题。

编辑:实际上,完全禁用表格的停止列表是最简单的:

ALTER FULLTEXT INDEX ON company SET STOPLIST = OFF

希望这对其他人有帮助

【讨论】:

以上是关于多词包含全文搜索仅在 SQL Server 中部分工作的主要内容,如果未能解决你的问题,请参考以下文章

使用全文搜索来查找部分单词 (SQL Server 2008)

SQL Server 全文搜索

SQL Server 中全文搜索的奇怪行为

立即更新全文搜索索引 - SQL SERVER 2012

SQL Server 全文搜索

SQL Server 全文搜索对我不起作用