SQL Server 全文搜索

Posted

技术标签:

【中文标题】SQL Server 全文搜索【英文标题】:SQL Server Full Text Searching 【发布时间】:2010-09-06 05:36:33 【问题描述】:

我目前正在开发一个应用程序,其中我们有一个 SQL-Server 数据库,我需要进行全文搜索,以便我们搜索人名。

目前,用户可以在搜索 3 个不同 varchar cols 的名称字段中输入 a。名、姓、中间名

假设我有 3 行包含以下信息。

1 - 菲利普 - J - 弗莱

2 - 艾米 - NULL - 黄

3 - Leo - NULL - Wong

如果用户输入诸如“Fry”之类的名称,它将返回第 1 行。但是,如果他们输入 Phillip Fry、Fr 或 Phil,他们将一无所获。我不明白为什么要这样做。如果他们搜索 Wong,他们会得到第 2 行和第 3 行,如果他们搜索 Amy Wong,他们会再次一无所获。

当前查询正在使用 CONTAINSTABLE,但我已将其切换为 FREETEXTTABLE、CONTAINS 和 FREETEXT,结果没有任何明显差异。首选表格方法,因为它们返回相同的结果但有排名。

这是查询。

....
@Name nvarchar(100),
....
--""s added to prevent crash if searching on more then one word.
DECLARE @SearchString varchar(100)
SET @SearchString = '"'+@Name+'"'
SELECT Per.Lastname, Per.Firstname, Per.MiddleName
FROM Person as Per
INNER JOIN CONTAINSTABLE(Person, (LastName, Firstname, MiddleName), @SearchString) 
AS KEYTBL
ON Per.Person_ID = KEYTBL.[KEY]
WHERE KEY_TBL.RANK > 2
ORDER BY KEYTBL.RANK DESC;  
....

任何想法...?为什么这个全文搜索不能正常工作?

【问题讨论】:

【参考方案1】:

FreeTextTable 应该可以工作。

INNER JOIN FREETEXTTABLE(Person, (LastName, Firstname, MiddleName), @SearchString) 

@SearchString 应该包含像“Phillip Fry”这样的值(一个长字符串,包含所有用空格分隔的查找字符串)。

如果您想搜索 Fr 或 Phil,您应该使用星号:Phil* 和 Fr*

“Phil”正在寻找“Phil”这个词。 'Phil*' 正在寻找以 'Phil' 开头的每个单词

【讨论】:

【参考方案2】:

如果您只是搜索人们的姓名,最好不要使用全文索引。当您有大文本字段时,全文索引很有意义,但如果您主要处理每个字段一个单词,我不确定您会从全文索引中获得多少额外收益。在搜索新记录之前等待全文索引自行重新索引可能是众多问题之一。

您可以进行如下查询。在空格上拆分您的搜索字符串,并创建一个搜索词列表。

选择名字、中间名、姓氏 从人 在哪里 名字如@searchterm1 + '%' 或 MiddleName 如 @searchterm1 + '%' 或姓氏,如 @searchterm1 + '%' 或名字如@searchterm2 + '%' 等等....

【讨论】:

【参考方案3】:

另一种方法可能是将搜索从各个字段中抽象出来。

换句话说,在您的数据上创建一个视图,它将所有拆分字段(如名字姓氏)转换为连接字段,即全名

然后搜索视图。这可能会使搜索查询更简单。

【讨论】:

【参考方案4】:

感谢大家的回复,我终于可以让它工作了。 Biri 和 Kibbee 的部分答案。我需要在字符串中添加 * 并将其分解为空格才能工作。所以最后我得到了

....
@Name nvarchar(100),
....
--""s added to prevent crash if searching on more then one word.
DECLARE @SearchString varchar(100)

--Added this line
SET @SearchString = REPLACE(@Name, ' ', '*" OR "*')
SET @SearchString = '"*'+@SearchString+'*"'

SELECT Per.Lastname, Per.Firstname, Per.MiddleName
FROM Person as Per
INNER JOIN CONTAINSTABLE(Person, (LastName, Firstname, MiddleName), @SearchString) 
AS KEYTBL
ON Per.Person_ID = KEYTBL.[KEY]
WHERE KEY_TBL.RANK > 2
ORDER BY KEYTBL.RANK DESC;  
....

搜索的字段更多,我只是简化了问题,对此感到抱歉,我认为这不会影响答案。它实际上搜索包含昵称的 csv 列和注释列的列。

感谢您的帮助。

【讨论】:

请注意,星号作为通配符仅在搜索词的结尾使用时才有效。全文搜索引擎会简单地忽略搜索词开头的星号。 感谢您的回答。你忘了莱拉和班德。我可以为此使用 Lucene 吗?【参考方案5】:

您可能想查看Lucene.net 作为全文的替代方案。

【讨论】:

以上是关于SQL Server 全文搜索的主要内容,如果未能解决你的问题,请参考以下文章

SQL Server 全文搜索

Sql Server 数据库建全文搜索

为啥 SQL Server 全文搜索不匹配数字?

SQL Server 使用全文索引进行页面搜索

立即更新全文搜索索引 - SQL SERVER 2012

SQL Server 全文搜索返回意外结果