PHP/MySQL:突出显示“SOUNDS LIKE”查询结果

Posted

技术标签:

【中文标题】PHP/MySQL:突出显示“SOUNDS LIKE”查询结果【英文标题】:PHP/MySQL: Highlight "SOUNDS LIKE" query results 【发布时间】:2010-12-19 04:38:13 【问题描述】:

快速 mysql/php 问题。如果使用普通搜索查询未找到任何结果,我将使用“不那么严格”的搜索查询作为后备,以达到以下目的:

foreach($find_array as $word)  
  clauses[] = "(firstname SOUNDS LIKE '$word%' OR lastname SOUNDS LIKE '$word%')";

if (!empty($clauses)) $filter='('.implode(' AND ', $clauses).')';
$query = "SELECT * FROM table WHERE $filter";

现在,我使用 PHP 来突出显示结果,例如:

foreach ($find_array as $term_to_highlight)
    foreach ($result as $key => $result_string)
        $result[$key]=highlight_stuff($result_string, $term_to_highlight);
    

但是当我不知道要突出显示什么时,这种方法就会失败。有什么方法可以在运行 mysql 查询时找出“声音相似”匹配是什么?

也就是说,如果有人搜索“Joan”,我希望它改为突出显示“John”。

【问题讨论】:

也许查询 SELECT * FROM table WHERE $clauses 是 SELECT * FROM table WHERE $filter? 呃,是的——很抱歉。我试图简化我手头的脚本的可怕混乱,但它却从我身边溜走了。 【参考方案1】:

SOUND LIKE 条件只是比较两个单词的 SOUNDEX 键,您可以使用 PHP soundex() 函数生成相同的键。

因此,如果您找到匹配的行并需要找出要突出显示的单词,则可以同时获取名字和姓氏,然后使用 PHP 查找匹配的行并仅突出显示该单词。

我编写此代码只是为了尝试一下。 (必须测试我的理论 xD)

<?php
// A space seperated string of keywords, presumably from a search box somewhere.
$search_string = 'John Doe';

// Create a data array to contain the keywords and their matches.
// Keywords are grouped by their soundex keys.
$data = array();
foreach(explode(' ', $search_string) as $_word) 
    $data[soundex($_word)]['keywords'][] = $_word;


// Execute a query to find all rows matching the soundex keys for the words.
$soundex_list = "'". implode("','", array_keys($data)) ."'";
$sql = "SELECT id, firstname, lastname
        FROM   sounds_like
        WHERE  SOUNDEX(firstname) IN($soundex_list)
        OR     SOUNDEX(lastname)  IN($soundex_list)";
$sql_result = $dbLink->query($sql);

// Add the matches to their respective soundex key in the data array.
// This checks which word matched, the first or last name, and tags
// that word as the match so it can be highlighted later.
if($sql_result) 
    while($_row = $sql_result->fetch_assoc()) 
        foreach($data as $_soundex => &$_elem) 
            if(soundex($_row['firstname']) == $_soundex) 
                $_row['matches'] = 'firstname';
                $_elem['matches'][] = $_row;
            
            else if(soundex($_row['lastname']) == $_soundex) 
                $_row['matches'] = 'lastname';
                $_elem['matches'][] = $_row;
            
        
    


// Print the results as a simple text list.
header('content-type: text/plain');
echo "-- Possible results --\n";

foreach($data as $_group) 
    // Print the keywords for this group's soundex key.
    $keyword_list = "'". implode("', '", $_group['keywords']) ."'";
    echo "For keywords: $keyword_list\n";

    // Print all the matches for this group, if any.
    if(isset($_group['matches']) && count($_group['matches']) > 0) 
        foreach($_group['matches'] as $_match) 
            // Highlight the matching word by encapsulatin it in dashes.
            if($_match['matches'] == 'firstname') 
                $_match['firstname'] = "-$_match['firstname']-";
            
            else 
                $_match['lastname'] = "-$_match['lastname']-";
            

            echo " #$_match['id']: $_match['firstname'] $_match['lastname']\n";
        
    
    else 
        echo " No matches.\n";
    

?>

一个更通用的函数,从字符串中提取匹配的 soundex 单词可能如下所示:

<?php
/**
 * Attempts to find the first word in the $heystack that is a soundex
 * match for the $needle.
 */
function find_soundex_match($heystack, $needle) 
    $words = explode(' ', $heystack);
    $needle_soundex = soundex($needle);
    foreach($words as $_word) 
        if(soundex($_word) == $needle_soundex) 
            return $_word;
        
    
    return false;

?>

如果我理解正确,可以在您之前发布的代码中使用:

foreach ($find_array as $term_to_highlight)
    foreach ($result as $key => $result_string)
        $match_to_highlight = find_soundex_match($result_string, $term_to_highlight);
        $result[$key]=highlight_stuff($result_string, $match_to_highlight);
    

这不会像第一个 sn-p 中更有针对性的代码那样有效。

【讨论】:

【参考方案2】:

请注意,SOUNDS LIKE 并不像您想象的那样工作。它不等同于 MySQL 中的LIKE,因为它不支持% 通配符。

这意味着在搜索“John”时,您的查询不会找到“John David”。如果这只是您的后备方案,这可能是可以接受的,但这并不理想。

所以这里有一个不同的建议(可能需要改进);首先使用 PHPs soundex() 函数找到您要查找的关键字的 soundex。

$soundex = soundex($word);
$soundexPrefix = substr($soundex, 0, 2); // first two characters of soundex
$sql = "SELECT lastname, firstname ".
    "FROM table WHERE SOUNDEX(lastname) LIKE '$soundexPrefix%' ".
    "OR SOUNDEX(firstname) LIKE '$soundexPrefix%'";

现在您将获得一个名字和姓氏的列表,这些名字和姓氏在发音上具有模糊的相似性(这可能是很多条目,您可能希望增加用于搜索的 soundex 前缀的长度)。然后,您可以计算每个单词的 soundex 与您的搜索词之间的 Levenshtein 距离,并按此排序。

其次,你应该看看 MySQL 中的参数化查询,以避免 SQL 注入错误。

【讨论】:

感谢您指出这一点。不过,在我的情况下,“John”确实匹配“John David”。我将查询分解为单词,并根据我搜索的每个字段检查每个单词。如,如果搜索字符串是“John David”,则“WHERE(姓氏听起来像'John'或名字听起来像'John')和(姓氏听起来像'David'或名字听起来像'David')。如果它只是约翰,它只会在 AND 之前执行第一部分 - 所以它确实匹配。但可能不是最有效的方法,对吧? 是的,可能。然后我的解决方案就变成了一个真正不存在的问题的解决方法...... :)

以上是关于PHP/MySQL:突出显示“SOUNDS LIKE”查询结果的主要内容,如果未能解决你的问题,请参考以下文章

如何在文本突出显示期间保留语法突出显示

如何取消突出显示视觉辅助 x 突出显示的查找结果?

Qt突出显示选定的行会覆盖单个单词的突出显示

html 突出显示JS以进行代码突出显示

iTextSharp PDF 使用 C# 读取突出显示的文本(突出显示注释)

更改netbeans中自动突出显示的变量名的突出显示颜色?