在 PHP 中将布尔表达式解析为 MySql 查询

Posted

技术标签:

【中文标题】在 PHP 中将布尔表达式解析为 MySql 查询【英文标题】:Parsing a boolean expression into a MySql query in PHP 【发布时间】:2020-12-04 15:52:26 【问题描述】:

这是仅有的两个密切相关的表。无需为其他人打扰。

mysql> describe skill_usage;
+----------+---------+------+-----+---------+-------+
| Field    | Type    | Null | Key | Default | Extra |
+----------+---------+------+-----+---------+-------+
| skill_id | int(11) | NO   | MUL | NULL    |       |
| job_id   | int(11) | NO   | MUL | NULL    |       |
+----------+---------+------+-----+---------+-------+

mysql> describe skill_names;
+------------+----------+------+-----+---------+----------------+
| Field      | Type     | Null | Key | Default | Extra          |
+------------+----------+------+-----+---------+----------------+
| skill_id   | int(11)  | NO   | PRI | NULL    | auto_increment |
| skill_name | char(32) | NO   | MUL | NULL    |                |
+------------+----------+------+-----+---------+----------------+

基本上,用户使用技能名称输入布尔搜索字符串。

我将技能名称转换为skill_id,然后想生成一个MySql查询,通过解析用户的搜索字符串,从表skill_usage中获取所有匹配的job_id

字符串可以包含技能名称、运算符 AND 和 OR,以及表示优先级的括号。

一些例子可能是

C C 或 C++ C++ 和 UML (C 与内核)或(C++ 与 UML)

但表达式的复杂性没有限制——这是我的问题。

我不是 SQL 专家,如果我错了,请纠正我。我想我想开始 SELECT job_id FROM skill_usage 然后解析,并构建查询的其余部分。

对于第一个例子,只是技能名称 C,我想添加 WHERE skillId = X,其中 X 是从表 skill_names 中获取的。

对于一个简单的OR,例如C OR C++,我可以使用IN 子句 - WHERE skillId IN (X, Y)(同样,X 和 Y 是查找技能名称以获得skill_id)。

对于一个简单的AND,比如C++ AND UML,我认为我需要一个INNER JOIN,比如WHERE skill_id = X INNER JOIN skill_usage ON skill_usage.skill_id = Y(其中X 是C++ 的skill_id 和UML 的Y)。

对于那些简单的情况(?),我认为这是大致正确的。

但是,当我遇到像(C AND kernel) OR (C++ AND UML) 这样更复杂的情况时,我会感到困惑。

这里是否适合使用正则表达式或算法?

@AnthonyVallée-Dubois 对this question 的回答看起来我可以修改它,但它似乎也很复杂。我希望让事情变得更简单,但不确定如何开始(php 编码不是我的问题,只是正则表达式或算法)。

更新

我正在尝试将解析与查询分开,并使用this question 来整理查询。

我得到了类似的答案

SELECT job_id
FROM skill_usage
WHERE skill_id IN (3, 4)
GROUP BY job_id
HAVING MIN(skill_id) <> MAX(skill_id);

select s1.job_id
  from skill_usage s1
  where s1.skill_id = 3
    and s1.job_id in (
                       select s2.job_id
                         from skill_usage s2
                        where s2.skill_id = 4
                     )

后者看起来更具可扩展性。

而我的 PHP 将搜索字符串转换为 SQL 查询的伪代码大致是

fail if mis-matched brackets

reduce multiple spaces to single
removes spaces before and after closing/opening bracket  "( " & " )"

foreach c in string

   if c == (
   
   else
      if c === )
      
      else
         if AND
         
         else
           if OE
           
           else
              # it's a skill name

【问题讨论】:

为什么要查找 Skill_name 来获取 Skill_id?只需使用技能名称,因为您已经拥有它 另外,我不会让用户输入该字符串。使用下拉菜单或让他们添加到多选并从中自己构建。通过这种方式,您可以在表单中向他们显示技能名称关联技能 ID,并在查询更容易时使用它。 lekkerlogic.com/2016/02/… 这是您需要的:***.com/questions/9130284/… 提示:不要加入,只需为您在源字符串中遇到的每个技能标签发出AND EXISTS(...from skill_usage WHERE ...)( ) OR AND NOT 可以按原样发出。 【参考方案1】:

简单的查询生成器,假设为 PDO


        ## for simple tokenisation, the terms are separated by space here.
        ## ###############################################################
$string = "( C AND kernel ) OR ( C++ AND UML )";

function emit_term( $tag ) 
$res = " EXISTS (
                SELECT *
                FROM skill_usage su
                JOIN skill_names sn ON sn.skill_id = su.skill_id
                WHERE su.Job_id = j.job_id
                AND sn.skillname = :" . $tag . ")\n";
return $res;



$fixed_part ="
SELECT job_id, job_name
 FROM jobs j
 WHERE 1=1
 AND \n" ;


# $tokens = explode( ' ' , $string ); #splits on any single space
$tokens = preg_split( '/[\s]+/' , $string ); # accepts multiple whitespace
# print_r ( $tokens );

$query = $fixed_part;

$args = array();
$num = 1;
foreach ( $tokens as $tok ) 
        switch ($tok) 
        case '':  # skip empty tokens
        case ';':  # No, you should not!
        case '"':
        case "'":
        case ';':  break;
        case '(': $query .= '('; break;
        case ')': $query .= ')'; break;
        case '&':
        case 'AND': $query .= ' AND '; break;
        case '|':
        case 'OR': $query .= ' OR '; break;
        case '!':
        case 'NOT': $query .= ' NOT '; break;
        default:
                $tag = '_q' . $num ;
                $query .= emit_term ( $tag );
                $args[$tag] = $tok;
                $num += 1;
                 break;
                
        
$query .= ";\n\n";

echo "Query + parameters (for PDO):\n" ;
echo $query;
print_r ( $args) ;
          

输出:


SELECT job_id, job_name
 FROM jobs j
 WHERE 1=1
 AND 
( EXISTS (
        SELECT *
        FROM skill_usage su
        JOIN skill_names sn ON sn.skill_id = su.skill_id
        WHERE su.Job_id = j.job_id
        AND sn.skillname = :_q1)
 AND  EXISTS (
        SELECT *
        FROM skill_usage su
        JOIN skill_names sn ON sn.skill_id = su.skill_id
        WHERE su.Job_id = j.job_id
        AND sn.skillname = :_q2)
) OR ( EXISTS (
        SELECT *
        FROM skill_usage su
        JOIN skill_names sn ON sn.skill_id = su.skill_id
        WHERE su.Job_id = j.job_id
        AND sn.skillname = :_q3)
 AND  EXISTS (
        SELECT *
        FROM skill_usage su
        JOIN skill_names sn ON sn.skill_id = su.skill_id
        WHERE su.Job_id = j.job_id
        AND sn.skillname = :_q4)
);

Array
(
    [_q1] => C
    [_q2] => kernel
    [_q3] => C++
    [_q4] => UML
)

                     

【讨论】:

看起来不错,但在“( C OR C++ OR UML )”上失败了。我可以让它处理多个 AND/OR,我会奖励几个 100 奖金。谢谢! 删除多个空格即可。 ... 或在生成查询时跳过空标记。 (见更新) 天啊!谢谢。比我正在努力的解决方案要好得多。只要系统允许,我会奖励你200赏金

以上是关于在 PHP 中将布尔表达式解析为 MySql 查询的主要内容,如果未能解决你的问题,请参考以下文章

如何在 PHP 中解析一串布尔逻辑

在php中将字符串转换为MySQL时间戳格式

无法在控制台应用程序中将值''解析为类型'布尔值

php url/rest 布尔逻辑解析器

如何在 PHP/MYSQL 中将两个 mysql 查询作为一个执行?

如果在配置中将布尔值设置为 true,我如何获得? [关闭]