在 PHP 中将布尔表达式解析为 MySql 查询
Posted
技术标签:
【中文标题】在 PHP 中将布尔表达式解析为 MySql 查询【英文标题】:Parsing a boolean expression into a MySql query in PHP 【发布时间】:2020-12-04 15:52:26 【问题描述】:这是仅有的两个密切相关的表。无需为其他人打扰。
mysql> describe skill_usage;
+----------+---------+------+-----+---------+-------+
| Field | Type | Null | Key | Default | Extra |
+----------+---------+------+-----+---------+-------+
| skill_id | int(11) | NO | MUL | NULL | |
| job_id | int(11) | NO | MUL | NULL | |
+----------+---------+------+-----+---------+-------+
mysql> describe skill_names;
+------------+----------+------+-----+---------+----------------+
| Field | Type | Null | Key | Default | Extra |
+------------+----------+------+-----+---------+----------------+
| skill_id | int(11) | NO | PRI | NULL | auto_increment |
| skill_name | char(32) | NO | MUL | NULL | |
+------------+----------+------+-----+---------+----------------+
基本上,用户使用技能名称输入布尔搜索字符串。
我将技能名称转换为skill_id
,然后想生成一个MySql查询,通过解析用户的搜索字符串,从表skill_usage
中获取所有匹配的job_id
。
字符串可以包含技能名称、运算符 AND 和 OR,以及表示优先级的括号。
一些例子可能是
C C 或 C++ C++ 和 UML (C 与内核)或(C++ 与 UML)但表达式的复杂性没有限制——这是我的问题。
我不是 SQL 专家,如果我错了,请纠正我。我想我想开始 SELECT job_id FROM skill_usage
然后解析,并构建查询的其余部分。
对于第一个例子,只是技能名称 C,我想添加 WHERE skillId = X
,其中 X 是从表 skill_names
中获取的。
对于一个简单的OR
,例如C OR C++
,我可以使用IN
子句 - WHERE skillId IN (X, Y)
(同样,X 和 Y 是查找技能名称以获得skill_id
)。
对于一个简单的AND
,比如C++ AND UML
,我认为我需要一个INNER JOIN
,比如WHERE skill_id = X INNER JOIN skill_usage ON skill_usage.skill_id = Y
(其中X 是C++ 的skill_id
和UML 的Y)。
对于那些简单的情况(?),我认为这是大致正确的。
但是,当我遇到像(C AND kernel) OR (C++ AND UML)
这样更复杂的情况时,我会感到困惑。
这里是否适合使用正则表达式或算法?
@AnthonyVallée-Dubois 对this question 的回答看起来我可以修改它,但它似乎也很复杂。我希望让事情变得更简单,但不确定如何开始(php 编码不是我的问题,只是正则表达式或算法)。
更新
我正在尝试将解析与查询分开,并使用this question 来整理查询。
我得到了类似的答案
SELECT job_id
FROM skill_usage
WHERE skill_id IN (3, 4)
GROUP BY job_id
HAVING MIN(skill_id) <> MAX(skill_id);
和
select s1.job_id
from skill_usage s1
where s1.skill_id = 3
and s1.job_id in (
select s2.job_id
from skill_usage s2
where s2.skill_id = 4
)
后者看起来更具可扩展性。
而我的 PHP 将搜索字符串转换为 SQL 查询的伪代码大致是
fail if mis-matched brackets
reduce multiple spaces to single
removes spaces before and after closing/opening bracket "( " & " )"
foreach c in string
if c == (
else
if c === )
else
if AND
else
if OE
else
# it's a skill name
【问题讨论】:
为什么要查找 Skill_name 来获取 Skill_id?只需使用技能名称,因为您已经拥有它 另外,我不会让用户输入该字符串。使用下拉菜单或让他们添加到多选并从中自己构建。通过这种方式,您可以在表单中向他们显示技能名称关联技能 ID,并在查询更容易时使用它。 lekkerlogic.com/2016/02/… 这是您需要的:***.com/questions/9130284/… 提示:不要加入,只需为您在源字符串中遇到的每个技能标签发出AND EXISTS(...from skill_usage WHERE ...)
。 ( ) OR AND NOT
可以按原样发出。
【参考方案1】:
简单的查询生成器,假设为 PDO
## for simple tokenisation, the terms are separated by space here.
## ###############################################################
$string = "( C AND kernel ) OR ( C++ AND UML )";
function emit_term( $tag )
$res = " EXISTS (
SELECT *
FROM skill_usage su
JOIN skill_names sn ON sn.skill_id = su.skill_id
WHERE su.Job_id = j.job_id
AND sn.skillname = :" . $tag . ")\n";
return $res;
$fixed_part ="
SELECT job_id, job_name
FROM jobs j
WHERE 1=1
AND \n" ;
# $tokens = explode( ' ' , $string ); #splits on any single space
$tokens = preg_split( '/[\s]+/' , $string ); # accepts multiple whitespace
# print_r ( $tokens );
$query = $fixed_part;
$args = array();
$num = 1;
foreach ( $tokens as $tok )
switch ($tok)
case '': # skip empty tokens
case ';': # No, you should not!
case '"':
case "'":
case ';': break;
case '(': $query .= '('; break;
case ')': $query .= ')'; break;
case '&':
case 'AND': $query .= ' AND '; break;
case '|':
case 'OR': $query .= ' OR '; break;
case '!':
case 'NOT': $query .= ' NOT '; break;
default:
$tag = '_q' . $num ;
$query .= emit_term ( $tag );
$args[$tag] = $tok;
$num += 1;
break;
$query .= ";\n\n";
echo "Query + parameters (for PDO):\n" ;
echo $query;
print_r ( $args) ;
输出:
SELECT job_id, job_name
FROM jobs j
WHERE 1=1
AND
( EXISTS (
SELECT *
FROM skill_usage su
JOIN skill_names sn ON sn.skill_id = su.skill_id
WHERE su.Job_id = j.job_id
AND sn.skillname = :_q1)
AND EXISTS (
SELECT *
FROM skill_usage su
JOIN skill_names sn ON sn.skill_id = su.skill_id
WHERE su.Job_id = j.job_id
AND sn.skillname = :_q2)
) OR ( EXISTS (
SELECT *
FROM skill_usage su
JOIN skill_names sn ON sn.skill_id = su.skill_id
WHERE su.Job_id = j.job_id
AND sn.skillname = :_q3)
AND EXISTS (
SELECT *
FROM skill_usage su
JOIN skill_names sn ON sn.skill_id = su.skill_id
WHERE su.Job_id = j.job_id
AND sn.skillname = :_q4)
);
Array
(
[_q1] => C
[_q2] => kernel
[_q3] => C++
[_q4] => UML
)
【讨论】:
看起来不错,但在“( C OR C++ OR UML )
”上失败了。我可以让它处理多个 AND/OR,我会奖励几个 100 奖金。谢谢!
删除多个空格即可。
... 或在生成查询时跳过空标记。 (见更新)
天啊!谢谢。比我正在努力的解决方案要好得多。只要系统允许,我会奖励你200赏金以上是关于在 PHP 中将布尔表达式解析为 MySql 查询的主要内容,如果未能解决你的问题,请参考以下文章