在 Python 中动态评估简单的布尔逻辑
Posted
技术标签:
【中文标题】在 Python 中动态评估简单的布尔逻辑【英文标题】:Dynamically evaluating simple boolean logic in Python 【发布时间】:2011-01-28 21:11:57 【问题描述】:我有一些动态生成的布尔逻辑表达式,例如:
(A 或 B)和(C 或 D) A 或(A 和 B) 一个 空 - 计算结果为真占位符被替换为布尔值。我应该,
-
将此信息转换为 Python 表达式,例如
True or (True or False)
和 eval
吗?
创建一个节点为bool
或Conjunction
/Disjunction
对象的二叉树并递归评估它?
将其转换为嵌套的 S 表达式并使用 Lisp 解析器?
还有别的吗?
欢迎提出建议。
【问题讨论】:
【参考方案1】:这是我用大约一个半小时(加上将近一个小时的重构时间)构建的一个小(可能包括空格在内的 74 行)模块:
str_to_token = 'True':True,
'False':False,
'and':lambda left, right: left and right,
'or':lambda left, right: left or right,
'(':'(',
')':')'
empty_res = True
def create_token_lst(s, str_to_token=str_to_token):
"""create token list:
'True or False' -> [True, lambda..., False]"""
s = s.replace('(', ' ( ')
s = s.replace(')', ' ) ')
return [str_to_token[it] for it in s.split()]
def find(lst, what, start=0):
return [i for i,it in enumerate(lst) if it == what and i >= start]
def parens(token_lst):
"""returns:
(bool)parens_exist, left_paren_pos, right_paren_pos
"""
left_lst = find(token_lst, '(')
if not left_lst:
return False, -1, -1
left = left_lst[-1]
#can not occur earlier, hence there are args and op.
right = find(token_lst, ')', left + 4)[0]
return True, left, right
def bool_eval(token_lst):
"""token_lst has length 3 and format: [left_arg, operator, right_arg]
operator(left_arg, right_arg) is returned"""
return token_lst[1](token_lst[0], token_lst[2])
def formatted_bool_eval(token_lst, empty_res=empty_res):
"""eval a formatted (i.e. of the form 'ToFa(ToF)') string"""
if not token_lst:
return empty_res
if len(token_lst) == 1:
return token_lst[0]
has_parens, l_paren, r_paren = parens(token_lst)
if not has_parens:
return bool_eval(token_lst)
token_lst[l_paren:r_paren + 1] = [bool_eval(token_lst[l_paren+1:r_paren])]
return formatted_bool_eval(token_lst, bool_eval)
def nested_bool_eval(s):
"""The actual 'eval' routine,
if 's' is empty, 'True' is returned,
otherwise 's' is evaluated according to parentheses nesting.
The format assumed:
[1] 'LEFT OPERATOR RIGHT',
where LEFT and RIGHT are either:
True or False or '(' [1] ')' (subexpression in parentheses)
"""
return formatted_bool_eval(create_token_lst(s))
简单的测试给出:
>>> print nested_bool_eval('')
True
>>> print nested_bool_eval('False')
False
>>> print nested_bool_eval('True or False')
True
>>> print nested_bool_eval('True and False')
False
>>> print nested_bool_eval('(True or False) and (True or False)')
True
>>> print nested_bool_eval('(True or False) and (True and False)')
False
>>> print nested_bool_eval('(True or False) or (True and False)')
True
>>> print nested_bool_eval('(True and False) or (True and False)')
False
>>> print nested_bool_eval('(True and False) or (True and (True or False))')
True
[可能部分偏离主题]
注意,您可以轻松地配置使用提供的穷人依赖注入方式(token_to_char=token_to_char
和朋友)使用的令牌(操作数和运算符)以同时拥有多个不同的评估器(只需重置“默认注入”全局变量会留下一个单一的行为)。
例如:
def fuzzy_bool_eval(s):
"""as normal, but:
- an argument 'Maybe' may be :)) present
- algebra is:
[one of 'True', 'False', 'Maybe'] [one of 'or', 'and'] 'Maybe' -> 'Maybe'
"""
Maybe = 'Maybe' # just an object with nice __str__
def or_op(left, right):
return (Maybe if Maybe in [left, right] else (left or right))
def and_op(left, right):
args = [left, right]
if Maybe in args:
if True in args:
return Maybe # Maybe and True -> Maybe
else:
return False # Maybe and False -> False
return left and right
str_to_token = 'True':True,
'False':False,
'Maybe':Maybe,
'and':and_op,
'or':or_op,
'(':'(',
')':')'
token_lst = create_token_lst(s, str_to_token=str_to_token)
return formatted_bool_eval(token_lst)
给予:
>>> print fuzzy_bool_eval('')
True
>>> print fuzzy_bool_eval('Maybe')
Maybe
>>> print fuzzy_bool_eval('True or False')
True
>>> print fuzzy_bool_eval('True or Maybe')
Maybe
>>> print fuzzy_bool_eval('False or (False and Maybe)')
False
【讨论】:
nested_bool_eval
如果您实际上不执行任何操作,则会失败,即nested_bool_eval("True")
(或 False)。
这令人不安。 (掌声)
@mlvljr 使用 False or False or True
时失败,因为它没有父级并在 if not has_parens: return self.bool_eval(token_list)
中返回 python 正确评估此表达式:>>> False or False or True ---> True
@Besnik 事实是,这是在假设中编写的,排序由括号明确给出(就像在 OP 的文本中一样),但是是的,要么检查它是否属实,要么可能只需假设左或右操作关联性,然后应用必要的转换。【参考方案2】:
编写一个可以处理这个问题的评估器应该不难,例如使用pyparsing。您只需处理几个操作(和、或、和分组?),因此您应该能够自己解析和评估它。
您不需要显式地形成二叉树来评估表达式。
【讨论】:
这个 pyparsing 示例 (pyparsing.wikispaces.com/file/view/simpleBool.py) 应该几乎是一个插入式解决方案。 我会接受这个答案,因为它不像eval()
那样可怕,而且它是最容易扩展的。
答案现在无效,wikispaces.com
已死。
Simplebool.py 仍然可以使用 Internet Archive/Wayback Machine web.archive.org/web/20180718202715/http://… 找到
现场版github.com/pyparsing/pyparsing/blob/master/examples/…【参考方案3】:
如果您使用您关心的局部变量和全局变量设置字典,那么您应该能够安全地将它们与表达式一起传递到 eval()
。
【讨论】:
这里不用eval
;您只需要评估一种非常简单的语言,而不是 Python。 (此外,如果您最终想要传递很多内容,则将传递给本地/全局变量的内容限制为 eval
并不能保证其安全,当然也不会阻止不可能的大计算。)【参考方案4】:
听起来像使用 SymPy 逻辑模块的小菜一碟。他们甚至在文档中有一个例子:http://docs.sympy.org/0.7.1/modules/logic.html
【讨论】:
【参考方案5】:我写这篇文章是因为我今天解决了一个类似的问题,我在寻找线索的时候就在这里。 (带有任意字符串标记的布尔解析器,稍后会转换为布尔值)。
在考虑了不同的选项(自己实现解决方案或使用某些包)后,我决定使用 Lark,https://github.com/lark-parser/lark
如果你使用 LALR(1),它很容易使用并且速度很快
这是一个可以匹配您的语法的示例
from lark import Lark, Tree, Transformer
base_parser = Lark("""
expr: and_expr
| or_expr
and_expr: token
| "(" expr ")"
| and_expr " " and " " and_expr
or_expr: token
| "(" expr ")"
| or_expr " " or " " or_expr
token: LETTER
and: "and"
or: "or"
LETTER: /[A-Z]+/
""", start="expr")
class Cleaner(Transformer):
def expr(self, children):
num_children = len(children)
if num_children == 1:
return children[0]
else:
raise RuntimeError()
def and_expr(self, children):
num_children = len(children)
if num_children == 1:
return children[0]
elif num_children == 3:
first, middle, last = children
return Tree(data="and_expr", children=[first, last])
else:
raise RuntimeError()
def or_expr(self, children):
num_children = len(children)
if num_children == 1:
return children[0]
elif num_children == 3:
first, middle, last = children
return Tree(data="or_expr", children=[first, last])
else:
raise RuntimeError()
def get_syntax_tree(expression):
return Cleaner().transform(base_parser.parse(expression))
print(get_syntax_tree("A and (B or C)").pretty())
注意:我选择的正则表达式故意与空字符串不匹配(Lark 出于某种原因不允许这样做)。
【讨论】:
【参考方案6】:您可以使用 Lark 语法库https://github.com/lark-parser/lark 来执行此操作
from lark import Lark, Transformer, v_args, Token, Tree
from operator import or_, and_, not_
calc_grammar = f"""
?start: disjunction
?disjunction: conjunction
| disjunction "or" conjunction -> or_.__name__
?conjunction: atom
| conjunction "and" atom -> and_.__name__
?atom: BOOLEAN_LITTERAL -> bool_lit
| "not" atom -> not_.__name__
| "(" disjunction ")"
BOOLEAN_LITTERAL: TRUE | FALSE
TRUE: "True"
FALSE: "False"
%import common.WS_INLINE
%ignore WS_INLINE
"""
@v_args(inline=True)
class CalculateBoolTree(Transformer):
or_ = or_
not_ = not_
and_ = and_
allowed_value = "True": True, "False": False
def bool_lit(self, val: Token) -> bool:
return self.allowed_value[val]
calc_parser = Lark(calc_grammar, parser="lalr", transformer=CalculateBoolTree())
calc = calc_parser.parse
def eval_bool_expression(bool_expression: str) -> bool:
return calc(bool_expression)
print(eval_bool_expression("(True or False) and (False and True)"))
print(eval_bool_expression("not (False and True)"))
print(eval_bool_expression("not True or False and True and True"))
【讨论】:
以上是关于在 Python 中动态评估简单的布尔逻辑的主要内容,如果未能解决你的问题,请参考以下文章