用 PLY 解析 python,如何编码缩进和缩进部分

Posted

技术标签:

【中文标题】用 PLY 解析 python,如何编码缩进和缩进部分【英文标题】:Parsing python with PLY, how to code the indent and dedent part 【发布时间】:2013-11-04 17:55:49 【问题描述】:

我试图用 PLY 解析 Python 语言的函数定义。 我遇到了与缩进有关的问题。 例如对于 for 语句,我希望能够知道块何时结束。 我在这里阅读了python语法:http://docs.python.org/2/reference/grammar.html 而这部分的语法是:

for_stmt: 'for' exprlist 'in' testlist ':' suite ['else' ':' suite]
suite: simple_stmt | NEWLINE INDENT stmt+ DEDENT

我不知道如何用 PLY 来描述 INDENT 和 DEDENT 标记。 我正在尝试类似:

def t_indentation(t):
    r'    |\t'
    #some special treatment for the indentation.

但似乎 PLY 认为带有空格的正则表达式与空字符串匹配并且不构建词法分析器...... 即使我能设法获得 INDENT 令牌,我也不确定获得 DEDENT 的方法...

有没有办法用 PLY 做到这一点?

【问题讨论】:

Python 中关于 INDENT 和 DEDENT 的规则比四个空格或一个制表符要复杂。在其他解析器生成器中,使用确定前导空格量是有效缩进还是缩进的语义操作,或者通过干预标记器以注入 INDENT 或 DEDENT 标记来解决问题。 是的,我正在考虑使用 t_indentation 函数进行令牌注入。 PLY 的正则表达式是错误的, r'[ ]4|\t' 更好。谢谢。 看来使用 plyplus 有更简单的方法:github.com/erezsh/plyplus/blob/master/plyplus/grammars/… 【参考方案1】:

您必须使用状态来解析 INDENT 和 UNDENT。

example解析python之类的语言

【讨论】:

那个例子没有使用状态来解析INDENT和UNDENT;它使用后处理步骤。【参考方案2】:

PLY 在其示例中包含一个用于 Python 子集的示例,以演示如何处理缩进:

https://github.com/dabeaz/ply/tree/1321375e013425958ea090b55aecae0a4b7face6/example/GardenSnake

【讨论】:

链接已失效,因为它已在最新版本的 PLY 中被删除,但旧版本在这里:github.com/dabeaz/ply/blob/3.11/example/GardenSnake/…

以上是关于用 PLY 解析 python,如何编码缩进和缩进部分的主要内容,如果未能解决你的问题,请参考以下文章

Python3编码规范

Python解析Python的缩进规则

python3不完全支持python2的缩进策略对吗

Python编码规范

Python语法特点如注释规则代码缩进编码规范等

如何用用Python设计小游戏