“!”上的 pyYAML 错误在一个字符串中

Posted

技术标签:

【中文标题】“!”上的 pyYAML 错误在一个字符串中【英文标题】:pyYAML Errors on "!" in a string 【发布时间】:2012-10-28 04:09:56 【问题描述】:

首先,免责声明:我对 YAML 不太熟悉。我正在尝试将 YAML 文档解析为键值对(不用担心我是怎么做的。我已经处理好了)

我的文件曾经看起来像:

world:
     people:
          name:Suzy
          address:chez-bob

然后,有人去改了。

world:
     people:
          name:!$uzy
          address:chez-bob

我得到这个解析错误:

yaml.constructor.ConstructorError: could not determine a constructor for the tag '!$uzy'

这甚至意味着什么?我将如何让它仅将 !$ 解释为两个字符? 我只想要一个字符串键和值的字典! 此外,编辑 yaml 文件不是一种选择。必须使用解析器在代码中修复问题。

【问题讨论】:

所以是的,我现在意识到 !告诉它构造一个 $uzy,然而,文件的内容不是我关心的。以优雅的方式处理它是。我想要它做的是将 !$uzy 视为文本。 用单引号或双引号括起来。 '!$uzy' 或 "!$uzy"。这将确保字符串被视为字符串。具有讽刺意味的是,我提出这个问题是因为我需要做相反的事情——我需要构造函数。所以所有的努力都没有白费。 【参考方案1】:

感叹号是 YAML 标签的前缀。解析器必须通过标签名称为它实现一个构造函数。有一些默认标签,如 !!bool!!int 等,甚至还有一些 Python 特定标签,如 !!python/tuple

您可以定义自己的构造函数,甚至可以为前缀捕获的多个标签定义构造函数。通过将前缀定义为'',您可以捕获所有标签并忽略它们。您可以从构造函数返回标签及其值,将其全部视为文本。

>>> import yaml
>>> def default_ctor(loader, tag_suffix, node):
...     print loader
...     print tag_suffix
...     print node
...     return tag_suffix + ' ' + node.value
...
>>> yaml.add_multi_constructor('', default_ctor)
>>> yaml.load(y)
<yaml.loader.Loader object at 0xb76ce8ec>
!$uzy
ScalarNode(tag=u'!$uzy', value=u'')
'world': 'people': 'name': '!$uzy', 'address': 'chez-bob'
>>>

【讨论】:

能否提供一个更详细的例子,有类似的问题here 将前缀指定为'' 对我不起作用,我不得不将其设置为'!'【参考方案2】:

这实际上是 PyYAML 中的一个错误。它将name:!$uzy 中的: 解释为键/值分隔符,但仅当: 后跟一个空格或前面的标量(name)被引用时才应该这样做。后续错误是应该允许在标量中间的感叹号被错误地解释为在标量的开头并因此引入了标签。

people 的值是字符串 name:!$uzy address:chez-bob 并且在其他解析器中正确处理(包括我是作者的 Python 包 ruamel.yaml)。

【讨论】:

2017 年初,PyYAML 的源代码中似乎已对此进行了修复。但由于上一个版本是 2016 年 8 月和 2014 年 3 月之前的版本,因此可能需要几个月/几年在 PyPI 上可用之前。【参考方案3】:

如果值以“!”开头,则必须将值括在单引号或双引号中;否则将被解释为 YAML 标签。

world:
     people:
          name: "!$uzy"
          address: chez-bob

【讨论】:

以上是关于“!”上的 pyYAML 错误在一个字符串中的主要内容,如果未能解决你的问题,请参考以下文章

禁用 PyYAML 值转换

pyyaml 并仅对字符串使用引号

PyYaml - 使用特殊字符(即重音符号)转储 unicode

如何控制 PyYAML 用于我的数据的标量形式?

Python的PyYAML模块详解

使用 yaml 文件进行机器人框架参数化