如何将数据附加到 YAML 文件

Posted

技术标签:

【中文标题】如何将数据附加到 YAML 文件【英文标题】:How to append data to YAML file 【发布时间】:2018-07-16 15:45:02 【问题描述】:

我有一个文件*.yaml,内容如下:

bugs_tree:
  bug_1:
    html_arch: filepath
    moved_by: user1
    moved_date: '2018-01-30'
    sfx_id: '1'

我想在节点[bugs_tree]下的这个文件中添加一个新的子元素 我试图这样做如下:

if __name__ == "__main__":
    new_yaml_data_dict = 
        'bug_2': 
            'sfx_id': '2', 
            'moved_by': 'user2', 
            'moved_date': '2018-01-30', 
            'html_arch': 'filepath'
        
    

    with open('bugs.yaml','r') as yamlfile:
        cur_yaml = yaml.load(yamlfile)
        cur_yaml.extend(new_yaml_data_dict)
        print(cur_yaml)

那么文件应该是这样的:

bugs_tree:
  bug_1:
    html_arch: filepath
    moved_by: username
    moved_date: '2018-01-30'
    sfx_id: '1234'
  bug_2:
    html_arch: filepath
    moved_by: user2
    moved_date: '2018-01-30'
    sfx_id: '2'

当我尝试执行 .append().extend().insert() 时出现错误

cur_yaml.extend(new_yaml_data_dict)
AttributeError: 'dict' object has no attribute 'extend'

【问题讨论】:

绝对没有必要使用load(),它被证明是不安全的。请改用safe_load(). 【参考方案1】:

不确定这是否适合每个人的用例,但我发现您可以...追加到文件如果它只包含***列表

这样做的一个动机是它很有意义。另一个是我对每次都必须重新加载和解析整个 yaml 文件持怀疑态度。我想做的是使用 Django 中间件来记录传入的请求,以调试我在开发中的多个页面加载时遇到的错误,这对时间非常关键。

如果我必须按照 OP 的要求去做,我会考虑将错误留在他们自己的文件中,并从中编写 bugs_tree 的内容。

import os
import yaml
def write(new_yaml_data_dict):

    if not os.path.isfile("bugs.yaml"):

        with open("bugs.yaml", "a") as fo:
            fo.write("---\n")

    #the leading spaces and indent=4 are key here!
    sdump = "  " + yaml.dump(
                new_yaml_data_dict
                ,indent=4
                )

    with open("bugs.yaml", "a") as fo:
        fo.write(sdump)

new_yaml_data_dict = 
        'bug_1': 
            'sfx_id': '1', 
            'moved_by': 'user2', 
            'moved_date': '2018-01-20', 
            'html_arch': 'filepath'
        
    
write(new_yaml_data_dict)
new_yaml_data_dict = 
        'bug_2': 
            'sfx_id': '2', 
            'moved_by': 'user2', 
            'moved_date': '2018-01-30', 
            'html_arch': 'filepath'
        
    
write(new_yaml_data_dict)

导致

---
  bug_1:
    html_arch: filepath
    moved_by: user2
    moved_date: '2018-01-20'
    sfx_id: '1'
  bug_2:
    html_arch: filepath
    moved_by: user2
    moved_date: '2018-01-30'
    sfx_id: '2'

【讨论】:

【参考方案2】:

你需要使用update

cur_yaml.update(new_yaml_data_dict)

结果代码

with open('bugs.yaml','r') as yamlfile:
        cur_yaml = yaml.load(yamlfile)
        cur_yaml.update(new_yaml_data_dict)
        print(cur_yaml)

with open('bugs.yaml','w') as yamlfile:
        yaml.safe_dump(cur_yaml, yamlfile) # Also note the safe_dump

【讨论】:

您确定要使用 .update 吗? AttributeError:“列表”对象没有属性“更新” 您的回溯表明您正在对 dict 应用扩展,这是不可能的。 list 总是使用 extend 而 dict 使用 update。因此,无论您的数据结构是什么,您都可以相应地使用。 @Qex 这缺少write 步骤。【参考方案3】:

如果您想更新文件,读取是不够的。 您还需要针对该文件再次写入。 这样的事情会起作用:

with open('bugs.yaml','r') as yamlfile:
    cur_yaml = yaml.safe_load(yamlfile) # Note the safe_load
    cur_yaml['bugs_tree'].update(new_yaml_data_dict)

if cur_yaml:
    with open('bugs.yaml','w') as yamlfile:
        yaml.safe_dump(cur_yaml, yamlfile) # Also note the safe_dump

我没有对此进行测试,但他的想法是您使用 readread 文件并 write写入文件。使用safe_loadsafe_dump 就像Anthon 说的:

“绝对没有必要使用 load(),它被证明是不安全的。改用 safe_load()”

【讨论】:

以上是关于如何将数据附加到 YAML 文件的主要内容,如果未能解决你的问题,请参考以下文章

如何在 bash 中将 json 响应转换为 yaml

如何将字典附加到熊猫数据框?

如何将数据附加到谷歌云存储上的文件

如何将新数据附加到属性文件中的现有数据?

蜂巢 - 如何每天自动将数据附加到蜂巢表?

如何使用javascript将表单数据附加并保存到txt文件