Python - 将字典列表附加到嵌套的默认字典时出现关键错误

Posted

技术标签:

【中文标题】Python - 将字典列表附加到嵌套的默认字典时出现关键错误【英文标题】:Python - key error when appending a list of dict to a nested defaultdict 【发布时间】:2018-09-08 03:07:23 【问题描述】:

我正在尝试在 Python 中创建嵌套字典的数据结构。我将 2 个类似 sql-table 的关系 csv 文件读入数据帧,然后将它们逐行转换为字典。在这些字典中,我存储从另一个 csv 创建的字典。

只要我将字典直接存储在 dict 键中,下面的代码就可以工作。

但我真正想要的是data[id]['ticket'] 包含一个字典列表。 (1 位客户可能拥有多张门票)

import json
import pandas as pd
import collections

# Import csv into dataframe (maybe not necessesary)
df1 = pd.read_csv('customer.csv', sep=';', header=0, dtype=object, na_filter=False)
df2 = pd.read_csv('tickets.csv', sep=';', header=0, dtype=object, na_filter=False)

df1['tickets'] = '' #create new empty column in dataframe 1

data = collections.defaultdict(dict)

# Convert initial dataframe to dictionary of dictionarys
for index, row in df1.iterrows():
    row_dict = row.to_dict()
    data[row_dict['id']] = row_dict
    data[row_dict['id']]['tickets'] = []

# Convert each row of dataframe 2 to into dictionary and store on correct key of dict 1
for index, row in df2.iterrows():
    row_dict = row.to_dict()
    data[row_dict['kundenid']]['tickets'].append(row_dict)

with open('json_file', 'w') as f:
    json.dump(data, f, indent=4)

使用此代码,我收到tickets 的关键错误。但是,当我使用 data[row_dict['id']]['tickets'] = row_dict 将字典附加到键 tickets 时,代码有效。我只需要这个领域的多个字典。

我最终想要实现的是一个看起来像这样的字典/JSON:

      "1111": 
         "id": "1111",
         "name": "",
         "adr": "",
         "tickets": [
             "ticketid": "123545",
             "id": "1111"
         ,
         
             "ticketid": "123545",
             "id": "1111"
         ]
     ....
     

如何在 tickets 键下存储字典列表?

编辑:一些示例输入数据:

tickets.csv

id;ticketid;xyz;message
1;9;1;fgsgfs
2;8;2;gdfg
3;7;3;gfsfgfg
4;6;4;fgsfdgfd
5;5;5;dgsgd
6;4;6;dfgsgdf
7;3;7;dfgdhfd

客户.csv

id;name;surname;address;XID
1;Mueller;Hans;42553;1
2;Meier;Peter;42873;2
3;Schmidt;Micha;42567;213
4;Pauli;Ulli;98790;432
5;Dick;Franz;45632;423
6;Doof;Udo;76543;233
7;Pang;Lars;43232;234
8;Peutz;Lee;11342;4234

【问题讨论】:

您能否从您的 csv 文件中包含一些记录?虽然有些人可能能够可视化您的代码,但像我这样的普通人需要一些帮助。 用一些示例数据更新了问题。希望这有助于理解我想要实现的目标。 【参考方案1】:

您的解决方案似乎适用于提供的输入数据(见下文)。有什么我遗漏的吗?

正如您所指出的,您需要在第二个循环中测试键,如下所示。这仅在您的完整数据集中很明显。

设置

我稍微修改了您的数据,以便更好地说明问题。

from collections import defaultdict
import pandas as pd
from io import StringIO

df1 = pd.read_csv(StringIO("""id;name;surname;address;XID
1;Mueller;Hans;42553;1
2;Meier;Peter;42873;2
3;Schmidt;Micha;42567;213"""), sep=';')

df2 = pd.read_csv(StringIO("""id;ticketid;xyz;message
1;9;1;fgsgfs
1;8;2;gdfg
2;7;3;gfsfgfg
2;6;4;fgsfdgfd
3;5;5;dgsgd
3;4;6;dfgsgdf
3;3;7;dfgdhfd"""), sep=';')

解决方案

data = defaultdict(dict)

for index, row in df1.iterrows():
    row_dict = row.to_dict()
    data[row_dict['id']] = row_dict
    data[row_dict['id']]['tickets'] = []

for index, row in df2.iterrows():
    row_dict = row.to_dict()
    if row_dict['id'] in data:
        data[row_dict['id']]['tickets'].append(row_dict)

结果

defaultdict(dict,
            1: 'XID': 1,
              'address': 42553,
              'id': 1,
              'name': 'Mueller',
              'surname': 'Hans',
              'tickets': ['id': 1, 'message': 'fgsgfs', 'ticketid': 9, 'xyz': 1,
                          'id': 1, 'message': 'gdfg', 'ticketid': 8, 'xyz': 2],
             2: 'XID': 2,
              'address': 42873,
              'id': 2,
              'name': 'Meier',
              'surname': 'Peter',
              'tickets': ['id': 2, 'message': 'gfsfgfg', 'ticketid': 7, 'xyz': 3,
                          'id': 2, 'message': 'fgsfdgfd', 'ticketid': 6, 'xyz': 4],
             3: 'XID': 213,
              'address': 42567,
              'id': 3,
              'name': 'Schmidt',
              'surname': 'Micha',
              'tickets': ['id': 3, 'message': 'dgsgd', 'ticketid': 5, 'xyz': 5,
                          'id': 3, 'message': 'dfgsgdf', 'ticketid': 4, 'xyz': 6,
                          'id': 3, 'message': 'dfgdhfd', 'ticketid': 3, 'xyz': 7])

【讨论】:

你是对的!我意识到我的原始 csv 2 中的行没有与 csv 1 的 id 匹配的键。因此在第二个循环中可能会发生,我尝试将某些内容附加到未使用列表初始化的键。 @JohnnyKonfetti,我明白了,所以您只需要添加一个 if 子句。我已将此添加到解决方案中。 对,我就是这样解决的。感谢您的支持!

以上是关于Python - 将字典列表附加到嵌套的默认字典时出现关键错误的主要内容,如果未能解决你的问题,请参考以下文章

将列表条目作为值更新为嵌套字典

嵌套字典。合并公共键并将值附加到列表中。 0 值未附加。里面的代码

将项目附加到字典 Python

Python:将 a 附加到字典中的列表

如何将嵌套列表映射到 Python 中的可迭代字典

Python:展平多个嵌套的字典并追加