你如何在 Python 中创建嵌套字典?
Posted
技术标签:
【中文标题】你如何在 Python 中创建嵌套字典?【英文标题】:How do you create nested dict in Python? 【发布时间】:2013-04-26 08:16:57 【问题描述】:我有 2 个 CSV 文件:“数据”和“映射”:
“映射”文件有 4 列:Device_Name
、GDN
、Device_Type
和 Device_OS
。所有四列都已填充。
“数据”文件具有这些相同的列,Device_Name
列已填充,其他三列为空白。
我希望我的 Python 代码打开这两个文件,并为数据文件中的每个 Device_Name
映射映射文件中的 GDN
、Device_Type
和 Device_OS
值。
我知道在只有 2 列时如何使用 dict(需要映射 1 列),但是当需要映射 3 列时我不知道如何实现。
以下是我尝试完成Device_Type
映射的代码:
x = dict([])
with open("Pricing Mapping_2013-04-22.csv", "rb") as in_file1:
file_map = csv.reader(in_file1, delimiter=',')
for row in file_map:
typemap = [row[0],row[2]]
x.append(typemap)
with open("Pricing_Updated_Cleaned.csv", "rb") as in_file2, open("Data Scraper_GDN.csv", "wb") as out_file:
writer = csv.writer(out_file, delimiter=',')
for row in csv.reader(in_file2, delimiter=','):
try:
row[27] = x[row[11]]
except KeyError:
row[27] = ""
writer.writerow(row)
它返回Attribute Error
。
经过一番研究,我认为我需要创建一个嵌套字典,但我不知道如何做到这一点。
【问题讨论】:
Device_Name
列是两个文件中的键,在此键上我想将 Device_OS、GDN 和 Device_Type 值从映射文件映射到数据文件。
你想要像row[27] = x[row[11]]["Device_OS"]
这样的事情吗?
另见: search for key in nested dict -- python dpath
这不一定需要嵌套字典。你可以使用pandas,read_csv,将Device_Name
设为索引,然后你可以直接join
索引上的两个数据框Device_Name
。
【参考方案1】:
嵌套字典是字典中的字典。很简单的事情。
>>> d =
>>> d['dict1'] =
>>> d['dict1']['innerkey'] = 'value'
>>> d['dict1']['innerkey2'] = 'value2'
>>> d
'dict1': 'innerkey': 'value', 'innerkey2': 'value2'
您还可以使用collections
包中的defaultdict
来帮助创建嵌套字典。
>>> import collections
>>> d = collections.defaultdict(dict)
>>> d['dict1']['innerkey'] = 'value'
>>> d # currently a defaultdict type
defaultdict(<type 'dict'>, 'dict1': 'innerkey': 'value')
>>> dict(d) # but is exactly like a normal dictionary.
'dict1': 'innerkey': 'value'
您可以随意填充。
我会在你的代码中推荐一些类似的东西:
d = # can use defaultdict(dict) instead
for row in file_map:
# derive row key from something
# when using defaultdict, we can skip the next step creating a dictionary on row_key
d[row_key] =
for idx, col in enumerate(row):
d[row_key][idx] = col
根据你的comment:
上面的代码可能会混淆问题。简而言之我的问题:我 有 2 个文件 a.csv b.csv,a.csv 有 4 列 i j k l,b.csv 也有 这些列。 i 是这些 csvs 的关键列。 j k l 列 在 a.csv 中为空,但在 b.csv 中填充。我想映射 j k 的值 l 列使用'i`作为从b.csv到a.csv文件的关键列
我的建议是类似(不使用默认字典):
a_file = "path/to/a.csv"
b_file = "path/to/b.csv"
# read from file a.csv
with open(a_file) as f:
# skip headers
f.next()
# get first colum as keys
keys = (line.split(',')[0] for line in f)
# create empty dictionary:
d =
# read from file b.csv
with open(b_file) as f:
# gather headers except first key header
headers = f.next().split(',')[1:]
# iterate lines
for line in f:
# gather the colums
cols = line.strip().split(',')
# check to make sure this key should be mapped.
if cols[0] not in keys:
continue
# add key to dict
d[cols[0]] = dict(
# inner keys are the header names, values are columns
(headers[idx], v) for idx, v in enumerate(cols[1:]))
但请注意,用于解析 csv 文件有一个 csv module。
【讨论】:
可能是上面的代码令人困惑的问题。简而言之,我的问题:我有 2 个文件a.csv
b.csv
,a.csv
有 4 列 i j k l
,b.csv
也有这些列。 i
是这些 csvs 的关键列。 j k l
列在 a.csv
中为空,但在 b.csv
中填充。我想使用 'i` 作为键列将 j k l
列的值从 b.csv 映射到 a.csv 文件。【参考方案2】:
更新:对于任意长度的嵌套字典,请转至this answer。
使用集合中的 defaultdict 函数。
高性能:当数据集很大时,“if key not in dict”非常昂贵。
低维护:使代码更具可读性,易于扩展。
from collections import defaultdict
target_dict = defaultdict(dict)
target_dict[key1][key2] = val
【讨论】:
from collections import defaultdict target_dict = defaultdict(dict) target_dict['1']['2']
给我target_dict['1']['2'] KeyError: '2'
你必须先赋值才能得到它。【参考方案3】:
对于任意级别的嵌套:
In [2]: def nested_dict():
...: return collections.defaultdict(nested_dict)
...:
In [3]: a = nested_dict()
In [4]: a
Out[4]: defaultdict(<function __main__.nested_dict>, )
In [5]: a['a']['b']['c'] = 1
In [6]: a
Out[6]:
defaultdict(<function __main__.nested_dict>,
'a': defaultdict(<function __main__.nested_dict>,
'b': defaultdict(<function __main__.nested_dict>,
'c': 1)))
【讨论】:
上述答案对两行函数的作用,您也可以对单行 lambda 进行操作,如 this answer。【参考方案4】:请务必记住,在使用 defaultdict 和类似的嵌套 dict 模块(例如 nested_dict
)时,查找不存在的键可能会无意中在 dict 中创建新的键条目并造成大量破坏。强>
这是一个带有 nested_dict
模块的 Python3 示例:
import nested_dict as nd
nest = nd.nested_dict()
nest['outer1']['inner1'] = 'v11'
nest['outer1']['inner2'] = 'v12'
print('original nested dict: \n', nest)
try:
nest['outer1']['wrong_key1']
except KeyError as e:
print('exception missing key', e)
print('nested dict after lookup with missing key. no exception raised:\n', nest)
# Instead, convert back to normal dict...
nest_d = nest.to_dict(nest)
try:
print('converted to normal dict. Trying to lookup Wrong_key2')
nest_d['outer1']['wrong_key2']
except KeyError as e:
print('exception missing key', e)
else:
print(' no exception raised:\n')
# ...or use dict.keys to check if key in nested dict
print('checking with dict.keys')
print(list(nest['outer1'].keys()))
if 'wrong_key3' in list(nest.keys()):
print('found wrong_key3')
else:
print(' did not find wrong_key3')
输出是:
original nested dict: "outer1": "inner2": "v12", "inner1": "v11"
nested dict after lookup with missing key. no exception raised:
"outer1": "wrong_key1": , "inner2": "v12", "inner1": "v11"
converted to normal dict.
Trying to lookup Wrong_key2
exception missing key 'wrong_key2'
checking with dict.keys
['wrong_key1', 'inner2', 'inner1']
did not find wrong_key3
【讨论】:
【参考方案5】:pip install addict
from addict import Dict
mapping = Dict()
mapping.a.b.c.d.e = 2
print(mapping) # 'a': 'b': 'c': 'd': 'e': 2
参考资料:
-
easydict GitHub
addict GitHub
【讨论】:
【参考方案6】:如果你想创建一个给定路径列表(任意长度)的嵌套字典,并对路径末尾可能存在的项目执行函数,这个方便的小递归函数非常有用:
def ensure_path(data, path, default=None, default_func=lambda x: x):
"""
Function:
- Ensures a path exists within a nested dictionary
Requires:
- `data`:
- Type: dict
- What: A dictionary to check if the path exists
- `path`:
- Type: list of strs
- What: The path to check
Optional:
- `default`:
- Type: any
- What: The default item to add to a path that does not yet exist
- Default: None
- `default_func`:
- Type: function
- What: A single input function that takes in the current path item (or default) and adjusts it
- Default: `lambda x: x` # Returns the value in the dict or the default value if none was present
"""
if len(path)>1:
if path[0] not in data:
data[path[0]]=
data[path[0]]=ensure_path(data=data[path[0]], path=path[1:], default=default, default_func=default_func)
else:
if path[0] not in data:
data[path[0]]=default
data[path[0]]=default_func(data[path[0]])
return data
例子:
data='a':'b':1
ensure_path(data=data, path=['a','c'], default=[1])
print(data) #=> 'a':'b':1, 'c':[1]
ensure_path(data=data, path=['a','c'], default=[1], default_func=lambda x:x+[2])
print(data) #=> 'a': 'b': 1, 'c': [1, 2]
【讨论】:
【参考方案7】:这个东西是空的嵌套列表,ne 会将数据附加到空字典中
ls = [['a','a1','a2','a3'],['b','b1','b2','b3'],['c','c1','c2','c3'],
['d','d1','d2','d3']]
这意味着在 data_dict 中创建四个空字典
data_dict = f'dicti': for i in range(4)
for i in range(4):
upd_dict = 'val' : ls[i][0], 'val1' : ls[i][1],'val2' : ls[i][2],'val3' : ls[i][3]
data_dict[f'dicti'].update(upd_dict)
print(data_dict)
输出
'dict0': 'val': 'a', 'val1': 'a1', 'val2': 'a2', 'val3': 'a3', 'dict1':'val':'b','val1':'b1','val2':'b2','val3':'b3','dict2': 'val':'c','val1':'c1','val2':'c2','val3':'c3','dict3':'val':'d','val1' :'d1','val2':'d2','val3':'d3'
【讨论】:
【参考方案8】:#in jupyter
import sys
!conda install -c conda-forge --yes --prefix sys.prefix nested_dict
import nested_dict as nd
d = nd.nested_dict()
'd' 现在可以用来存储嵌套的键值对了。
【讨论】:
【参考方案9】:travel_log =
"France" : "cities_visited" : ["paris", "lille", "dijon"], "total_visits" : 10,
"india" : "cities_visited" : ["Mumbai", "delhi", "surat",], "total_visits" : 12
【讨论】:
请添加一些细节,为什么这个答案比之前给出的答案更好。促使您发布的其他答案有什么问题?为答案提供上下文是帮助未来读者的最佳方式。以上是关于你如何在 Python 中创建嵌套字典?的主要内容,如果未能解决你的问题,请参考以下文章