从字典中的迭代中删除“无”

Posted

技术标签:

【中文标题】从字典中的迭代中删除“无”【英文标题】:Remove "None" from iteration in a dictionary 【发布时间】:2020-01-17 01:32:44 【问题描述】:

我有一个包含各种键和值的字典列表。我正在尝试根据键对其进行分组

from itertools import chain, zip_longest 

data = [
    'a': 2, 'b': 4, 'c': 3, 'd': 2,   
    'b': 2, 'c': 2, 'd': 5, 'e': 4, 'f': 1,
    'a': 2, 'd': 2, 'e': 6, 'f': 5, 'g': 12,
    'b': 2, 'd': 2, 'e': 6, 'f': 6,
    'c': 5, 'e': 33, 'g': 21, 'h': 56, 'i': 21
    ]

print(type(data))

bar =
    k: [d.get(k) for d in data]
    for k in chain.from_iterable(data)


print(bar)

我的输出:

'a': [2, None, 2, None, None], 'b': [4, 2, None, 2, None], 
'c': [3, 2, None, None, 5], 'd':[2, 5, 2, 2, None], 'e': [None, 4, 6, 6, 33], 
'f': [None, 1, 5, 6, None], 'g': [None, None, 12, None, 21], 
'h': [None, None, None, None, 56], 'i': [None, None, None, None, 21]

我不想在值中显示“无”

期望的输出:

 'a': [2, 2], 'b': [4, 2, 2], 'c': [3, 2, 5], 'd':[2, 5, 2, 2], 'e': [4, 6, 6, 33], 
'f': [1, 5, 6], 'g': [1221], 'h': [56], 'i': [21]

我也尝试使用过滤功能,但没有成功。关于如何删除无的任何指导?

Code

【问题讨论】:

您可以将列表理解(在您的字典中)更改为 [d.get(k) for d in data if d.get(k) is not None] k: [d[k] for d in data if k in d] @chirs: 是的,提供项目k 的值不是False 或其他虚假值! @tomjn 或 [val := d.get(k) for d in data if val] 在 Python 3.8 中,所以 .get 不会被调用两次 ;) @DeepSpace 我想到了。认为在测试版结束之前最好不要给出 3.8 个答案;) 【参考方案1】:

试试this:

from operator import is_not
from functools import partial

 k: list(filter(partial(is_not, None), v)) for k, v in d.items() 

输入: 'x': [0, 23, 234, 89, None, 0, 35, 9]

输出: 'x': [0, 23, 234, 89, 0, 35, 9]

【讨论】:

【参考方案2】:

不要使用get,如果密钥不存在则返回None,只需使用d[k],但首先检查是否k in d。另外,我建议不要使用chain,因为这会计算许多列表两次或更多次,每次都会覆盖先前创建的列表,因为多个字典中存在许多键。相反,您可以迭代所有键的 set

>>> k: [d[k] for d in data if k in d]
...  for k in set(k for d in data for k in d)
...
'a': [2, 2], 'b': [4, 2, 2],
 'c': [3, 2, 5], 'd': [2, 5, 2, 2],
 'e': [4, 6, 6, 33], 'f': [1, 5, 6],
 'g': [12, 21], 'h': [56], 'i': [21]

【讨论】:

【参考方案3】:

如果你想使用你的代码,你可以这样做:

bar =
    k: [d.get(k) for d in data if d.get(k) != None]
    for k in chain.from_iterable(data)


print(bar)

输出:

'a': [2, 2], 'b': [4, 2, 2], 'c': [3, 2, 5], 'd': [2, 5, 2, 2], 'e': [4, 6, 6, 33], 'f': [1, 5, 6], 'g': [12, 21], 'h': [56], 'i': [21]

【讨论】:

k: [d[k] for d in data if k in d] 呢? 也是解决方案之一! :) @tobias_k【参考方案4】:

提供的大多数解决方案都专注于保持 OP 方法具有复杂的理解力。我认为在这种情况下,有必要将循环拆分为不同的行,而不是使用理解。

data = [...]

bar = 
for my_dict in data:
   for key, value in my_dict.items():
      bar.setdefault(key, []).append(value)

print(bar)

【讨论】:

是的,这也是我的首选解决方案。不过,OP 明确要求使用filter。看起来像一个 x/y 问题。【参考方案5】:

字典的get 函数将在它们的键不存在时返回None。您可以简单地使用if 条件来确保该值存在。

bar = k: [d[k] for d in data if d.get(k) is not None] for k in chain.from_iterable(data)

如果您的字典非常大,在值中包含大量 Nones,则双重查找的成本会很高。所以你可以使用过滤器。

bar = k: list(filter(None, [d.get(k) for d in data])) for k in chain.from_iterable(data)

【讨论】:

这可行,但每个元素都有双重查找。 OP 的另一个选项是重新遍历整个字典并从每个列表中过滤掉 None 值。这样会更好。 取决于查找的成本,这取决于dict 的大小。过滤掉Nones 可能会更便宜。【参考方案6】:

您可以使用filter(None, x) 删除Nones:

filter(None, [3, 4, None, 2, 7, None, 1])
[3, 4, 2, 7, 1]

要对 dict 的所有值都使用它,请使用理解:

 k: filter(None, v) for k, v in d.items() 

(在 Python 2 中使用 .iteritems()。)

请记住,在 Python 3 中,filter 函数会生成可以廉价迭代的惰性过滤器对象。要将它们转换为lists,只需使用list(filter(...))

但最好不要一开始就引入None 值:

r = 
for d in data:
  for k, v in d.items():
    r.setdefault(k, []).append(v)
print(r)

【讨论】:

k: list(filter(None, v)) for k, v in d.items() 可能更好,所以值将是列表而不是 filter 对象 @DeepSpace 这在许多情况下可能很有用,但总的来说,我更喜欢尽可能长时间地保留惰性迭代器,因为它们更便宜,以防并非所有元素都真正需要或所有元素都需要但不是同时(然后节省内存)。正如您所演示的,将它们转换为 lists 仍然是可能的。 @DeepSpace 我更愿意让他们了解并留给他们选择和责任。 但你没有。答案没有说明这些值不再是列表

以上是关于从字典中的迭代中删除“无”的主要内容,如果未能解决你的问题,请参考以下文章

如何从字典中的列表中删除元素[重复]

从Python中的字典中删除键[重复]

如何从IOS中的字典数组中删除重复性? [关闭]

如何从添加到字典中的数组中删除重复值

小坑,小心坑

从单词中删除字符以使减少的单词仍然是字典中的单词的算法