python中的元组分组列表

Posted

技术标签:

【中文标题】python中的元组分组列表【英文标题】:Grouping list of tuples in python 【发布时间】:2015-05-09 15:49:45 【问题描述】:

我有一个由元组组成的列表,并且我已经根据第二项对该列表进行了排序。然后我想让我的列表分组 基于第 2 项,并将第 1 项放入列表中。

这是我的输入:

[('aaa', 1), ('bbb', 1), ('ccc', 2), ('ddd', 2), ('eee', 3)]

我需要的是这个:

[(g1, 1, ['aaa', 'bbb']), (g2, 2, ['ccc', 'ddd']), (g3, 1, ['eee'])]

每个元组,第一项是一个 id(增量)。第二个是按其分组分组的项目数,第三个项目是分组元组的列表。 如何在 python 中实现这个输入?已经尝试使用 itertools,仍然一无所获。任何帮助将不胜感激。

【问题讨论】:

什么是g1,g2,g3?是变量吗? 是的,它只是可变的。这可能是我创造的吗?还是只使用整数作为 id? 您没有提供变量定义。我不知道该怎么办。 【参考方案1】:

一种方法是分步进行:

>>> grouped = enumerate(groupby(seq, key=lambda x: x[1]), 1)
>>> extracted = ((i, [g[0] for g in gg]) for i, (k,gg) in grouped)
>>> final = [(i, len(x), x) for i,x in extracted]
>>> final
[(1, 2, ['aaa', 'bbb']), (2, 2, ['ccc', 'ddd']), (3, 1, ['eee'])]

但即使每一行本身都有意义,我认为很难看出它实际上在做什么。使用生成器函数可以让一切变得更加清晰:

def grouper(elems):
    grouped = groupby(elems, key=lambda x: x[1])
    for i, (k, group) in enumerate(grouped, 1):
        vals = [g[0] for g in group]
        yield i, len(vals), vals

>> list(grouper(seq))
[(1, 2, ['aaa', 'bbb']), (2, 2, ['ccc', 'ddd']), (3, 1, ['eee'])]

(这里我为你的 g1/g2/g3 随意使用了一个从 1 开始的索引;用yield 'g'.format(i) 或其他东西替换它很容易。)

【讨论】:

【参考方案2】:
In [5]: L = [('aaa', 1), ('bbb', 1), ('ccc', 2), ('ddd', 2), ('eee', 3)]

In [6]: for key, group in itertools.groupby(L, operator.itemgetter(1)):
   ...:     print(key, list(group))
   ...:     
1 [('aaa', 1), ('bbb', 1)]
2 [('ccc', 2), ('ddd', 2)]
3 [('eee', 3)]

In [7]: answer = []

In [8]: for k,group in itertools.groupby(L, operator.itemgetter(1)):
   ...:     answer.append((k, [g[0] for g in group]))
   ...:     

In [9]: answer
Out[9]: [(1, ['aaa', 'bbb']), (2, ['ccc', 'ddd']), (3, ['eee'])]

【讨论】:

【参考方案3】:

如果你知道如何使用collections模块,它很容易解决。

from collections import defaultdict

a = [('aaa', 1), ('bbb', 1), ('ccc', 2), ('ddd', 2), ('eee', 3)]

d = defaultdict(list)
for k, v in a:   
    d[v].append(k)

print d.items()
# [(1, ['aaa', 'bbb']), (2, ['ccc', 'ddd']), (3, ['eee'])]

【讨论】:

以上是关于python中的元组分组列表的主要内容,如果未能解决你的问题,请参考以下文章

python中的元组和列表有啥区别,哪个更有效[重复]

如何从python中的列表中删除重复的元组?

Python - 验证列表中的元组具有相同的长度

Python中的元组和列表

python的元组和列表的区别

如何将字节对象转换为 python 3 中的元组列表?