为啥 Python 中没有元组理解？

Posted 2023-02-23

技术标签:

【中文标题】为啥 Python 中没有元组理解？【英文标题】：Why is there no tuple comprehension in Python?为什么 Python 中没有元组理解？ 【发布时间】：2013-06-01 04:11:42 【问题描述】：

众所周知，有列表推导式，比如

[i for i in [1, 2, 3, 4]]

还有字典理解，比如

i:j for i, j in 1: 'a', 2: 'b'.items()

但是

(i for i in (1, 2, 3))

最终会生成生成器，而不是 tuple 理解。这是为什么呢？

我的猜测是 tuple 是不可变的，但这似乎不是答案。

【问题讨论】：

还有一个集合推导——看起来很像字典推导... 为了后代，在Python Chat有一个关于这个的讨论显然有。 ***.com/a/51811147/9627166 【参考方案1】：

您可以使用生成器表达式：

tuple(i for i in (1, 2, 3))

但是括号已经被用于......生成器表达式。

【讨论】：

通过这个论点，我们可以说列表理解也是不必要的：list(i for i in (1,2,3))。我真的认为这仅仅是因为它没有一个干净的语法（或者至少没有人想到过）列表或集合或字典理解只是语法糖，用于使用输出特定类型的生成器表达式。 list(i for i in (1, 2, 3)) 是一个生成器表达式，输出一个列表，set(i for i in (1, 2, 3)) 输出一个集合。这是否意味着不需要理解语法？也许不是，但它非常方便。在极少数情况下，您需要一个元组，生成器表达式就可以了，很清楚，并且不需要发明另一个大括号或括号。答案显然是因为元组语法和括号不明确如果您关心性能，那么使用推导式和使用构造器+生成器之间的区别就非常微妙了。与使用传递给构造函数的生成器相比，理解导致更快的构造。在后一种情况下，您正在创建和执行函数，而 Python 中的函数很昂贵。 [thing for thing in things] 构造列表的速度比 list(thing for thing in things) 快得多。元组推导不是没用的； tuple(thing for thing in things) 存在延迟问题，tuple([thing for thing in things]) 可能存在内存问题。 @MartijnPieters，你能改写A list or set or dict comprehension is just syntactic sugar to use a generator expression吗？它导致confusion 人们将这些视为等效意味着结束。它不是技术上的语法糖，因为过程实际上是不同的，即使最终产品是相同的。【参考方案2】：

Raymond Hettinger（Python 核心开发人员之一）曾这样评价 recent tweet 中的元组：

#python 提示：列表一般用于循环；结构的元组。列表是同质的；元组异构。可变长度的列表。

这（对我而言）支持这样的想法，即如果序列中的项目足够相关，可以由生成器生成，那么它应该是一个列表。尽管元组是可迭代的，并且看起来只是一个不可变的列表，但它实际上是 Python 的 C 结构等价物：

struct 
    int a;
    char b;
    float c;
 foo;

struct foo x =  3, 'g', 5.9 ;

变成Python

x = (3, 'g', 5.9)

【讨论】：

不可变属性可能很重要，但当您通常使用列表时，这通常是使用元组的好理由。例如，如果您有一个包含 5 个数字的列表，您想将其用作 dict 的键，那么元组就是要走的路。这是 Raymond Hettinger 的一个不错的建议。我仍然会说有一个用例将元组构造函数与生成器一起使用，例如通过迭代您有兴趣转换为元组记录的 attrs 将另一个可能更大的结构解压缩为更小的结构。 @dave 在这种情况下你可能只使用operator.itemgetter。 @chepner，我明白了。这和我的意思很接近。它确实返回了一个可调用的，所以如果我只需要在我看不到太多胜利时才需要这样做，而不是直接使用tuple(obj[item] for item in items)。就我而言，我将其嵌入到列表理解中以制作元组记录列表。如果我需要在整个代码中重复执行此操作，那么 itemgetter 看起来很棒。也许 itemgetter 会更惯用？我看到frozenset和set之间的关系类似于tuple和list的关系。与其说是异质性，不如说是不变性——frozensets 和 tuples 可以成为字典的键，而列表和集合则不能，因为它们的可变性。【参考方案3】：

Since Python 3.5，你也可以使用 splat * 解包语法来解包生成器表达式：

*(x for x in range(10)),

【讨论】：

这很棒（而且有效），但我在任何地方都找不到它的记录！有链接吗？注意：作为一个实现细节，这与tuple(list(x for x in range(10)))（the code paths are identical）基本相同，两者都构建了一个list，唯一的区别是最后一步是从list 创建tuple 并在需要tuple 输出时丢弃list）。意味着您实际上并没有避免一对临时工。扩展@ShadowRanger 的评论，here's a question 表明 splat+tuple 文字语法实际上比将生成器表达式传递给元组构造函数要慢很多。我正在 Python 3.7.3 中尝试这个，*(x for x in range(10)) 不起作用。我得到SyntaxError: can't use starred expression here。但是tuple(x for x in range(10)) 有效。 @RyanH。你需要在最后加一个逗号。【参考方案4】：

正如另一张海报 macm 提到的，从生成器创建元组的最快方法是 tuple([generator])。

性能比较

列表理解：

$ python3 -m timeit "a = [i for i in range(1000)]"
10000 loops, best of 3: 27.4 usec per loop

列表理解中的元组：

$ python3 -m timeit "a = tuple([i for i in range(1000)])"
10000 loops, best of 3: 30.2 usec per loop

来自生成器的元组：

$ python3 -m timeit "a = tuple(i for i in range(1000))"
10000 loops, best of 3: 50.4 usec per loop

解包后的元组：

$ python3 -m timeit "a = *(i for i in range(1000)),"
10000 loops, best of 3: 52.7 usec per loop

我的python版本：

$ python3 --version
Python 3.6.3

因此，除非性能不是问题，否则您应该始终从列表推导式中创建一个元组。

【讨论】：

注意：listcomp 的tuple 需要基于最终tuple 和list 的组合大小的峰值内存使用量。一个genexpr 的tuple，虽然速度较慢，但确实意味着您只需为最终的tuple 付费，而不是临时的list（genexpr 本身占用大致固定的内存）。通常没有意义，但当涉及的尺寸很大时，它可能很重要。信息量很大。在这种情况下，来自生成器的元组不是最佳选择。我认为tuple([i for i in range(1000)]) 在可读性和速度方面是最好的。虽然 ofc，但不确定较小/较大/不同数据集的时间安排当我尝试来自列表理解的元组与来自具有更大数据的生成器的元组（大致说范围（1_000_000））时，你会看到来自生成器的元组将花费更少的时间，虽然它不是那么重要，但你'最终将在更大数据的情况下节省大小和时间【参考方案5】：

理解通过循环或迭代项目并将它们分配到容器中来工作，元组无法接收分配。

一旦创建了元组，就不能追加、扩展或分配它。修改元组的唯一方法是它的一个对象本身可以分配给（是一个非元组容器）。因为元组只持有对那种对象的引用。

另外——元组有自己的构造函数tuple()，你可以给它任何迭代器。这意味着要创建一个元组，您可以这样做：

tuple(i for i in (1,2,3))

【讨论】：

在某些方面我同意（关于它没有必要，因为列表会做），但在其他方面我不同意（关于推理是因为它是不可变的）。在某些方面，理解不可变对象更有意义。 lst = [x for x in ...]; x.append()是谁？ @mgilson 我不确定这与我所说的有什么关系？ @mgilson 如果一个元组是不可变的，这意味着底层实现不能“生成”一个元组（“生成”意味着一次构建一个）。不可变意味着您不能通过更改 3 件来构建 4 件。相反，您通过构建一个列表来实现元组“生成”，该列表是为生成而设计的，然后作为最后一步构建元组，并丢弃该列表。语言反映了这一现实。将元组视为 C 结构。虽然理解的语法糖对元组起作用是合理的，因为在返回理解之前你不能使用元组。实际上它不像可变的那样起作用，而是元组推导的行为很像字符串附加。【参考方案6】：

我最好的猜测是他们用完了括号，并且认为它不会有足够的用处来警告添加“丑陋”的语法......

【讨论】：

未使用尖括号。 @uchuugaka -- 不完全。它们用于比较运算符。它可能仍然可以毫无歧义地完成，但可能不值得努力...... @uchuugaka 值得注意的是*()，虽然丑陋，但可以作为一个空集文字！呃。从美学的角度来看，我认为我偏爱set() :) @QuantumMechanic：是的，这就是重点；拆包概括使空的“集合文字”成为可能。请注意，*[] 严格低于其他选项；空字符串和空tuple 是不可变的，是单例，因此不需要临时构造空set。相比之下，空的 list 不是单例，所以你实际上必须构建它，用它来构建 set，然后销毁它，失去独眼猴子运算符提供的任何微不足道的性能优势。【参考方案7】：

元组不能像列表一样有效地附加。

所以元组推导需要在内部使用一个列表，然后转换为一个元组。

这和你现在做的一样：tuple([理解])

【讨论】：

【参考方案8】：

括号不创建元组。又名 one = (two) 不是元组。唯一的方法是 one = (two,) 或 one = tuple(two)。所以解决办法是：

tuple(i for i in myothertupleorlistordict)

【讨论】：

one = (two,) 和 one = tuple(two) 不会评估为相同的值。 tuple 的参数必须是迭代器。 one = (two,) 等价于 one = tuple(i for i in two)、one = tuple((two,)) 和 one = tuple([two])。【参考方案9】：

我相信这只是为了清楚起见，我们不想用太多不同的符号来混淆语言。同样，tuple 理解也不是必要的，可以使用列表来代替，速度差异可以忽略不计，这与字典理解而不是列表理解不同。

【讨论】：

"另外，元组推导也不是必需的，可以使用列表代替，速度差异可以忽略不计" 使用列表而不是元组调用 C++ 库可能会返回错误.但是通过tuple(list)将列表转换成元组并不难 @mins 这似乎是您可以从这里***.com/a/48592299/1219006根据时间选择的最佳选择【参考方案10】：

在我的 python (3.5) 上，使用来自 collections 的带有 deque 的生成器比使用 list 理解要快一些：

>>> from collections import deque
>>> timeit.timeit(lambda: tuple([i for i in range(10000000)]),number=10)
9.294099200000005
>>> timeit.timeit(lambda: tuple(deque((i for i in range(10000000)))),number=10)
9.007653800000014

【讨论】：

【参考方案11】：

因为您不能将项目附加到元组。这就是如何将简单的列表推导式转换为更基本的 Python 代码的方式。

_list = [1,2,3,4,5]
clist = [ i*i for i in _list ]
print(clist)

clist1 = []
for i in _list:
    clist1.append(i*i)
print(clist1)

现在对上述示例使用元组推导意味着将项目附加到不允许的元组中。尽管您可以使用 tuple(clist1) 将此列表转换为元组。

【讨论】：

【参考方案12】：

我们可以从列表推导中生成元组。下面的例子将两个数字依次添加到一个元组中，并给出一个从数字 0-9 的列表。

>>> print k
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99]
>>> r= [tuple(k[i:i+2]) for i in xrange(10) if not i%2]
>>> print r
[(0, 1), (2, 3), (4, 5), (6, 7), (8, 9)]

【讨论】：

以上是关于为啥 Python 中没有元组理解？的主要内容，如果未能解决你的问题，请参考以下文章