为啥 Python 中没有元组理解?

Posted

技术标签:

【中文标题】为啥 Python 中没有元组理解?【英文标题】:Why is there no tuple comprehension in Python?为什么 Python 中没有元组理解? 【发布时间】:2013-06-01 04:11:42 【问题描述】:

众所周知,有列表推导式,比如

[i for i in [1, 2, 3, 4]]

还有字典理解,比如

i:j for i, j in 1: 'a', 2: 'b'.items()

但是

(i for i in (1, 2, 3))

最终会生成生成器,而不是 tuple 理解。这是为什么呢?

我的猜测是 tuple 是不可变的,但这似乎不是答案。

【问题讨论】:

还有一个集合推导——看起来很像字典推导... 为了后代,在Python Chat有一个关于这个的讨论 显然有。 ***.com/a/51811147/9627166 【参考方案1】:

您可以使用生成器表达式:

tuple(i for i in (1, 2, 3))

但是括号已经被用于......生成器表达式。

【讨论】:

通过这个论点,我们可以说列表理解也是不必要的:list(i for i in (1,2,3))。我真的认为这仅仅是因为它没有一个干净的语法(或者至少没有人想到过) 列表或集合或字典理解只是语法糖,用于使用输出特定类型的生成器表达式。 list(i for i in (1, 2, 3)) 是一个生成器表达式,输出一个列表,set(i for i in (1, 2, 3)) 输出一个集合。这是否意味着不需要理解语法?也许不是,但它非常方便。在极少数情况下,您需要一个元组,生成器表达式就可以了,很清楚,并且不需要发明另一个大括号或括号。 答案显然是因为元组语法和括号不明确 如果您关心性能,那么使用推导式和使用构造器+生成器之间的区别就非常微妙了。与使用传递给构造函数的生成器相比,理解导致更快的构造。在后一种情况下,您正在创建和执行函数,而 Python 中的函数很昂贵。 [thing for thing in things] 构造列表的速度比 list(thing for thing in things) 快得多。元组推导不是没用的; tuple(thing for thing in things) 存在延迟问题,tuple([thing for thing in things]) 可能存在内存问题。 @MartijnPieters,你能改写A list or set or dict comprehension is just syntactic sugar to use a generator expression吗?它导致confusion 人们将这些视为等效 意味着结束。它不是技术上的语法糖,因为过程实际上是不同的,即使最终产品是相同的。【参考方案2】:

Raymond Hettinger(Python 核心开发人员之一)曾这样评价 recent tweet 中的元组:

#python 提示:列表一般用于循环;结构的元组。列表是同质的;元组异构。可变长度的列表。

这(对我而言)支持这样的想法,即如果序列中的项目足够相关,可以由生成器生成,那么它应该是一个列表。尽管元组是可迭代的,并且看起来只是一个不可变的列表,但它实际上是 Python 的 C 结构等价物:

struct 
    int a;
    char b;
    float c;
 foo;

struct foo x =  3, 'g', 5.9 ;

变成Python

x = (3, 'g', 5.9)

【讨论】:

不可变属性可能很重要,但当您通常使用列表时,这通常是使用元组的好理由。例如,如果您有一个包含 5 个数字的列表,您想将其用作 dict 的键,那么元组就是要走的路。 这是 Raymond Hettinger 的一个不错的建议。我仍然会说有一个用例将元组构造函数与生成器一起使用,例如通过迭代您有兴趣转换为元组记录的 attrs 将另一个可能更大的结构解压缩为更小的结构。 @dave 在这种情况下你可能只使用operator.itemgetter @chepner,我明白了。这和我的意思很接近。它确实返回了一个可调用的,所以如果我只需要在我看不到太多胜利时才需要这样做,而不是直接使用tuple(obj[item] for item in items)。就我而言,我将其嵌入到列表理解中以制作元组记录列表。如果我需要在整个代码中重复执行此操作,那么 itemgetter 看起来很棒。也许 itemgetter 会更惯用? 我看到frozenset和set之间的关系类似于tuple和list的关系。与其说是异质性,不如说是不变性——frozensets 和 tuples 可以成为字典的键,而列表和集合则不能,因为它们的可变性。【参考方案3】:

Since Python 3.5,你也可以使用 splat * 解包语法来解包生成器表达式:

*(x for x in range(10)),

【讨论】:

这很棒(而且有效),但我在任何地方都找不到它的记录!有链接吗? 注意:作为一个实现细节,这与tuple(list(x for x in range(10)))(the code paths are identical)基本相同,两者都构建了一个list,唯一的区别是最后一步是从list 创建tuple 并在需要tuple 输出时丢弃list)。意味着您实际上并没有避免一对临时工。 扩展@ShadowRanger 的评论,here's a question 表明 splat+tuple 文字语法实际上比将生成器表达式传递给元组构造函数要慢很多。 我正在 Python 3.7.3 中尝试这个,*(x for x in range(10)) 不起作用。我得到SyntaxError: can't use starred expression here。但是tuple(x for x in range(10)) 有效。 @RyanH。你需要在最后加一个逗号。【参考方案4】:

正如另一张海报 macm 提到的,从生成器创建元组的最快方法是 tuple([generator])


性能比较

列表理解:

$ python3 -m timeit "a = [i for i in range(1000)]"
10000 loops, best of 3: 27.4 usec per loop

列表理解中的元组:

$ python3 -m timeit "a = tuple([i for i in range(1000)])"
10000 loops, best of 3: 30.2 usec per loop

来自生成器的元组:

$ python3 -m timeit "a = tuple(i for i in range(1000))"
10000 loops, best of 3: 50.4 usec per loop

解包后的元组:

$ python3 -m timeit "a = *(i for i in range(1000)),"
10000 loops, best of 3: 52.7 usec per loop

我的python版本

$ python3 --version
Python 3.6.3

因此,除非性能不是问题,否则您应该始终从列表推导式中创建一个元组。

【讨论】:

注意:listcomp 的tuple 需要基于最终tuplelist 的组合大小的峰值内存使用量。一个genexpr 的tuple,虽然速度较慢,但​​确实意味着您只需为最终的tuple 付费,而不是临时的list(genexpr 本身占用大致固定的内存)。通常没有意义,但当涉及的尺寸很大时,它可能很重要。 信息量很大。在这种情况下,来自生成器的元组不是最佳选择。我认为tuple([i for i in range(1000)]) 在可读性和速度方面是最好的。虽然 ofc,但不确定较小/较大/不同数据集的时间安排 当我尝试来自列表理解的元组与来自具有更大数据的生成器的元组(大致说范围(1_000_000))时,你会看到来自生成器的元组将花费更少的时间,虽然它不是那么重要,但你'最终将在更大数据的情况下节省大小和时间【参考方案5】:

理解通过循环或迭代项目并将它们分配到容器中来工作,元组无法接收分配。

一旦创建了元组,就不能追加、扩展或分配它。修改元组的唯一方法是它的一个对象本身可以分配给(是一个非元组容器)。因为元组只持有对那种对象的引用。

另外——元组有自己的构造函数tuple(),你可以给它任何迭代器。这意味着要创建一个元组,您可以这样做:

tuple(i for i in (1,2,3))

【讨论】:

在某些方面我同意(关于它没有必要,因为列表会做),但在其他方面我不同意(关于推理是因为它是不可变的)。在某些方面,理解不可变对象更有意义。 lst = [x for x in ...]; x.append()是谁? @mgilson 我不确定这与我所说的有什么关系? @mgilson 如果一个元组是不可变的,这意味着底层实现不能“生成”一个元组(“生成”意味着一次构建一个)。不可变意味着您不能通过更改 3 件来构建 4 件。相反,您通过构建一个列表来实现元组“生成”,该列表是为生成而设计的,然后作为最后一步构建元组,并丢弃该列表。语言反映了这一现实。将元组视为 C 结构。 虽然理解的语法糖对元组起作用是合理的,因为在返回理解之前你不能使用元组。实际上它不像可变的那样起作用,而是元组推导的行为很像字符串附加。【参考方案6】:

我最好的猜测是他们用完了括号,并且认为它不会有足够的用处来警告添加“丑陋”的语法......

【讨论】:

未使用尖括号。 @uchuugaka -- 不完全。它们用于比较运算符。它可能仍然可以毫无歧义地完成,但可能不值得努力...... @uchuugaka 值得注意的是*(),虽然丑陋,但可以作为一个空集文字! 呃。从美学的角度来看,我认为我偏爱set() :) @QuantumMechanic:是的,这就是重点;拆包概括使空的“集合文字”成为可能。请注意,*[] 严格低于其他选项;空字符串和空tuple 是不可变的,是单例,因此不需要临时构造空set。相比之下,空的 list 不是单例,所以你实际上必须构建它,用它来构建 set,然后销毁它,失去独眼猴子运算符提供的任何微不足道的性能优势。【参考方案7】:

元组不能像列表一样有效地附加。

所以元组推导需要在内部使用一个列表,然后转换为一个元组。

这和你现在做的一样:tuple([理解])

【讨论】:

【参考方案8】:

括号不创建元组。又名 one = (two) 不是元组。唯一的方法是 one = (two,) 或 one = tuple(two)。所以解决办法是:

tuple(i for i in myothertupleorlistordict) 

【讨论】:

one = (two,)one = tuple(two) 不会评估为相同的值。 tuple 的参数必须是迭代器。 one = (two,) 等价于 one = tuple(i for i in two)one = tuple((two,))one = tuple([two])【参考方案9】:

我相信这只是为了清楚起见,我们不想用太多不同的符号来混淆语言。同样,tuple 理解也不是必要的,可以使用列表来代替,速度差异可以忽略不计,这与字典理解而不是列表理解不同。

【讨论】:

"另外,元组推导也不是必需的,可以使用列表代替,速度差异可以忽略不计" 使用列表而不是元组调用 C++ 库可能会返回错误.但是通过tuple(list)将列表转换成元组并不难 @mins 这似乎是您可以从这里***.com/a/48592299/1219006根据时间选择的最佳选择【参考方案10】:

在我的 python (3.5) 上,使用来自 collections 的带有 deque 的生成器比使用 list 理解要快一些:

>>> from collections import deque
>>> timeit.timeit(lambda: tuple([i for i in range(10000000)]),number=10)
9.294099200000005
>>> timeit.timeit(lambda: tuple(deque((i for i in range(10000000)))),number=10)
9.007653800000014

【讨论】:

【参考方案11】:

因为您不能将项目附加到元组。这就是如何将简单的列表推导式转换为更基本的 Python 代码的方式。

_list = [1,2,3,4,5]
clist = [ i*i for i in _list ]
print(clist)

clist1 = []
for i in _list:
    clist1.append(i*i)
print(clist1)

现在对上述示例使用元组推导意味着将项目附加到不允许的元组中。尽管您可以使用 tuple(clist1) 将此列表转换为元组。

【讨论】:

【参考方案12】:

我们可以从列表推导中生成元组。下面的例子将两个数字依次添加到一个元组中,并给出一个从数字 0-9 的列表。

>>> print k
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99]
>>> r= [tuple(k[i:i+2]) for i in xrange(10) if not i%2]
>>> print r
[(0, 1), (2, 3), (4, 5), (6, 7), (8, 9)]

【讨论】:

以上是关于为啥 Python 中没有元组理解?的主要内容,如果未能解决你的问题,请参考以下文章

急求!!!在python语言中,列表中能否包含元组,为啥?元组中能否包含列表,为啥? 谢谢大神

python中为啥说元组不可改变

为啥解包在 Python 中给出一个列表而不是一个元组?

为啥 Python 不支持记录类型? (即可变的命名元组)

为啥你可以在 for 循环中循环一个隐式元组,但在 Python 中却不能?

深入理解python列表和元组