为啥 Python 中没有元组理解?
Posted
技术标签:
【中文标题】为啥 Python 中没有元组理解?【英文标题】:Why is there no tuple comprehension in Python?为什么 Python 中没有元组理解? 【发布时间】:2013-06-01 04:11:42 【问题描述】:众所周知,有列表推导式,比如
[i for i in [1, 2, 3, 4]]
还有字典理解,比如
i:j for i, j in 1: 'a', 2: 'b'.items()
但是
(i for i in (1, 2, 3))
最终会生成生成器,而不是 tuple
理解。这是为什么呢?
我的猜测是 tuple
是不可变的,但这似乎不是答案。
【问题讨论】:
还有一个集合推导——看起来很像字典推导... 为了后代,在Python Chat有一个关于这个的讨论 显然有。 ***.com/a/51811147/9627166 【参考方案1】:您可以使用生成器表达式:
tuple(i for i in (1, 2, 3))
但是括号已经被用于......生成器表达式。
【讨论】:
通过这个论点,我们可以说列表理解也是不必要的:list(i for i in (1,2,3))
。我真的认为这仅仅是因为它没有一个干净的语法(或者至少没有人想到过)
列表或集合或字典理解只是语法糖,用于使用输出特定类型的生成器表达式。 list(i for i in (1, 2, 3))
是一个生成器表达式,输出一个列表,set(i for i in (1, 2, 3))
输出一个集合。这是否意味着不需要理解语法?也许不是,但它非常方便。在极少数情况下,您需要一个元组,生成器表达式就可以了,很清楚,并且不需要发明另一个大括号或括号。
答案显然是因为元组语法和括号不明确
如果您关心性能,那么使用推导式和使用构造器+生成器之间的区别就非常微妙了。与使用传递给构造函数的生成器相比,理解导致更快的构造。在后一种情况下,您正在创建和执行函数,而 Python 中的函数很昂贵。 [thing for thing in things]
构造列表的速度比 list(thing for thing in things)
快得多。元组推导不是没用的; tuple(thing for thing in things)
存在延迟问题,tuple([thing for thing in things])
可能存在内存问题。
@MartijnPieters,你能改写A list or set or dict comprehension is just syntactic sugar to use a generator expression
吗?它导致confusion 人们将这些视为等效 意味着结束。它不是技术上的语法糖,因为过程实际上是不同的,即使最终产品是相同的。【参考方案2】:
Raymond Hettinger(Python 核心开发人员之一)曾这样评价 recent tweet 中的元组:
#python 提示:列表一般用于循环;结构的元组。列表是同质的;元组异构。可变长度的列表。
这(对我而言)支持这样的想法,即如果序列中的项目足够相关,可以由生成器生成,那么它应该是一个列表。尽管元组是可迭代的,并且看起来只是一个不可变的列表,但它实际上是 Python 的 C 结构等价物:
struct
int a;
char b;
float c;
foo;
struct foo x = 3, 'g', 5.9 ;
变成Python
x = (3, 'g', 5.9)
【讨论】:
不可变属性可能很重要,但当您通常使用列表时,这通常是使用元组的好理由。例如,如果您有一个包含 5 个数字的列表,您想将其用作 dict 的键,那么元组就是要走的路。 这是 Raymond Hettinger 的一个不错的建议。我仍然会说有一个用例将元组构造函数与生成器一起使用,例如通过迭代您有兴趣转换为元组记录的 attrs 将另一个可能更大的结构解压缩为更小的结构。 @dave 在这种情况下你可能只使用operator.itemgetter
。
@chepner,我明白了。这和我的意思很接近。它确实返回了一个可调用的,所以如果我只需要在我看不到太多胜利时才需要这样做,而不是直接使用tuple(obj[item] for item in items)
。就我而言,我将其嵌入到列表理解中以制作元组记录列表。如果我需要在整个代码中重复执行此操作,那么 itemgetter 看起来很棒。也许 itemgetter 会更惯用?
我看到frozenset和set之间的关系类似于tuple和list的关系。与其说是异质性,不如说是不变性——frozensets 和 tuples 可以成为字典的键,而列表和集合则不能,因为它们的可变性。【参考方案3】:
Since Python 3.5,你也可以使用 splat *
解包语法来解包生成器表达式:
*(x for x in range(10)),
【讨论】:
这很棒(而且有效),但我在任何地方都找不到它的记录!有链接吗? 注意:作为一个实现细节,这与tuple(list(x for x in range(10)))
(the code paths are identical)基本相同,两者都构建了一个list
,唯一的区别是最后一步是从list
创建tuple
并在需要tuple
输出时丢弃list
)。意味着您实际上并没有避免一对临时工。
扩展@ShadowRanger 的评论,here's a question 表明 splat+tuple 文字语法实际上比将生成器表达式传递给元组构造函数要慢很多。
我正在 Python 3.7.3 中尝试这个,*(x for x in range(10))
不起作用。我得到SyntaxError: can't use starred expression here
。但是tuple(x for x in range(10))
有效。
@RyanH。你需要在最后加一个逗号。【参考方案4】:
正如另一张海报 macm
提到的,从生成器创建元组的最快方法是 tuple([generator])
。
性能比较
列表理解:
$ python3 -m timeit "a = [i for i in range(1000)]"
10000 loops, best of 3: 27.4 usec per loop
列表理解中的元组:
$ python3 -m timeit "a = tuple([i for i in range(1000)])"
10000 loops, best of 3: 30.2 usec per loop
来自生成器的元组:
$ python3 -m timeit "a = tuple(i for i in range(1000))"
10000 loops, best of 3: 50.4 usec per loop
解包后的元组:
$ python3 -m timeit "a = *(i for i in range(1000)),"
10000 loops, best of 3: 52.7 usec per loop
我的python版本:
$ python3 --version
Python 3.6.3
因此,除非性能不是问题,否则您应该始终从列表推导式中创建一个元组。
【讨论】:
注意:listcomp 的tuple
需要基于最终tuple
和list
的组合大小的峰值内存使用量。一个genexpr 的tuple
,虽然速度较慢,但确实意味着您只需为最终的tuple
付费,而不是临时的list
(genexpr 本身占用大致固定的内存)。通常没有意义,但当涉及的尺寸很大时,它可能很重要。
信息量很大。在这种情况下,来自生成器的元组不是最佳选择。我认为tuple([i for i in range(1000)])
在可读性和速度方面是最好的。虽然 ofc,但不确定较小/较大/不同数据集的时间安排
当我尝试来自列表理解的元组与来自具有更大数据的生成器的元组(大致说范围(1_000_000))时,你会看到来自生成器的元组将花费更少的时间,虽然它不是那么重要,但你'最终将在更大数据的情况下节省大小和时间【参考方案5】:
理解通过循环或迭代项目并将它们分配到容器中来工作,元组无法接收分配。
一旦创建了元组,就不能追加、扩展或分配它。修改元组的唯一方法是它的一个对象本身可以分配给(是一个非元组容器)。因为元组只持有对那种对象的引用。
另外——元组有自己的构造函数tuple()
,你可以给它任何迭代器。这意味着要创建一个元组,您可以这样做:
tuple(i for i in (1,2,3))
【讨论】:
在某些方面我同意(关于它没有必要,因为列表会做),但在其他方面我不同意(关于推理是因为它是不可变的)。在某些方面,理解不可变对象更有意义。lst = [x for x in ...]; x.append()
是谁?
@mgilson 我不确定这与我所说的有什么关系?
@mgilson 如果一个元组是不可变的,这意味着底层实现不能“生成”一个元组(“生成”意味着一次构建一个)。不可变意味着您不能通过更改 3 件来构建 4 件。相反,您通过构建一个列表来实现元组“生成”,该列表是为生成而设计的,然后作为最后一步构建元组,并丢弃该列表。语言反映了这一现实。将元组视为 C 结构。
虽然理解的语法糖对元组起作用是合理的,因为在返回理解之前你不能使用元组。实际上它不像可变的那样起作用,而是元组推导的行为很像字符串附加。【参考方案6】:
我最好的猜测是他们用完了括号,并且认为它不会有足够的用处来警告添加“丑陋”的语法......
【讨论】:
未使用尖括号。 @uchuugaka -- 不完全。它们用于比较运算符。它可能仍然可以毫无歧义地完成,但可能不值得努力...... @uchuugaka 值得注意的是*()
,虽然丑陋,但可以作为一个空集文字!
呃。从美学的角度来看,我认为我偏爱set()
:)
@QuantumMechanic:是的,这就是重点;拆包概括使空的“集合文字”成为可能。请注意,*[]
严格低于其他选项;空字符串和空tuple
是不可变的,是单例,因此不需要临时构造空set
。相比之下,空的 list
不是单例,所以你实际上必须构建它,用它来构建 set
,然后销毁它,失去独眼猴子运算符提供的任何微不足道的性能优势。【参考方案7】:
元组不能像列表一样有效地附加。
所以元组推导需要在内部使用一个列表,然后转换为一个元组。
这和你现在做的一样:tuple([理解])
【讨论】:
【参考方案8】:括号不创建元组。又名 one = (two) 不是元组。唯一的方法是 one = (two,) 或 one = tuple(two)。所以解决办法是:
tuple(i for i in myothertupleorlistordict)
【讨论】:
one = (two,)
和 one = tuple(two)
不会评估为相同的值。 tuple
的参数必须是迭代器。 one = (two,)
等价于 one = tuple(i for i in two)
、one = tuple((two,))
和 one = tuple([two])
。【参考方案9】:
我相信这只是为了清楚起见,我们不想用太多不同的符号来混淆语言。同样,tuple
理解也不是必要的,可以使用列表来代替,速度差异可以忽略不计,这与字典理解而不是列表理解不同。
【讨论】:
"另外,元组推导也不是必需的,可以使用列表代替,速度差异可以忽略不计" 使用列表而不是元组调用 C++ 库可能会返回错误.但是通过tuple(list)
将列表转换成元组并不难
@mins 这似乎是您可以从这里***.com/a/48592299/1219006根据时间选择的最佳选择【参考方案10】:
在我的 python (3.5) 上,使用来自 collections
的带有 deque
的生成器比使用 list
理解要快一些:
>>> from collections import deque
>>> timeit.timeit(lambda: tuple([i for i in range(10000000)]),number=10)
9.294099200000005
>>> timeit.timeit(lambda: tuple(deque((i for i in range(10000000)))),number=10)
9.007653800000014
【讨论】:
【参考方案11】:因为您不能将项目附加到元组。这就是如何将简单的列表推导式转换为更基本的 Python 代码的方式。
_list = [1,2,3,4,5]
clist = [ i*i for i in _list ]
print(clist)
clist1 = []
for i in _list:
clist1.append(i*i)
print(clist1)
现在对上述示例使用元组推导意味着将项目附加到不允许的元组中。尽管您可以使用 tuple(clist1)
将此列表转换为元组。
【讨论】:
【参考方案12】:我们可以从列表推导中生成元组。下面的例子将两个数字依次添加到一个元组中,并给出一个从数字 0-9 的列表。
>>> print k
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99]
>>> r= [tuple(k[i:i+2]) for i in xrange(10) if not i%2]
>>> print r
[(0, 1), (2, 3), (4, 5), (6, 7), (8, 9)]
【讨论】:
以上是关于为啥 Python 中没有元组理解?的主要内容,如果未能解决你的问题,请参考以下文章
急求!!!在python语言中,列表中能否包含元组,为啥?元组中能否包含列表,为啥? 谢谢大神