生成器是python语言中很有用的特性,是构造可迭代对象的一种方式,具有减少内存使用、提高代码可读性的优点。下面是构造生成器的几种方法:
1、使用yield构造生成器
一般函数执行后会返回单个值,而生成器以延迟的方式返回一个值的序列。在函数中将return替代为yield即可构造生成器。
#创建一个默认返回1~10平方数的生成器 >>> def squares(n = 10): ... for i in range(1, n + 1): ... yield i ** 2 ... #调用生成器,没有代码会立刻执行 >>> gen = squares() >>> gen <generator object squares at 0x0000023C5C3BA938> #将生成器转化为列表(第1次) >>> list(gen) [1, 4, 9, 16, 25, 36, 49, 64, 81, 100] #将生成器转化为列表(第2次) >>> list(gen) []
例子中,第1次将生成器转化为列表后,操作生成器的next函数检测到已经没有返回值了,所以第二次将生成器转化成列表时返回了空列表。
2、使用生成器表达式构造生成器
生成器表达式是构造生成器的简单方式,类似于列表推导式的那套,只是方括号换成括号罢了。下面是和上文中squares函数等价的例子:
>>> squares_func = lambda n : (x ** 2 for x in range(1,n + 1)) >>> list(squares_func(10))
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
3、使用itertools模块构造生成器
标准库itertools模块中有一组构造生成器的函数。以groupby为例:
>>> import itertools >>> string = [‘qws‘, ‘wsxc‘, ‘rfcd‘,‘ewsdx‘,‘rfvcx‘,‘vcx‘] >>> for lens, strings in itertools.groupby(string, len_string): ... print(lens, list(strings)) ... 3 [‘qws‘] 4 [‘wsxc‘, ‘rfcd‘] 5 [‘ewsdx‘, ‘rfvcx‘] 3 [‘vcx‘] #这里将具有相同特性的连续元素进行分组。可先进行排序再分组: >>> string.sort(key=len_string) >>> for lens, strings in itertools.groupby(string, len_string): ... print(lens, list(strings)) ... 3 [‘qws‘, ‘vcx‘] 4 [‘wsxc‘, ‘rfcd‘] 5 [‘ewsdx‘, ‘rfvcx‘]