函数式编程
函数是Python内建支持的一种封装,而函数式编程通俗说来就是把函数本身作为参数传入另一个函数,允许返回一个函数。
函数名其实也是变量,也可以被赋值。如果函数名被赋值为其他值,则不再指向原来函数。
高阶函数:既然变量可以指向函数,函数的参数能接收变量,那么一个函数就可以接收另一个函数作为参数,这种函数就称之为高阶函数。
此时就可以学习几个 高阶函数:
- map/reduce
可借鉴Google论文[MapReduce: Simplified Data Processing on Large Clusters](http://research.google.com/archive/mapreduce.html)
map(func, Iterator)
第一个参数即为函数名,第二个参数即为一个列表,map将传入的函数依次作用到序列的每一个元素上,并返回一个新的列表Iterator。
def abc(x):
return x * x
r = map(abc, [1, 2, 3, 4, 5, 6, 7, 8, 9])
list(r)
结果:
[1, 4, 9, 16, 25, 36, 49, 64, 81]
注意: 循环也可以得到相同结果,但是会生成多个list。
reduce(func ,Iterator)
reduce把结果和序列的下一个元素做累积计算。
reduce(f, [x1, x2, x3, x4]) = f(f(f(x1, x2), x3), x4)
综合例子:str 转 int
from functools import reduce
DIGITS = {‘0‘: 0, ‘1‘: 1, ‘2‘: 2, ‘3‘: 3, ‘4‘: 4, ‘5‘: 5, ‘6‘: 6, ‘7‘: 7, ‘8‘: 8, ‘9‘: 9}
def char2num(s):
return DIGITS[s]
def str2int(s):
return reduce(lambda x, y: x * 10 + y, map(char2num, s))
print(str2int("124432"))
结果:
124432
- filter(func, Iterator)
用于过滤序列(筛选)。fifter把传入的函数作用于每个元素之后,根据传入函数的返回值是True还是False决定保留还是丢弃该元素,最终还是返回列表。
例子:用filter求素数
计算素数的一个方法是埃氏筛法,它的算法理解起来非常简单:
首先,列出从2开始的所有自然数,构造一个序列:
2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...
取序列的第一个数2,它一定是素数,然后用2把序列的2的倍数筛掉:
3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...
取新序列的第一个数3,它一定是素数,然后用3把序列的3的倍数筛掉:
5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...
取新序列的第一个数5,然后用5把序列的5的倍数筛掉:
7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...
不断筛下去,就可以得到所有的素数。
用Python来实现这个算法,可以先构造一个从3开始的奇数序列:
def _odd_iter():
n = 1
while True:
n = n + 2
yield n
注意这是一个生成器,并且是一个无限序列。
然后定义一个筛选函数:
def _not_divisible(n):
return lambda x: x % n > 0
最后,定义一个生成器,不断返回下一个素数:
def primes():
yield 2
it = _odd_iter() # 初始序列
while True:
n = next(it) # 返回序列的第一个数
yield n
it = filter(_not_divisible(n), it) # 构造新序列
这个生成器先返回第一个素数2,然后,利用filter()不断产生筛选后的新的序列。
由于primes()也是一个无限序列,所以调用时需要设置一个退出循环的条件:
# 打印1000以内的素数:
for n in primes():
if n < 1000:
print(n)
else:
break
注意到Iterator是惰性计算的序列,所以我们可以用Python表示“全体自然数”,“全体素数”这样的序列,而代码非常简洁。
- sorted()
排序算法:排序也是在程序中经常用到的算法。无论使用冒泡排序还是快速排序,排序的核心是比较两个元素的大小。如果是数字,我们可以直接比较,但如果是字符串或者两个dict呢?直接比较数学上的大小是没有意义的,因此,比较的过程必须通过函数抽象出来。
sorted(list, key=func, reserve=False):按key接收的函数作用在list的每个元素上之后的返回值进行排序, * 而返回的是对应原来的元素*,reserve为反向排序。
返回函数
函数作为函数的返回值。
def lazy_sum(*args):
def sum():
ax = 0
for n in args:
ax = ax + n
return ax
return sum
f = lazy_sum(1, 3, 5, 7, 9)
f()
结果:
25
注意点:即使传入相同的参数,返回的也不是同一个函数。