Python自动化开发课堂笔记Day04 - Python基础(函数补充,模块,包)
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python自动化开发课堂笔记Day04 - Python基础(函数补充,模块,包)相关的知识,希望对你有一定的参考价值。
表达式形式的yield
yield的语句形式: yield 1
yield的表达式形式: x=yield
1 x=yield 2 g.send(‘1111‘) #先把1111传给yield,由yield赋值给x,然后再往下执行,直到再次碰到yield,然后把yield后的返回值返回
协程函数示例
1 def gen(func): 2 def wrapper(*args,**kwargs): 3 res = func(*args,**kwargs) 4 next(res) #相当于next(g)或者g.send(None) 5 return res 6 return wrapper 7 8 @gen 9 def eater(name): 10 print(‘%s start to eat‘ % name) 11 food_list = [] 12 while True: 13 food = yield food_list| 14 food_list.append(food) 15 print(‘%s start to eat %s‘% (name,food)) 16 17 g = eater(‘Albert‘) #初始化操作,由装饰函数gen对eater函数进行初始化,传入一个空值 18 print(g.send(‘Apple‘)) #此时函数挂起在红线出,send执行后,将Apple传给yield,并有yield赋值给food,之后再执行append操作,让后返回food_list 19 print(g.send(‘Peach‘))
模拟 grep -rl ‘python‘ /root 示例
1 import os 2 3 def init(func): 4 def wrapper(*args,**kwargs): 5 res = func(*args,**kwargs) 6 next(res) 7 return res 8 return wrapper 9 10 @init 11 def search_dir(target): 12 while True: 13 search_path = yield #将搜索路径赋值给search_path 14 g = os.walk(search_path)#遍历目录下的所有文件夹和子文件夹以及各文件夹下面的文件 15 for par_dir, _, files in g: #遍历列表g中所有的父级文件夹目录和文件 16 for file in files:#遍历文件夹下所有文件 17 file_abs_path = r‘%s\%s‘, (par_dir, file)#形成绝对路径字符串 18 target.send(file_abs_path)#将文件绝对路径传值给open_file函数 19 @init 20 def open_file(target): 21 while True: 22 file_abs_path = yield #将文件绝对路径赋值给file_abs_path 23 with open(file_abs_path,‘r‘, encoding=‘urf-8‘) as f: 24 target.send((f,file_abs_path))#将文件内容和绝对路径传值给cat_file函数 25 @init 26 def cat_file(target): 27 while True: 28 f, file_abs_path = yield #将yield中文件内容和绝对路径赋值 29 for line in f:#逐行遍历文件内容 30 tag = target.send(line, file_abs_path)#将每行内容和绝对路径传值给grep_line函数进行判断,并返回值tag 31 if tag: #如果返回值tag为True,就停止对该文件剩余行数的遍历,并进行下一文件逐行遍历 32 break 33 34 @init 35 def grep_line(target,pattern): 36 tag = False 37 while True: 38 line, file_abs_path = yield tag #将每行内容和绝对路径赋值,并取到返回值tag 39 tag = False #初始化tag 40 if pattern in line:#如果改行内容匹配到目标字符串,返回值tag为True 41 tag = True 42 target.send(file_abs_path) #将文件绝对路径传值给print函数打印 43 @init 44 def print_file(): 45 file_abs_path = yield 46 print(file_abs_path) 47 48 x = r‘C:\Users\Administrator\PycharmProjects\python17期\day5\a‘ 49 g = search_dir(open_file(cat_file(grep_line(print_file(), ‘python‘)))) 50 print(g) 51 g.send(x)
面向过程的程序设计:是一种流水线式的编程思路,是机械式
优点:
程序的结构清晰,可以把复杂的问题简单
缺点:
扩展性差
应用场景:
linux内核,git,httpd
匿名函数
匿名函数:用之则弃的函数,基本不会占用内存,不像正常的全局函数,会存活到程序结束
1 def func(x,y): 2 return x+y 3 func(1,2) 4 5 f=lambda x,y:x+y 6 print(f) 7 print(f(1,2))
内置函数补充
1. max,min,zip,sorted的用法, 运用到匿名函数的概念
1 salaries={ 2 ‘egon‘:3000, 3 ‘alex‘:100000000, 4 ‘wupeiqi‘:10000, 5 ‘yuanhao‘:2000 6 } 7 for i in salaries: 8 print(i) 9 print(max(salaries)) 10 res=zip(salaries.values(),salaries.keys()) 11 12 print(list(res)) 13 print(max(res)) 14 15 def func(k): 16 return salaries[k] 17 18 print(max(salaries,key=func)) 19 print(max(salaries,key=lambda k:salaries[k])) 20 print(min(salaries,key=lambda k:salaries[k])) 21 22 print(sorted(salaries)) #默认的排序结果是从小到到 23 print(sorted(salaries,key=lambda x:salaries[x])) #默认的排序结果是从小到到 24 print(sorted(salaries,key=lambda x:salaries[x],reverse=True)) #默认的排序结果是从小到到
2. map,reduce,filter函数
1 l=[‘alex‘,‘wupeiqi‘,‘yuanhao‘] 2 res=map(lambda x:x+‘_SB‘,l) 3 print(res) 4 print(list(res)) 5 6 nums=(2,4,9,10) 7 res1=map(lambda x:x**2,nums) 8 print(list(res1)) 9 10 from functools import reduce 11 l=[1,2,3,4,5] 12 print(reduce(lambda x,y:x+y,l,10)) 13 14 l=[‘alex_SB‘,‘wupeiqi_SB‘,‘yuanhao_SB‘,‘egon‘] 15 res=filter(lambda x:x.endswith(‘SB‘),l) 16 print(list(res))
递归调用
1. 定义:在函数调用过程中,直接或间接地调用了函数本身,这就是函数的递归调用
2. 递归效率低,需要在进入下一次递归时保留当前的状态,解决方法是尾递归,但是Python没有,且对递归层级做了限制
1.必须有一个明确的结束条件
2.每次进入更深一层递归时,问题规模相比上次递归都应有所减少
3.递归效率不高,递归层次过多会导致栈溢出。
1 import sys 2 print(sys.getrecursionlimit()) #查看Python可以递归的层数,默认1000,可设置 3 print(sys.setrecursionlimit(1000000)) #设置Pyth可递归层数。最高8000 4 print(sys.getrecursionlimit()) #查看设置结果
3. 递归的原理
1 age(5)=age(4)+2 2 age(4)=age(3)+2 3 age(3)=age(2)+2 4 age(2)=age(1)+2 5 age(1)=18 6 7 age(n)=age(n-1)+2 #n>2 8 age(n)=18 #n=1 9 10 def age(n): 11 if n == 1: 12 return 18 13 return age(n-1)+2 14 print(age(5))
4. 递归的应用(二分法)
1 第一种方式: 2 raw_lst = [1,5,324,12,67,34,32,879,65,23,4,78,56,2,6,8] 3 while True: 4 lst = sorted(raw_lst) 5 t_num = input(‘>>>: ‘) 6 n = int(t_num) 7 while True: 8 if len(lst) // 2 == 0: 9 print(‘Nothing found‘) 10 break 11 elif lst[len(lst) // 2] == n: 12 print(‘Bingo‘) 13 break 14 elif lst[len(lst) // 2] > n: 15 lst = lst[:len(lst) // 2] 16 elif lst[len(lst) // 2] < n: 17 lst = lst[len(lst) // 2:] 18 19 第二种方式: 20 raw_list = [1, 2, 10,33,53,71,73,75,77,85,101,201,202,999,11111] 21 def search_num(target_num, seq): 22 seq = sorted(seq) # 如果列表是无序的情况下需要先进性排序 23 if len(seq) == 0: 24 return ‘Not found...‘ 25 mid_index = len(seq)//2 26 mid_num = seq[mid_index] 27 if mid_num > target_num: 28 seq = seq[:mid_index] 29 search_num(target_num, seq) 30 elif mid_num < target_num: 31 seq = seq[mid_index+1:] 32 search_num(target_num, seq) 33 elif mid_num == target_num: 34 print(‘Bingo!!!‘) 35 search_num(33,raw_list)
模块
1. 什么是模块
一个模块就是一个包含了python定义和声明的文件,文件名就是模块名字加上.py的后缀
2. 为什么要使用模块
程序中定义的函数或者变量都会因为python解释器的关闭而丢失,因此通常我们会将程序以文件的方式保存下来方便重复利用。
为了方便管理越来越多的文件,我们将这些文件归纳为模块,实用的时候就把模块导入到程序中
3. 如何使用模块
1 # spam模块文件 2 # -*- coding:utf-8 -*- 3 # !/usr/bin/python 4 __all__ = [‘money‘,‘read1‘] #from spam import * 导入的所有变量,类表中只添加所需变量 5 money = 1000 6 def read1(): 7 print(‘spam->read1->money‘,money) 8 def read2(): 9 print(‘spam->read2 calling read1‘) 10 read1() 11 def change(): 12 global money 13 money = 0 14 #spam.py当作脚本执行时,__name__==‘__main__‘ 15 #spam.py当作模块导入时,__name__==‘模块名‘ 16 # print(‘当前文件的用途是:‘, __name__) 17 #作用:用于判断当前文件时按照脚本执行还是模块执行 18 if __name__ == ‘__main__‘: 19 print(‘from the spam.py‘) 20 print(‘当作脚本执行‘) 21 change() 22 print(money)
1 import...导入模块进行的操作: 2 1. 产生新的名称空间 3 2. 以新建的名称空间为全局名称空间,执行文件的代码 4 3. 拿到一个模块名spam,指向spam.py产生的名称空间 5 6 # fortest.py文件 7 # -*- coding:utf-8 -*- 8 # !/usr/bin/python 9 import spam as x #起一个别名作为引用 10 import spam 11 money = 2000 #此money并非spam名称空间中的money 12 print(spam.money) #从spam的名称空间中的money变量值 13 print(x.money) #相同效果 14 spam.read1() 15 spam.read2() 16 spam.change() #修改spam空间中的money变量,任然以spam名称空间定义的为准 17 print(spam.money) 18 19 from...import...导入模块进行的操作: 20 1. 产生新的名称空间 21 2. 以新建的名称空间为全局名称空间,执行文件的代码 22 3. 直接拿到就是spam.py产生的名称空间的名字 23 24 优点:方便,不用加前缀 25 缺点: 容易跟当前文件的名称空间冲突 26 27 from spam import * #将spam中所有内容导入,使用时不用加前缀,慎用,容易和当前名称空间中变量发生冲突 28 可以在模块文件中使用__all__=[]的方法来加以控制所需导入的名称 29 30 # fortest.py文件 31 # -*- coding:utf-8 -*- 32 # !/usr/bin/python 33 from spam import read1,money,read2,change 34 print(money) 35 read1() 36 money = 10 #从spam取到的money的值已经被重新绑定赋值,但是spam中的money值没有改变 37 print(money) 38 def read1(): 39 print(‘===> from fortest.py read1‘) 40 read1() #使用当前名称空间中函数定义的功能 41 read2() #与导入方式无关,此函数从哪个名称空间导入,就会任然沿用该空间函数功能,所以调用的仍然是spam中的read1函数
模块搜索路径
顺序:内存空间 -> 内置函数 -> sys.path(从当前路径开始查找)
import sys
print(sys.path) #查看系统路径
如果需要添加的模块和当前文件不在同一个目录中,那么需要将模块的路径添加到sys.path中,才能添加成功
或者将该模块文件添加到site-package文件夹中
re模块
re.match:尝试从字符串的开始匹配一个模式,如:下面的例子匹配第一个单词。
re.match的函数原型为:re.match(pattern, string, flags)
第一个参数是正则表达式,这里为"(\w+)\s",如果匹配成功,则返回一个Match,否则返回一个None;
第二个参数表示要匹配的字符串;
第三个参数是标致位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。
1 import re 2 text = "JGood is a handsome boy, he is cool, clever, and so on..." 3 m = re.match(r"(\w+)\s", text) 4 if m: 5 print m.group(0), ‘\n‘, m.group(1) 6 else: 7 print ‘not match‘
re.search:会在字符串内查找模式匹配,只到找到第一个匹配然后返回,如果字符串没有匹配,则返回None。
re.search的函数原型为: re.search(pattern, string, flags)
每个参数的含意与re.match一样。
re.match与re.search的区别:re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。
1 import re 2 text = "JGood is a handsome boy, he is cool, clever, and so on..." 3 m = re.search(r‘\shan(ds)ome\s‘, text) 4 if m: 5 print m.group(0), m.group(1) 6 else: 7 print ‘not search‘
re.sub: 用于替换字符串中的匹配项。下面一个例子将字符串中的空格 ‘ ‘ 替换成 ‘-‘ :
re.sub的函数原型为:re.sub(pattern, repl, string, count)
其中第二个函数是替换后的字符串;本例中为‘-‘
第四个参数指替换个数。默认为0,表示每个匹配项都替换。
re.sub还允许使用函数对匹配项的替换进行复杂的处理。如:re.sub(r‘\s‘, lambda m: ‘[‘ + m.group(0) + ‘]‘, text, 0);将字符串中的空格‘ ‘替换为‘[ ]‘。
1 import re 2 text = "JGood is a handsome boy, he is cool, clever, and so on..." 3 print re.sub(r‘\s+‘, ‘-‘, text)
re.split: 可以使用re.split来分割字符串,如:re.split(r‘\s+‘, text);将字符串按空格分割成一个单词列表。
re.findall: 可以获取字符串中所有匹配的字符串。如:re.findall(r‘\w*oo\w*‘, text);获取字符串中,包含‘oo‘的所有单词。
re.compile: 把正则表达式编译成一个正则表达式对象。可以把那些经常使用的正则表达式编译成正则表达式对象,这样可提高一定的效率。下面是一个正则表达式对象的一个例子:
1 import re 2 text = "JGood is a handsome boy, he is cool, clever, and so on..." 3 regex = re.compile(r‘\w*oo\w*‘) 4 print regex.findall(text) #查找所有包含‘oo‘的单词 5 print regex.sub(lambda m: ‘[‘ + m.group(0) + ‘]‘, text) #将字符串中含有‘oo‘的单词用[]括起来。
包
从目录级别来组织模块的,也是通过import引入
1. 无论是import形式还是from...import形式,凡是在导入语句中(而不是在使用时)遇到带点的,都要第一时间提高警觉:这是关于包才有的导入语法。
2. 包是目录级的(文件夹级),文件夹是用来组成py文件(包的本质就是一个包含__init__.py文件的目录)
3. import导入文件时,产生名称空间中的名字来源于文件,import包,产生的名称空间的名字同样来源于文件,即包下的__init__.py,导入包本质就是在导入该文件
注意事项:
1. 关于包相关的导入语句也分为import和from ... import ...两种,但是无论哪种,无论在什么位置,在导入时都必须遵循一个原则:
凡是在导入时带点的,点的左边都必须是一个包,否则非法。可以带有一连串的点,如item.subitem.subsubitem,但都必须遵循这个原则。
2. 对于导入后,在使用时就没有这种限制了,点的左边可以是包,模块,函数,类(它们都可以用点的方式调用自己的属性)。
3. .对比import item 和from item import name的应用场景:如果我们想直接使用name那必须使用后者。
以上是关于Python自动化开发课堂笔记Day04 - Python基础(函数补充,模块,包)的主要内容,如果未能解决你的问题,请参考以下文章
Python自动化开发课堂笔记Day06 - Python基础(模块)
Python自动化开发课堂笔记Day07 - Python进阶(类)- 02
Python自动化开发课堂笔记Day06 - Python进阶(类)