Python自动化运维之高级函数

Posted 2020-10-01

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Python自动化运维之高级函数相关的知识，希望对你有一定的参考价值。

一、协程
1.1协程的概念
协程，又称微线程，纤程。英文名Coroutine。一句话说明什么是线程：协程是一种用户态的轻量级线程。（其实并没有说明白~）
那么这么来理解协程比较容易：
　　线程是系统级别的，它们是由操作系统调度；协程是程序级别的，由程序员根据需要自己调度。我们把一个线程中的一个个函数叫做子程序，那么子程序在执行过程中可以中断去执行别的子程序；别的子程序也可以中断回来继续执行之前的子程序，这就是协程。也就是说同一线程下的一段代码执行着执行着就可以中断，然后跳去执行另一段代码，当再次回来执行代码块的时候，接着从之前中断的地方开始执行。
比较专业的理解是：
　　协程拥有自己的寄存器上下文和栈。协程调度切换时，将寄存器上下文和栈保存到其他地方，在切回来的时候，恢复先前保存的寄存器上下文和栈。因此：协程能保留上一次调用时的状态（即所有局部状态的一个特定组合），每次过程重入时，就相当于进入上一次调用的状态，换种说法：进入上一次离开时所处逻辑流的位置。
1.2 协程的优缺点
协程的优点：
　　（1）无需线程上下文切换的开销，协程避免了无意义的调度，由此可以提高性能（但也因此，程序员必须自己承担调度的责任，同时，协程也失去了标准线程使用多CPU的能力）
　　（2）无需原子操作锁定及同步的开销
　　（3）方便切换控制流，简化编程模型
　（4）高并发+高扩展性+低成本：一个CPU支持上万的协程都不是问题。所以很适合用于高并发处理。
协程的缺点：
　　（1）无法利用多核资源：协程的本质是个单线程,它不能同时将单个CPU 的多个核用上,协程需要和进程配合才能运行在多CPU上.当然我们日常所编写的绝大部分应用都没有这个必要，除非是cpu密集型应用。
　　（2）进行阻塞（Blocking）操作（如IO时）会阻塞掉整个程序
2、Python中如何实现协程
2.1 yield实现协程　　
　　前文所述“子程序（函数）在执行过程中可以中断去执行别的子程序；别的子程序也可以中断回来继续执行之前的子程序”，那么很容易想到Python的yield，显然yield是可以实现这种切换的。

def eater(name):
    print("%s eat food" %name)
    while True:
        food = yield
    print("done")
g = eater("gangdan")
print(g)

执行结果：

<generator object eater at 0x0000000002140FC0>

由执行结果可以证明g现在就是生成器函数

2.2 协程函数赋值过程
用的是yield的表达式形式，要先运行next()，让函数初始化并停在yield，然后再send() ，send会在触发下一次代码的执行时，给yield赋值
next()和send() 都是让函数在上次暂停的位置继续运行，

def creater(name):
    print(‘%s start to eat food‘ %name)
    food_list = []
    while True:
        food = yield food_list
        print(‘%s get %s ,to start eat‘ %(name,food))
        food_list.append(food)
# 获取生成器
builder = creater(‘tom‘)
# 现在是运行函数，让函数初始化
next(builder)
print(builder.send(‘包子‘))
print(builder.send(‘骨头‘))
print(builder.send(‘菜汤‘))

执行结果：

tom start to eat food
tom get 包子 ,to start eat
[‘包子‘]
tom get 骨头 ,to start eat
[‘包子‘, ‘骨头‘]
tom get 菜汤 ,to start eat
[‘包子‘, ‘骨头‘, ‘菜汤‘]

需要注意的是每次都需要先运行next()函数，让程序停留在yield位置。
如果有多个这样的函数都需要执行next()函数，让程序停留在yield位置。为了防止忘记初始化next操作，需要用到装饰器来解决此问题

def init(func):
    def wrapper(*args,**kwargs):
        builder = func(*args,**kwargs)
        next(builder)    # 这个地方是关键可以使用builder.send("None")，第一次必须传入None。
        return builder
    return wrapper
@init
def creater(name):
    print(‘%s start to eat food‘ %name)
    food_list = []
    while True:
        food = yield food_list
        print(‘%s get %s ,to start eat‘ %(name,food))
        food_list.append(food)
# 获取生成器
builder = creater("tom")
# 现在是直接运行函数，无须再函数初始化
print(builder.send(‘包子‘))
print(builder.send(‘骨头‘))
print(builder.send(‘菜汤‘))

执行结果：

tom start to eat food
tom get 包子 ,to start eat
[‘包子‘]
tom get 骨头 ,to start eat
[‘包子‘, ‘骨头‘]
tom get 菜汤 ,to start eat
[‘包子‘, ‘骨头‘, ‘菜汤‘]

2.3 协程函数简单应用
请给Tom投喂食物

def init(func):
    def wrapper(*args,**kwargs):
        builder = func(*args,**kwargs)
        next(builder)
        return builder
    return wrapper
@init
def creater(name):
    print(‘%s start to eat food‘ %name)
    food_list = []
    while True:
        food = yield food_list
        print(‘%s get %s ,to start eat‘ %(name,food))
        food_list.append(food)
def food():
    builder = creater("Tom")
    while True:
        food = input("请给Tom投喂食物：").strip()
        if food == "q":
            print("投喂结束")
            return 0
        else:
            builder.send(food)
if __name__ == ‘__main__‘:
    food()

执行结果：

Tom start to eat food
请给Tom投喂食物：骨头
Tom get 骨头 ,to start eat
请给Tom投喂食物：菜汤
Tom get 菜汤 ,to start eat
请给Tom投喂食物：q
投喂结束

2.4 协程函数的应用
实现linux中"grep -rl error <目录>"命令，过滤一个文件下的子文件、字文件夹的内容中的相应的内容的功能程序
首先了解一个OS模块中的walk方法,能够把参数中的路径下的文件夹打开并返回一个元组

>>> import os # 导入模块
>>> os.walk(r"E:\Python\script") #使用r 是让字符串中的符号没有特殊意义，针对的是转义
<generator object walk at 0x00000000035D3F10>
>>> g = os.walk(r"E:\Python\script")
>>> next(g)
(‘E:\\Python\\script‘, [‘.idea‘, ‘函数‘], [])

返回的是一个元组，第一个元素是文件的路径，第二个是文件夹，第三个是该路径下的文件
这里需要用到一个写程序的思想：面向过程编程
二、面向过程编程
面向过程：核心是过程二字，过程及即解决问题的步骤，基于面向过程设计程序就是一条工业流水线，是一种机械式的思维方式。流水线式的编程思想，在设计程序时，需要把整个流程设计出来
优点：
1：体系结构更加清晰
2：简化程序的复杂度
缺点：
可扩展性极其的差，所以说面向过程的应用场景是：不需要经常变化的软件，如：linux内核，httpd，git等软件

下面就根据面向过程的思想完成协程函数应用中的功能
目录结构：

test
├── aa
│   ├── bb1
│    │    └── file2.txt
│   └── bb2
│       └── file3.txt
└─ file1.txt
文件内容：
file1.txt：error123
file2.txt：123
file3.txt：123error

程序流程
   第一阶段：找到所有文件的绝对路径
   第二阶段：打开文件
   第三阶段：循环读取每一行
   第四阶段：过滤“error”
   第五阶段：打印该行属于的文件名

第一阶段：找到所有文件的绝对路径
g是一个生成器，就能够用next()执行，每次next就是运行一次，这里的运行结果是依次打开文件的路径

>>> import os
>>> g = os.walk(r"E:\Python\script\函数\test")
>>> next(g)
(‘E:\\Python\\script\\函数\\test‘, [‘aa‘], [])
>>> next(g)
(‘E:\\Python\\script\\函数\\test\\aa‘, [‘bb1‘, ‘bb2‘], [‘file1.txt‘])
>>> next(g)
(‘E:\\Python\\script\\函数\\test\\aa\\bb1‘, [], [‘file2.txt‘])
>>> next(g)
(‘E:\\Python\\script\\函数\\test\\aa\\bb2‘, [], [‘file3.txt‘])
>>> next(g)
Traceback (most recent call last):
  File "<input>", line 1, in <module>
StopIteration

我们在打开文件的时候需要找到文件的绝对路径，现在可以通过字符串拼接的方法把第一部分和第三部分进行拼接
用循环打开：

import os
dir_g = os.walk(r"E:\Python\script\函数\test")
for dir_path in dir_g:
    print(dir_path)

结果：

(‘E:\\Python\\script\\函数\\test‘, [‘aa‘], [])
(‘E:\\Python\\script\\函数\\test\\aa‘, [‘bb1‘, ‘bb2‘], [‘file1.txt‘])
(‘E:\\Python\\script\\函数\\test\\aa\\bb1‘, [], [‘file2.txt‘])
(‘E:\\Python\\script\\函数\\test\\aa\\bb2‘, [], [‘file3.txt‘])

将查询出来的文件和路径进行拼接，拼接成绝对路径

import os
dir_g = os.walk(r"E:\Python\script\函数\test")
for dir_path in dir_g:
    for file in dir_path[2]:
        file = "%s\\%s" %(dir_path[0],file)
        print(file)

执行结果：

E:\Python\script\函数\test\aa\file1.txt
E:\Python\script\函数\test\aa\bb1\file2.txt
E:\Python\script\函数\test\aa\bb2\file3.txt

用函数实现:

import os
def search():
    while True:
        dir_name = yield
        dir_g = os.walk(dir_name)
        for dir_path in dir_g:
            for file in dir_path[2]:
                file = "%s\\%s" %(dir_path[0],file)
                print(file)
g = search()
next(g)
g.send(r"E:\Python\script\函数\test")

为了把结果返回给下一流程

@init   # 初始化生成器
def search(target):
    while True:
        dir_name = yield
        dir_g = os.walk(dir_name)
        for pardir,_,files in dir_g:
            for file in files:
                abspath = r"%s\%s" %(pardir,file)
                target.send(abspath)

第二阶段：打开文件

@init
def opener(target):
    while True:
        abspath=yield
        with open(abspath,‘rb‘) as f:
            target.send((abspath,f))

第三阶段：循环读出每一行内容

@init
def cat(target):
    while True:
        abspath,f=yield #(abspath,f)
        for line in f:
            res=target.send((abspath,line))
            if res:break

第四阶段：过滤

@init
def grep(pattern,target):
    tag=False
    while True:
        abspath,line=yield tag
        tag=False
        if pattern in line:
            target.send(abspath)
            tag=True

第五阶段：打印该行属于的文件名

@init
def printer():
    while True:
        abspath=yield
        print(abspath)
g = search(opener(cat(grep(‘error‘.encode(‘utf-8‘), printer()))))
g.send(r‘E:\Python\script\函数\test‘)

执行结果：

E:\Python\script\函数\test\aa\file1.txt
E:\Python\script\函数\test\aa\bb2\file3.txt

本文出自 “炫维” 博客，请务必保留此出处http://xuanwei.blog.51cto.com/11489734/1953449

以上是关于Python自动化运维之高级函数的主要内容，如果未能解决你的问题，请参考以下文章

python自动化运维之Socket网络编程