重修课程day35(网络编程九之协程)

Posted 方杰0410

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了重修课程day35(网络编程九之协程)相关的知识,希望对你有一定的参考价值。

什么是用户态和内核态:

 内核态:当一个任务(进程)执行系统调用而陷入了内核代码中执行,这就叫做内核态。

 用户态:当用户在执行自己的代码时,这就叫在用户态

  内核态和用户态的详情:http://www.cnblogs.com/viviwind/archive/2012/09/22/2698450.html

psw程序状态寄存器:程序状态字(Program Status Word, PSW)又称状态寄存器,主要用于反映处理器的状态及某些计算结果以及控制指令的执行。

  psw程序状态寄存器详情:http://blog.csdn.net/liuqinglong_along/article/details/51645477

操作系统应用级的识别:每一个cpu都有自己的指令集。操作系统控制着所有的硬件,也就是说操作系统知道CPU所有的指令集。而应用程序只能靠着操作系统来控制着硬件。也就是说CPU的一些指令集是与应用程序有关的。

一 协程()Coroutine

 1 什么叫协程:单线程内实现并发,又称为微线程或者钎程。说白了就是协程是一种用户态的轻量级线程,协程就是用户程序自己控制调度的。

 怎么在单线程下实现并发:用户从应用程序级别单线程下的切换,注意的是遇到了IO才切。(切换时保存好当时执行的状态)

 协程就是线程内部调度的;而线程和进程都是由操作系统来调度的。

 2 协程的优缺点

  协程的优点:①协程的切换开销更小,属于程序级别的切换,因此操作系统根本就感知不到,因而更加轻量级。

        ②单线程内实现了并发,从而最大限度的利用的CPU。

  协程的缺点:①协程的本质就是在单线程内,因此无法使用多核。(只能创建多个进程,进程内在创建多个线程,线程内在创建协程)

        ②协程只在单线程下,因此只要是所有协程阻塞,这个线程就会被阻塞。

    3 协成特点

  协程拥有自己的寄存器上下文和栈。协程调度切换时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器  上下文和栈。因此:协程能保留上一次调用时的状态(即所有局部状态的一个特定组合),每次过程重入时,就相当于进入上一次调用的状  态,换种说法:进入上一次离开时所处逻辑流的位置。

二 协程的创建

 创建方式一:生成器函数创建

  为什么迭代器还要有iter方法:主要用于for循环,因为for循环里面自带iter和next方法,所以在一个迭代器使用for循环的时候还是需要iter 一下的。

def producer():
    g=consumer()
    next(g)
    for i in range(100):
        print(\'alex_\',i)
        g.send(i)

def consumer():
    while True:
        n = yield
        print(\'egon_\',n)

producer()

 创建方式二:greenlet模块创建

  switch:提交任务

from greenlet import greenlet
def ect(name):
    print(\'%s ect 1\'%name)
    g2.switch(\'egon\')
    print(\'%s ect 2\'%name)
    g2.switch(\'egon\')

def paly(name):
    print(\'%s paly 1\'%name)
    g1.switch(\'alex\')
    print(\'%s paly 2\'%name)

g1=greenlet(ect)
g2=greenlet(paly)
g1.switch(\'alex\')

 注意方式一和方式二切换只是实现了单纯的切换。只能一个代码执行完毕后才切换,无法检测到IO。反而还浪费了时间,不建议使用。

 创建方式三:gevent模块的创建

 gevent模块的作用:①检测IO;②自动的切换,切换时还能保存当时执行的状态。

 gevent模块的常用方法

  gevent.skeep:睡眠几秒,用这个可以创建IO。

  spawn:提交任务。括号里面加上一个函数,如果有参数可以传入参数。   

  joinall:等待执行。(等待所有的任务提交完毕过后才执行)

gevent方式1:

import gevent
import time
def ect(name):
    print(\'%s ect 1\'%name)
    gevent.sleep(2)
    print(\'%s ect 2\'%name)

def paly(name):
    print(\'%s paly 1\' % name)
    gevent.sleep(1)
    print(\'%s paly 2\' % name)

start=time.time()
s1=gevent.spawn(ect,\'alex\')
s2=gevent.spawn(paly,\'egon\')

gevent.joinall([s1,s2])
print(time.time()-start)

  joinall相当于是多个join的一样,也就是多个join的简化版。括号里面需要传入对象,而对象的格式就是一个字典的格式。  

from  gevent import monkey;monkey。patch_all():加上补丁。

from gevent import monkey;monkey.patch_all()
import gevent
import time
def ect(name):
    print(\'%s ect 1\'%name)
    time.sleep(2)
    print(\'%s ect 2\' % name)

def paly(name):
    print(\'%s paly 1\'%name)
    time.sleep(1)
    print(\'%s paly 2\' % name)

start=time.time()
s1=gevent.spawn(ect,\'alex\')
s2=gevent.spawn(paly,\'egon\')
gevent.joinall([s1,s2])
print(time.time()-start)

  补丁的作用:因为gevent不能自动的识别除了gevent以外的IO,因此加上一个补丁,这样就可以识别替他的情况产生的IO了。

基于协程实现单线程下的并发效果:

服务端:

from gevent import monkey;monkey.patch_all()
import gevent
from multiprocessing import Process
from socket import *

def server(ip,port):
    s = socket(AF_INET, SOCK_STREAM)
    s.setsockopt(SOL_SOCKET, SO_REUSEADDR, 1)
    s.bind((ip,port))
    s.listen(5)
    while True:
        conn,addr=s.accept()
        print(\'%s:%s\' % (addr[0], addr[1]))
        g1=gevent.spawn(talk,conn,addr)

def talk(conn,addr):
    while True:
        try:
            data=conn.recv(1024)
            print(\'%s:%s [%s]\' %(addr[0],addr[1],data))
            if not data:break
            conn.send(data.upper())
        except ConnectionResetError:
            break
    conn.close()
if __name__ == \'__main__\':
    server(\'127.0.0.1\',8092)

客户端:

from threading import Thread
from socket import *

def client():
    c=socket(AF_INET,SOCK_STREAM)
    c.connect((\'127.0.0.1\',8092))

    while True:
        c.send(\'hello\'.encode(\'utf-8\'))
        data=c.recv(1024)
        print(data.decode(\'utf-8\'))

if __name__ == \'__main__\':
    for i in range(500):
        t=Thread(target=client)
        t.start()

 基于协程实现网络爬虫:

from gevent import monkey;monkey.patch_all()
import gevent
import requests
from threading import current_thread
def get(url):
    print(\'%s get %s\' %(current_thread().getName(),url))
    response=requests.get(url)
    if response.status_code == 200:
        return {\'url\':len(response.text)}
        # print({\'url\':len(response.text)})


g1=gevent.spawn(get,\'http://www.baidu.com\')
g2=gevent.spawn(get,\'http://www.python.org\')
g3=gevent.spawn(get,\'http://www.jd.com\')

g1.join()
g2.join()
g3.join()

print(g1.value)
print(g2.value)
print(g3.value)

 协程创建生产者和消费者模型好处:1 减低了生产者和消费者直接的数据差;2 解耦和。

 yield与协成,如图所示:

    

  greenlet实现协成

    

    greenlet机制的主要思想是:生成器函数或者协程函数中的yield语句挂起函数的执行,直到稍后使用next()或send()操作进行恢复为止。  可以使用一个调度器循环在一组生成器函数之间协作多个任务。greentlet是python中实现我们所谓的"Coroutine(协程)"的一个基础库.

 gevent实现协成

    

    注释:同比之前上面两个实现协成的方式而言,当gevent实现协成遇到IO操作时会切换到下一个任务中,大大的节省了cpu执行程序的  时间

    注释:

    协程的好处:无需线程上下文切换的开销,无需原子操作锁定及同步的开销;方便切换控制流,简化编程模型;高并发+高扩展性+低成  本:一个CPU支持上万的协程都不是问题。所以很适合用于高并发处理。
    缺点:无法利用多核资源:协程的本质是个单线程,它不能同时将 单个CPU 的多个核用上,协程需要和进程配合才能运行在多CPU    上.当然我们日常所编写的绝大部分应用都没有这个必要,除非是cpu密集型应用。进行阻塞(Blocking)操作(如IO时)会阻塞掉整个程序

以上是关于重修课程day35(网络编程九之协程)的主要内容,如果未能解决你的问题,请参考以下文章

重修课程day31(网络编程五之进程二)

重修课程day32(网络编程六之进程三)

重修课程day9(函数之有参函数)

重修课程day34(网络编程八之线程二)

Day 18 18.1 并发爬虫之协程实现

Go语言自学系列 | golang并发编程之协程