python-- IO多路复用(selectpollepoll)介绍及实现

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python-- IO多路复用(selectpollepoll)介绍及实现相关的知识,希望对你有一定的参考价值。

IO多路复用(select、poll、epoll)介绍及实现

IO多路复用中包括 select、pool、epoll,这些都属于同步,还不属于异步

一、IO多路复用介绍

1、select

select最早于1983年出现在4.2BSD中,它通过一个select()系统调用来监视多个文件描述符的数组,当select()返回后,该数组中就绪的文件描述符便会被内核修改标志位,使得进程可以获得这些文件描述符从而进行后续的读写操作。

  select目前几乎在所有的平台上支持,其良好跨平台支持也是它的一个优点,事实上从现在看来,这也是它所剩不多的优点之一。

  select的一个缺点在于单个进程能够监视的文件描述符的数量存在最大限制,在Linux上一般为1024,不过可以通过修改宏定义甚至重新编译内核的方式提升这一限制。

  另外,select()所维护的存储大量文件描述符的数据结构,随着文件描述符数量的增大,其复制的开销也线性增长。同时,由于网络响应时间的延迟使得大量TCP连接处于非活跃状态,但调用select()会对所有socket进行一次线性扫描,所以这也浪费了一定的开销。

2、poll

poll在1986年诞生于System V Release 3,它和select在本质上没有多大差别,但是poll没有最大文件描述符数量的限制。

  poll和select同样存在一个缺点就是,包含大量文件描述符的数组被整体复制于用户态和内核的地址空间之间,而不论这些文件描述符是否就绪,它的开销随着文件描述符数量的增加而线性增大。

  另外,select()和poll()将就绪的文件描述符告诉进程后,如果进程没有对其进行IO操作,那么下次调用select()和poll()的时候将再次报告这些文件描述符,所以它们一般不会丢失就绪的消息,这种方式称为水平触发(Level Triggered)。

3、epoll

直到Linux2.6才出现了由内核直接支持的实现方法,那就是epoll,它几乎具备了之前所说的一切优点,被公认为Linux2.6下性能最好的多路I/O就绪通知方法。

  epoll可以同时支持水平触发和边缘触发(Edge Triggered,只告诉进程哪些文件描述符刚刚变为就绪状态,它只说一遍,如果我们没有采取行动,那么它将不会再次告知,这种方式称为边缘触发),理论上边缘触发的性能要更高一些,但是代码实现相当复杂。

  epoll同样只告知那些就绪的文件描述符,而且当我们调用epoll_wait()获得就绪文件描述符时,返回的不是实际的描述符,而是一个代表就绪描述符数量的值,你只需要去epoll指定的一个数组中依次取得相应数量的文件描述符即可,这里也使用了内存映射(mmap)技术,这样便彻底省掉了这些文件描述符在系统调用时复制的开销。

  另一个本质的改进在于epoll采用基于事件的就绪通知方式。在select/poll中,进程只有在调用一定的方法后,内核才对所有监视的文件描述符进行扫描,而epoll事先通过epoll_ctl()来注册一个文件描述符,一旦基于某个文件描述符就绪时,内核会采用类似callback的回调机制,迅速激活这个文件描述符,当进程调用epoll_wait()时便得到通知。

4、sellect、poll、epoll三者的区别

技术分享

 

二、select IO多路复用代码实例

Python的select()方法直接调用操作系统的IO接口,它监控sockets,open files, and pipes(所有带fileno()方法的文件句柄)何时变成readable 和writeable, 或者通信错误,select()使得同时监控多个连接变的简单,并且这比写一个长循环来等待和监控多客户端连接要高效,因为select直接通过操作系统提供的C的网络接口进行操作,而不是通过Python的解释器。

import select,socket
server = socket.socket()
server.bind(("localhost", 9000))
server.listen(1000)
server.setblocking(False)  # 设置为非阻塞
inputs = [server, ]   # 一开始只有自己的连接,所以一开始把自己的连接发到列表中
outputs = []
while True:
    #exceptional表示如果inputs列表中出现异常,会输出到这个exceptional中
    readable, writeable, exceptional = select.select(inputs, outputs, inputs)
    # print(readable,writeable,exceptional)
    for r in readable:
        if r is server:  # 表一个新连接
            conn, addr = r.accept()
            print("来了一个新连接",addr)
            inputs.append(conn)  # 因为这个新建立的连接还没有发数据过来,现在就接收的话程序就报错了
            #所以要想实现这个客户端发数据过来时server端能知道,就需要让让select再检测这个conn
        else:
            data = r.recv(1024)
            print("收到数据:", data)
            r.send(data)
            print("send done....")

 

以上是关于python-- IO多路复用(selectpollepoll)介绍及实现的主要内容,如果未能解决你的问题,请参考以下文章

python-IO多路复用,select模块

python-- IO多路复用(selectpollepoll)介绍及实现

Python IO多路复用

python并发编程-多路复用IO

{python之IO多路复用} IO模型介绍 阻塞IO(blocking IO) 非阻塞IO(non-blocking IO) 多路复用IO(IO multiplexing) 异步IO

Python之路(十九):IO多路复用