浅谈I/O多路复用技术

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了浅谈I/O多路复用技术相关的知识,希望对你有一定的参考价值。

参考技术A

I/O多路复用,即一个线程可以处理很多个socket连接。一个select/poll/epoll系统调用可以处理很多个socket连接,而不像recv等系统调用每次只能处理一个sock。

服务端主线程只负责accept新的连接,每次有新连接则抛出一个线程处理该连接的数据接收与发送。

缺点:开销大,性能差

服务端将监听与接收都设置为非阻塞,轮询所有已建立连接的socket。

缺点:大量的CPU时间浪费在无效的轮询上面(对每个有效/无效的sock连接都调用recv等系统调用,而每次系统调用都会造成上CPU下文切换)

一个select/poll/epoll系统调用可以处理很多个socket连接,每次返回告诉服务端哪些sock可以读/写,从而服务器只对有效的sock进行读写。

I/O多路复用器时同步I/O模型:它只向用户程序返回状态(可读写),程序自己得去accept/recv/write。

异步I/O模型指的是有一个方法,你调用了,返回时除了返回可读写状态,同时数据也帮你写入用户程序了,不需要自己去recv。

1)fd重复传递(相同的fd重复从用户态传到内核态); 解决方案:在内核开辟一个空间记录已传递的fd

2)被动遍历(内核没有记录已传递的fd,每次select调用都得遍历所有的fd); 解决方案:内核存储已传递的fd,每次网卡驱动有事件知道是哪个fd,下次epoll调用直接知道哪些fd有效。

1) epoll_creat()在内核开辟空间记录已传递的fds。 函数的返回值epoll_fd即代表内核开辟的空间(以红黑树存储)。

2) epoll_ctl(epoll_fd, ADD, listen_fd, ACCEPT/RECV/WRITE)负责往epoll_fd指向的内核空间中添加新的socket连接及该socket连接上需要监听的事件类型。 即每个socket描述符只传递一次。

3) epoll_wait() 返回有响应的fd集合(rd_list等待区),返回服务器程序处理。epoll通过网卡的异步消息机制,将红黑数里边有事件响应的fd放入rd_list。

浅谈网络I/O多路复用模型 select & poll & epoll

我们首先需要知道selectpollepoll都是IO多路复用的机制。I/O多路复用就通过一种机制,可以监视多个描述符,一旦某个描述符就绪(一般是读就绪或者写就绪),能够通知程序进行相应的读写操作。但selectpollepoll本质上都是同步I/O,因为他们都需要在读写事件就绪后自己负责进行读写,也就是说这个读写过程是阻塞的。

select的基本用法:http://blog.csdn.net/nk_test/article/details/49256129

poll的基本用法:http://blog.csdn.net/nk_test/article/details/49283325

epoll的基本用法:http://blog.csdn.net/nk_test/article/details/49331717

接下来我们探讨如何正确使用non-blocking I/O Multiplexing + poll/epoll。

先来说几个常见的问题:

1.SIGPIPE信号的产生和处理

如果客户端使用close关闭套接字,而服务器端调用了一次write,服务器会接收一个RST segmentTCP传输层); 如果服务器再次调用write,这个时候就会产生SIGPIPE信号,如果不忽略,就会默认退出程序,显然是不满足服务器的高可用性。可以在程序中直接忽略掉,如 signal(SIGPIPE, SIG_IGN)。

2.TIME_WAIT 状态对 服务器的影响

应尽可能避免在服务端出现TIME_WAIT状态。如果服务器主动断开连接(先于client调用close),服务端就会进入TIME_WAIT状态,内核会hold住一些资源,大大降低服务器的并发能力。解决方法:协议设计上,应该让客户端主动断开连接,这样就可以把TIME_WAIT状态分散到大量的客户端。如果客户端不活跃了,一些恶意的客户端不断开连接,这样就会占用服务器端的连接资源。所以服务端也要有机制来踢掉不活跃的连接。

3.新的accept4系统调用

多了flags参数,可以设置以下两个标志:

 int accept4(int sockfd, struct sockaddr *addr, socklen_t *addrlen, int flags);

SOCK_NONBLOCK   Set the O_NONBLOCK file status flag on the new open file description.  Using this flag saves  extra  calls to fcntl(2) to achieve the same result.

 SOCK_CLOEXEC    Set  the close-on-exec (FD_CLOEXEC) flag on the new file descriptor.  See the description of the O_CLOEXEC  flag in open(2) for reasons why this may be useful.
进程被替换时,文件描述符是关闭的状态,用来设置返回的已连接套接字,也可以使用fcntl设置,但是效率稍微低一些。

4.accept(2)返回EMFILE的处理(文件描述符已经用完)

(1)调高进程文件描述符数目
(2)死等
(3)退出程序
(4)关闭监听套接字。那什么时候重新打开呢?
(5)如果是epoll模型,可以改用edge trigger。问题是如果漏掉了一次accept(2),程序再也不会收到新连接(没有状态变化)
(6)准备一个空闲的文件描述符。遇到这种情况,先关闭这个空闲文件,获得一个文件描述符名额;再accept(2)拿到socket连接的文件描述符;随后立刻close(2),这样就优雅地断开了与客户端的连接;最后重新打开空闲文件,把“坑”填上,以备再次出现这种情况时使用。

以上是关于浅谈I/O多路复用技术的主要内容,如果未能解决你的问题,请参考以下文章

浅谈网络I/O多路复用模型 select & poll & epoll

网络I/O模型--05多路复用I/O

LinuxI/O多路复用

LinuxI/O多路复用

I/O多路复用技术

Redis 和 I/O 多路复用