epoll知识点总结

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了epoll知识点总结相关的知识,希望对你有一定的参考价值。

参考技术A epoll是linux IO多路复用的管理机制,现在是linux平台高性能网络io必要的组件。

理解内核epoll的运行原理,需要从四方面来理解:

1.epoll的数据结构。2.epoll的线程安全。

3.epoll的内核回调。4.epoll的LT与ET。

主要两个结构体 eventpoll 与 epitem。

eventpoll是每一个epoll所对应的,epitem是每一个IO所对应的事件。

数据结构图下图所示

list用来存储准备就绪的IO,内核IO准备就绪的时候,会执行epoll_event_callback的回调函数,将epitem添加到list中;当epoll_wait激活重新运行的时候,将list的epitem逐一copy到events参数中。

rbtree用来存储所有的io数据,方便快速通过io_fd查找;epoll_ctl执行EPOLL_CTL_ADD操作时,将epitem添加到rbtree中;epoll_ctl执行EPOLL_CTL_DEL操作时,将epitem从retree中删除。

     以下几个包括list操作,rbtree操作,epoll_wait的等待需要加锁。

    list使用最小粒度的spinlock锁,避免多核竞争。

    rbtree的添加使用互斥锁,

    epoll_wait采用pthread_cond_wait;

1.tcp三次握手,对端反馈ack,socket进入rcvd状态,需要将监听的socket的event置为EPOLLIN,此时标识可以进入到accept读取socket数据。

2.established状态时,收到数据,将socket的event置为EPOLLIN状态。

3.established状态时 收到fin,socket进入close_Wait,需要将socket的event设置为EPOLLIN,读取断开信息

4 .   检测到socket的send状态,cwnd >0可以发送的数据,需要将socket置为EPOLLOUT。

LT(水平触发):socket接收缓冲区不为空 有数据可读,读事件一直触发;socket发送缓冲区不满,可以继续写入数据,写事件一直触发。

ET(边缘触发):socket接收缓冲区变化时触发读事件,空的接收缓冲区刚接收到数据时触发读事件;socket发送缓冲区状态发生变化时触发写事件,即满的缓冲区刚空出空间时触发读事件。

LT的处理过程:

    accept一个连接,添加到epoll中监听EPOLLIN事件。

    当EPOLLIN事件到达时,read fd中的数据并处理,

    当需要写出数据时,把数据write到fd中;如果数据较大,无法一次性写出,那么在epoll中监听EPOLLOUT事件。

    当EPOLLOUT事件到达时,继续把数据write到fd中 ;如果数据写出完毕,那么在epoll中关闭EPOLLOUT事件。

ET的处理过程:

    accept一个连接,添加到epoll中监听EPOLLIN|EPOLLOUT事件

    当EPOLLIN事件到达时,read fd中数据并处理,read需要一直读,直到返回EAGAIN为止

    当需要写出数据时,把数据write到fd中,直到数据全部写完或者write返回EAGAIN

    当EPOLLOUT事件到达时,继续把数据write到fd中,直到数据全部写完,或者write返回EAGAIN

accept要考虑两个问题:

阻塞模式accept存在的问题:TCP连接被客户端夭折,即服务器调用accept之前,客户端主动发送RST终止连接,导致刚刚建立的连接从就绪队列中移出,如果套接口被设置成阻塞模式,服务器就一直阻塞到accept调用上,直到其他某个客户建立一个新的连接为止。在此期间,服务器 单纯阻塞在accept调用上,就绪队列上其他描述符都得不到处理。解决办法是把监听的套接口设置成非阻塞的,客户端在在服务器端调用accept之前中止某个连接时,accept调用可以立即返回-1。

ET模式accept存在的问题:

    多个连接同时到达,,服务器TCP就行连接瞬间积累多个就绪连接,由于是边缘触发模式,epoll只会通知一次,accept只处理一个连接,导致TCP就绪队列中剩下的连接都得不到处理,解决办法是,while循环 中accpet调用,处理完accept就绪队列中所有连接后再退出循环。如何知道是否处理完所有连接,accept返回-1并且error设置为errno设置为EAGAIN便是所有连接都处理完。

LT 只要event为EPOLLIN时就能不断调用回调函数

ET 如果从EPOLLOUT变化为EPOLLIN时候,就会触发。    

Linux网络编程之epoll知识点备忘

首先是关于IO多路复用的基础概念:

select,poll,epoll都是IO多路复用的机制。I/O多路复用就通过一种机制,可以监视多个描述符,一旦某个描述符就绪(一般是读就绪或者写就绪),能够通知程序进行相应的读写操作。但select,poll,epoll本质上都是同步I/O,因为他们都需要在读写事件就绪后自己负责进行读写,也就是说这个读写过程是阻塞的,而异步I/O则无需自己负责进行读写,异步I/O的实现会负责把数据从内核拷贝到用户空间。

关键要了解阻塞非阻塞、同步异步之间的关系与区别,然后对于常用的IO多路复用方法要有所了解。

epoll是Linux独有的IO多路复用技术,也是较新的方法,和传统的select/poll方法相比主要优势可以这样理解:

select的几大缺点:

(1)每次调用select,都需要把fd集合从用户态拷贝到内核态,这个开销在fd很多时会很大

(2)同时每次调用select都需要在内核遍历传递进来的所有fd,这个开销在fd很多时也很大

(3)select支持的文件描述符数量太小了,默认是1024

poll和select基本相似,只不过交换的数据结构有所差别罢了。

epoll的特色:

epoll既然是对select和poll的改进,就应该能避免上述的三个缺点。epoll提供了三个函数,epoll_create,epoll_ctl和epoll_wait,epoll_create是创建一个epoll句柄;epoll_ctl是注册要监听的事件类型;epoll_wait则是等待事件的产生。

  对于第一个缺点,epoll的解决方案在epoll_ctl函数中。每次注册新的事件到epoll句柄中时(在epoll_ctl中指定EPOLL_CTL_ADD),会把所有的fd拷贝进内核,而不是在epoll_wait的时候重复拷贝。epoll保证了每个fd在整个过程中只会拷贝一次。

  对于第二个缺点,epoll的解决方案不像select或poll一样每次都把current轮流加入fd对应的设备等待队列中,而只在epoll_ctl时把current挂一遍(这一遍必不可少)并为每个fd指定一个回调函数,当设备就绪,唤醒等待队列上的等待者时,就会调用这个回调函数,而这个回调函数会把就绪的fd加入一个就绪链表)。epoll_wait的工作实际上就是在这个就绪链表中查看有没有就绪的fd(利用schedule_timeout()实现睡一会,判断一会的效果,和select实现中的第7步是类似的)。

  对于第三个缺点,epoll没有这个限制,它所支持的FD上限是最大可以打开文件的数目,这个数字一般远大于2048,举个例子,在1GB内存的机器上大约是10万左右,具体数目可以cat /proc/sys/fs/file-max察看,一般来说这个数目和系统内存关系很大。

总结:

(1)select,poll实现需要自己不断轮询所有fd集合,直到设备就绪,期间可能要睡眠和唤醒多次交替。而epoll其实也需要调用epoll_wait不断轮询就绪链表,期间也可能多次睡眠和唤醒交替,但是它是设备就绪时,调用回调函数,把就绪fd放入就绪链表中,并唤醒在epoll_wait中进入睡眠的进程。虽然都要睡眠和交替,但是select和poll在“醒着”的时候要遍历整个fd集合,而epoll在“醒着”的时候只要判断一下就绪链表是否为空就行了,这节省了大量的CPU时间。这就是回调机制带来的性能提升。

(2)select,poll每次调用都要把fd集合从用户态往内核态拷贝一次,并且要把current往设备等待队列中挂一次,而epoll只要一次拷贝,而且把current往等待队列上挂也只挂一次(在epoll_wait的开始,注意这里的等待队列并不是设备等待队列,只是一个epoll内部定义的等待队列)。这也能节省不少的开销。

通过对于epoll进一步的了解,我个人觉得要理解epoll最关键的是需要了解以下几点:

1.和select等的比较。主要从效率,方法,监听数量等方面需要有一个比较全面的了解

2.关于epoll的三个函数需要了解用法

3.对于epoll_event这个数据结构需要有深刻了解,特别是其中的epoll_data数据,其中的union可以保存许多类型的用户数据,这为回调函数等提供了途径

最后摘抄一点代码用于提示epoll的基本使用方法:

 1 int main()
 2 {
 3   int i, maxi, listenfd, new_fd, sockfd,epfd,nfds;
 4   ssize_t n;
 5   char line[MAXLINE];
 6   socklen_t clilen;
 7   struct epoll_event ev,events[20];//ev用于注册事件,数组用于回传要处理的事件
 8   struct sockaddr_in clientaddr, serveraddr;
 9   listenfd = socket(AF_INET, SOCK_STREAM, 0);//生成socket文件描述符
10   setnonblocking(listenfd);//把socket设置为非阻塞方式
11   epfd=epoll_create(256);//生成用于处理accept的epoll专用的文件描述符
12   ev.data.fd=listenfd;//设置与要处理的事件相关的文件描述符
13   ev.events=EPOLLIN|EPOLLET;//设置要处理的事件类型
14   epoll_ctl(epfd,EPOLL_CTL_ADD,listenfd,&ev);//注册epoll事件
15     //设置服务器端地址信息
16   bzero(&serveraddr, sizeof(serveraddr));
17   serveraddr.sin_family = AF_INET;
18   char *local_addr= LOCAL_ADDR;
19   inet_aton(local_addr,&(serveraddr.sin_addr));
20   serveraddr.sin_port=htons(SERV_PORT);
21   bind(listenfd,(sockaddr *)&serveraddr, sizeof(serveraddr));//绑定socket连接
22   listen(listenfd, LISTENQ);//监听
23   maxi = 0;
24   for ( ; ; )
25       {
26          /* epoll_wait:等待epoll事件的发生,并将发生的sokct fd和事件类型放入到events数组中;
27           * nfds:为发生的事件的个数。
28           * 注:
29          */
30       nfds=epoll_wait(epfd,events,20,500);
31       //处理所发生的所有事件
32       for(i=0;i<nfds;++i)
33       {
34           if(events[i].data.fd==listenfd)//事件发生在listenfd上
35           {
36                /* 获取发生事件端口信息,存于clientaddr中;
37                *new_fd:返回的新的socket描述符,用它来对该事件进行recv/send操作*/
38               new_fd = accept(listenfd,(struct sockaddr *)&clientaddr, &clilen);
39               if(new_fd<0)
40                    {
41                   perror("new_fd<0");
42                   exit(1);
43               }
44               setnonblocking(new_fd);
45               char *str = inet_ntoa(clientaddr.sin_addr);
46               ev.data.fd=new_fd;//设置用于读操作的文件描述符
47               ev.events=EPOLLIN|EPOLLET;//设置用于注测的读操作事件
48               epoll_ctl(epfd,,,&ev);//注册ev
49           }
50           else if(events[i].events&EPOLLIN)
51           {
52               if ( (sockfd = events[i].data.fd) < 0)
53                        continue;
54               if ( (n = read(sockfd, line, MAXLINE)) < 0)
55                    {
56                   if (errno == ECONNRESET)
57                       {
58                       close(sockfd);
59                       events[i].data.fd = -1;
60                   }
61                       else
62                       std::cout<<"readline error"<<std::endl;
63               }
64                   else if (n == 0)
65                   {
66                   close(sockfd);
67                   events[i].data.fd = -1;
68              }
69              ev.data.fd=sockfd;//设置用于写操作的文件描述符
70              ev.events=EPOLLOUT|EPOLLET;//设置用于注测的写操作事件
71              epoll_ctl(epfd,,sockfd,&ev);//修改sockfd上要处理的事件为EPOLLOUT
72         }
73        else if(events[i].events&EPOLLOUT)
74        {
75            sockfd = events[i].data.fd;
76             write(sockfd, line, n);
77             ev.data.fd=sockfd;//设置用于读操作的文件描述符
78             ev.events=EPOLLIN|EPOLLET;//设置用于注测的读操作事件
79             epoll_ctl(epfd,,sockfd,&ev);//修改sockfd上要处理的事件为EPOLIN
80        }
81    }
82  }
83 }

 

参考:http://blog.51cto.com/7666425/1261446

      http://www.cnblogs.com/Anker/p/3265058.html

以上是关于epoll知识点总结的主要内容,如果未能解决你的问题,请参考以下文章

IO多路复用之epoll总结

Epoll 到底是什么?“不” 简单的网络I/O模型?

Epoll 到底是什么?“不” 简单的网络I/O模型?

IO多路复用之epoll总结

IO多路复用之epoll总结

ING转载epoll总结系列