linux网络编程epoll内核实现代码分析

Posted arm7star

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了linux网络编程epoll内核实现代码分析相关的知识,希望对你有一定的参考价值。

1、linux内核epoll相关数据结构

1.1、epoll相关数据结构类图

1.2、关键数据结构说明

        socket_wq结构体包含一个__wait_queue_head成员,__wait_queue_head用于连接wait_queue_t链表,对于epoll而言就是连接eppoll_entry;

        eppoll_entry包含一个epitem,epitem包含一个epoll_event以及eventpoll,epoll_event也就是监听的事件以及用户态传递过来的一个额外数据,eventpoll包含等待链表以及就绪的epitem链表,阻塞线程挂在eventpoll的等待链表。

2、epoll代码实现

2.1、eppoll_entry加入到socket_wq等待链表(epoll_ctl)

        epoll_ctl系统调用为SYSC_epoll_ctl,SYSC_epoll_ctl调用ep_ptable_queue_proc创建并初始化eppoll_entry,然后加入到socket_wq。

         SYSC_epoll_ctl系统调用栈:

 2.2、阻塞任务添加到eventpoll等待链表(epoll_wait)

        epoll_wait系统调用为SyS_epoll_wait,SyS_epoll_wait调用ep_poll,ep_poll调用ep_events_available检查是否有就绪的事件,如果没有就绪的事件,则调用__add_wait_queue_exclusive将当前线程加到eventpoll的等待队列。

2.3、任务切换(schedule) 

        当前线程加到eventpoll的等待队列之后,"循环"等待事件,等待过程可能被其他操作唤醒,所以唤醒之后不一定有就绪事件,所以for循环调用ep_events_available再次检查是否有就绪事件,并检查timed_out是否超时;在任务进入睡眠之前调用signal_pending检查是否有挂起的信号要处理,如果有信号要处理,那么不能进入睡眠状态,需要先处理挂起的事件;如果没有就绪事件也没有超时,另外也没有挂起的事件,那么调用schedule_hrtimeout_range进行任务切换。

         epoll_wait内核调用栈:

         schedule_hrtimeout_range检查是否有传递超时时间,如果没有超时时间,那么不需要启动超时定时器直接调用schedule,schedule保存当前阻塞任务的上下文,然后选择下一个就绪任务执行。

         调用switch_to切换任务上下文:

        切换调用栈:

 

3、socket可读事件处理

3.1、tcp收到数据(sock_def_readable)

        tcp协议栈收到数据之后调用sock_def_readable检查是否有等待任务;sock_def_readable调用skwq_has_sleeper检查socket等待链表是否不为空(这里的等待链表不是阻塞的任务),如果等待链表不为空,调用wake_up_interruptible_sync_poll唤醒等待链表。

3.2、监听事件检查 

        等待链表的回调函数为ep_poll_callback,sock_def_readable最终调用ep_poll_callback,ep_poll_callback检查epitem的event.events是否有poll任何事件,如果没有poll任务事件,那么不需要处理。

        检查是否有监听当前的事件,如果没有监听那么也不需要处理。

         检查epitem是否已经在rdllink就绪链表里面,如果已经在就绪链表里面,不需要再次加入就是链表,如果不在,那么调用list_add_tail将epitem添加到eventpoll的就绪链表rdllist。

 3.3、唤醒阻塞任务

        将就绪的epitem添加到就绪链表之后,调用epitem检查eventpoll的等待链表是否有阻塞的任务。

         eventpoll的等待链表有阻塞任务,调用wake_up_locked唤醒eventpoll的等待链表任务。

         wake_up_locked最终调用try_to_wake_up唤醒阻塞的任务,try_to_wake_up将阻塞任务的状态更新为TASK_WAKING。

         调用task_waking_fair更新任务的时间片相关时间值,任务睡眠期间没有随系统更新。

        选择唤醒任务运行的线程,调用ttwu_queue将任务添加到目标cpu的就绪任务队列。

         任务放入就绪队列之后,下次被调度将恢复阻塞是的上下文也就是恢复到epoll_wait切换出去的地方继续执行。

4、epoll_wait返回

         sock_def_readable唤醒epoll_wait阻塞的线程之后,阻塞的线程回到epoll_wait继续执行。

4.1、阻塞任务被唤醒继续执行

        阻塞任务唤醒之后,继续执行上下文切换处的代码,schedule_hrtimeout_range内部检查是否是定时器超时导致的唤醒并返回是否超时,如果超时,则设置timed_out为1,否则timed_out为0,如果超时了,后面肯定不能继续阻塞等待事件了,如果因为别的事件导致的任务被唤醒,那么需要继续等待事件。

4.2、检查就是事件及超时

         再次检查是否有就绪事件或者是否超时,如果有就是事件或者超时,那么break退出循环,不再阻塞等待。

 4.3、将当前任务从等待队列移除

        有就绪事件或者等待超时,将当前任务从eventpoll等待队列删除并更新当前任务的状态为TASK_RUNNING。

 4.4、检查获取就绪事件链表

调用ep_events_available检查rdllist是否有就绪epitem,如果有就绪事件,调用ep_send_events获取的事件链表。

        ep_send_events调用ep_scan_ready_list将就绪事件拷贝到用户态的结果里面。

         函数调用栈:

以上是关于linux网络编程epoll内核实现代码分析的主要内容,如果未能解决你的问题,请参考以下文章

linux网络编程 - epoll边沿触发/水平触发内核实现代码分析

linux网络编程 - epoll边沿触发/水平触发内核实现代码分析

面试必问的epoll技术,从内核源码出发彻底搞懂epoll

Linux内核中网络数据包的接收-第二部分 select/poll/epoll

Linux内核笔记:epoll实现原理

epoll的使用