分布式系统的核心：进程间的通信，常用网络I/O模型

Posted 2021-07-14 king哥Java架构

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了分布式系统的核心：进程间的通信，常用网络I/O模型相关的知识，希望对你有一定的参考价值。

常用网络I/O模型

I/O操作主要是由操作系统来完成的。根据UNIX的设计，共有5种类型的I/O模型。

阻塞I/O。
非阻塞I/O。
I/O复用（select和poll）。
信号驱动I/O（SIGIO）。
异步I/O（Posix.1的aio_系列函数）。

上述模型或多或少地影响了其他操作系统的I/O模型设计。

阻塞I/O模型

阻塞I/O模型是指，当请求无法立即完成则保持阻塞状态。主要分为以下两个阶段。

阶段1：等待数据就绪。网络I/O的情况就是等待远端数据陆续抵达；磁盘I/O的情况就是等待磁盘数据从磁盘上读取到内核态内存中。
阶段2：数据复制。出于系统安全，用户态的程序没有权限直接读取内核态内存，因此内核负责把内核态内存中的数据复制一份到用户态内存中。

阻塞I/O模型如下图所示。

分布式系统的核心：进程间的通信，常用网络I/O模型图3-5 阻塞I/O模型

本节中将recvfrom函数视为系统调用。一般recvfrom实现都有一个从应用程序进程运行到内核中运行的切换，再返回到应用进程的切换。

图3-5中，进程阻塞的整段时间是指从调用recvfrom开始到它返回的这段时间，当进程返回成功指示时，应用进程开始处理数据报。

非阻塞I/O模型

非阻塞I/O模型处理流程如下。

Socket设置为NONBLOCK（非阻塞）就是告诉内核，当所请求的I/O操作无法完成时，不要将进程“睡眠”，而是立刻返回一个错误码（EWOULDBLOCK），这样请求就不会阻塞。
I/O操作函数将不断地测试数据是否已经准备好，如果没有准备好，继续测试，直到数据准备好为止。整个I/O请求的过程中，虽然用户线程每次发起I/O请求后可以立即返回，但是为了等到数据，仍需要不断地轮询、重复请求，这是对CPU时间的极大浪费。
数据准备好了，从内核复制到用户空间。

非阻塞I/O模型如下图所示。

分布式系统的核心：进程间的通信，常用网络I/O模型图3-6 非阻塞I/O模型

一般很少直接使用这种模型，而是在其他I/O模型中使用非阻塞I/O这一特性。这种方式对单个I/O请求的意义不大，但给I/O复用“铺平了道路”。

I/O复用模型

I/O复用会用到select或者poll函数，在这两个函数的某一个上阻塞，而不是阻塞于真正的I/O系统调用。函数也会使进程阻塞，但是和阻塞I/O所不同的是，这两个函数可以同时阻塞多个I/O操作。而且可以同时对多个读操作、多个写操作的I/O函数进行检测，直到有数据可读或可写时，才真正调用I/O操作函数。

如果你觉得自己学习效率低，缺乏正确的指导，可以加入资源丰富，学习氛围浓厚的技术圈一起学习交流吧！
[Java架构群]
群内有许多来自一线的技术大牛，也有在小厂或外包公司奋斗的码农，我们致力打造一个平等，高质量的JAVA交流圈子，不一定能短期就让每个人的技术突飞猛进，但从长远来说，眼光，格局，长远发展的方向才是最重要的。

I/O复用模型如图3-7所示。从流程上来看，使用select函数进行I/O请求和同步阻塞模型没有太大的区别，甚至还多了监视Socket，以及调用select函数的额外操作，效率更差。但是，使用select最大的优势是用户可以在一个线程内同时处理多个Socket的I/O请求。用户可以注册多个Socket，然后不断地调用select来读取被激活的Socket，即可达到在同一个线程内同时处理多个I/O请求的目的。而在同步阻塞模型中，必须通过多线程的方式才能达到这个目的。

I/O复用模型使用Reactor设计模式实现了这一机制。

分布式系统的核心：进程间的通信，常用网络I/O模型图3-7 I/O复用模型

调用select/poll函数由一个用户态线程负责轮询多个Socket，直到某个阶段1的数据就绪，再通知实际的用户态线程执行阶段2的复制操作。通过一个专职的用户态线程执行非阻塞I/O轮询，模拟实现了阶段1的异步化。

在Java领域，著名的网络编程框架Netty就是采用了Reactor模型。

信号驱动I/O模型

首先，我们允许Socket进行信号驱动I/O，并通过调用sigaction来安装一个信号处理函数，进程继续运行并不阻塞。当数据准备好时，进程会收到一个SIGIO信号，可以在信号处理函数中调用recvfrom来读取数据报，并通知主循环数据已准备好被处理，也可以通知主循环，让它来读取数据报。

信号驱动I/O（SIGIO）模型如下图所示。
在这里插入图片描述

该模型的优点是，当等待数据报到达时，可以不阻塞。主循环可以继续执行，只是等待信号处理程序的通知：或者数据已准备好被处理，或者数据报已准备好可读。

异步I/O模型

异步I/O是POSIX规范定义的。通常，这些函数会通知内核来启动操作并在整个操作（包括从内核复制数据到我们的缓存中）完成时通知我们。

该模型与信号驱动I/O（SIGIO）模型的不同点在于，驱动I/O（SIGIO）模型告诉我们I/O操作何时可以启动，而异步I/O模型告诉我们I/O操作何时完成。

调用aio_read函数，告诉内核传递描述字、缓存区指针、缓存区大小、文件偏移，然后立即返回，我们的进程不阻塞直到I/O操作完成。

当内核将数据复制到缓存区后，才会生成一个信号，来通知应用程序。

异步I/O模型如下图所示。

分布式系统的核心：进程间的通信，常用网络I/O模型图3-9 异步I/O模型

异步I/O模型使用Proactor设计模式实现了这一机制。异步I/O模型会告知内核，当整个过程（包括阶段1和阶段2）全部完成时，通知应用程序来读数据。

几种I/O模型的比较

前4种模型的区别是阶段1不相同，阶段2基本相同，都是将数据从内核复制到调用者的缓存区。而异步I/O的两个阶段都不同于前4个模型。5种I/O模型的比较如图3-10所示。

分布式系统的核心：进程间的通信，常用网络I/O模型图3-10 5种I/O模型的比较

同步I/O操作引起请求进程阻塞，直到I/O操作完成。异步I/O操作不引起请求进程阻塞。阻塞I/O模型、非阻塞I/O模型、I/O复用模型和信号驱动I/O模型都是同步I/O模型，而异步I/O模型才是真正的异步I/O。

写在最后

最近我整理了整套《JAVA核心知识点总结》，说实话，作为一名 Java 程序员，不论你需不需要面试都应该好好看下这份资料。拿到手总是不亏的~我的不少粉丝也因此拿到腾讯字节快手offer，点击下面图片↓直达领取

好了，以上就是本文的全部内容了，如果觉得有收获，记得三连，我们下期再见。

以上是关于分布式系统的核心：进程间的通信，常用网络I/O模型的主要内容，如果未能解决你的问题，请参考以下文章

关于 Linux 网络，你必须知道这些

八网络服务I/O模型

不止面试题，笔记源码统统都有，Java核心知识点

Linux系统I/O模型详解

9.0.网络编程_IO 通信模型

Linux 网络I/O模型