通信模型socket

Posted djzny

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了通信模型socket相关的知识,希望对你有一定的参考价值。

I/O的概念
操作系统的分为socket的I/O还有用户界面的输入输出,一般一个输入操作分为两个不同的阶段,1)等待数据准备好;2)从内核向进程复制数据
从理论上来讲,阻塞I/O、非阻塞I/O、复用I/O、信号驱动I/O都是同步IO模型,异步I/O就是异步IO,同步I/O向应用程序通知的是I/O就绪事件,异步I/O向应用程序通知的是I/O完成事件。
同步和异步:都是针对应用程序和操作系统之间交互而言的。同步的话,如果上层应用不主动询问操作系统的话,操作系统是不会主动通知应用程序的。异步的话,操作系统会主动通知应用程序。
阻塞:如果条件不满足的话,操作系统将应用程序挂起或者休眠,此时应用程序处于阻塞状态,只有当数据准备好之后或者数据已经从内核空间拷贝到用户空间,操作系统通知线程,此时唤醒线程。
非阻塞:如果条件不满足的话,该方法不会阻塞当前线程,而是立即返回一个标志信息(数据还没有准备好),或者timeou之后返回,此时应用线程还可以进行其他的操作。
在linux中并不存在真正的异步I/O,而是通过多路复用I/O的方式去模拟异步IO
注意:同步并不等同于阻塞,同步调用的时候,即便调用不返回,但是应用线程还处于运行状态,可以进行其他的操作,而阻塞调用时,应用线程处于阻塞状态。
操作系统5种通信模型
  1. 阻塞I/O
技术分享图片
解释:应用程序会调用一个IO函数,导致应用程序阻塞,程序会一直停留在此处,如果数据准备好了,内核会将数据拷贝至应用程序
伪代码:
{     read(socket, buffer);     process(buffer); }
特点:当处理socket数量较少的时候,使用阻塞式I/O比较合适,当socket数量较大,为每一个socket都分配一个读线程、处理线程以及同步的事件,那么对操作系统的开销会变得很大,并且不支持大数据量的socket链接
  1. 非阻塞I/O
技术分享图片
解释:非阻塞IO就是通过反复调用IO函数,如果没有数据,那么会立即返回一个错误的接口,不断去调用,不断去轮询,查看是否可以获取数据,通常来说,这种比较耗费大量的cpu时间,在数据拷贝阶段,还是阻塞的,原理就是应用程序在socket非阻塞的时候,告诉操作系统,不要在没有数据的时候把我挂起或者休眠,而是返回一个错误的信号
伪代码:
{     while(read(socket, buffer) != SUCCESS)     ;     process(buffer); }
特点:不容易使用,需要编写更多的代码,如果非阻塞IO在控制建立多个连接,在数据的收发量不均,时间不定的情况下,更具优势
  1. I/O复用模型
技术分享图片
解释:主要就是select、poll和epoll,有了I/O复用,我们可以使用select或者poll或者epoll,两次调用,两次返回,相对于阻塞I/O没有什么优越性,关键是能实现同时对多个IO端口进行监听,会使进程阻塞,可以同时阻塞多个I/O操作。
多路复用I/O模型是目前使用比较多的模型,所谓多路复用,可以理解为在一个应用线程里面可以处理多个socket连接,或者同一个端口接受来自多个客户端的请求(连接、读、写),多路复用I/O与传统的非阻塞IO的区别在于,在传统的非阻塞I/O中,是由用户去轮询socket状态,而在多路复用I/O中,由内核去轮询向select注册的socket的状态,所以多路复用IO需要操作系统的支持。
最大的优势是,在同一个线程中,可以同时处理多个socket的IO请求,在同步阻塞模型中,必须通过多线程的方式才可以达到这个目的。while循环之前,将socket添加到select监视中,然后while循环一直调用select获取被激活的socket,一旦socket可读,便调用read函数将socket中的数据读取出来。但是每个IO请求的过程还是阻塞的(在select函数上阻塞),平均时间甚至比同步阻塞IO模型还要长。
伪代码:
{     select(socket);     while(true){         sockets = select();         for(socket in sockets){             if(can_read(socket)){                 read(socket, buffer);                 process(buffer);             }         }     } }
特点:使用场景:
1)当客户处理多个描述符(通常是交互式输入和socket)时,必须使用I/O复用
2)一个客户同时处理多个socket是可能的
3)如果一个TCP服务器既要处理监听socket,又要处理已经连接的socket,一般就要使用I/O复用
4)如果一个服务器既要处理TCP,又要处理UDP,一般就要使用I/O复用
  1. 信号驱动I/O
技术分享图片
解释:首先我们允许socket进行信号驱动I/O,并且安装一个信号处理函数,进行继续运行不阻塞,当数据准备好之后,进程收到一个SIGIO信号,可以在信号处理函数中调用I/O操作函数处理数据
特点:这种模型的优势在于等待数据包到达期间,进程不会被阻塞,只需要等待信号处理函数的通知,既可以是数据准备好被处理,也可以是数据包已经准备好被读取
  1. 异步I/O模型
技术分享图片
解释:先异步调用,但是不会立即返回数据,而是等待被调用部件完成后,通过状态、通知和回调来通知调用者的输入输出操作,这个与信号驱动I/O的区别在于:1)信号驱动I/O是由内核通知我们如何启动一个I/O操作;2)而异步I/O模型是由内核通知我们I/O操作何时完成,异步I/O模型才是最理想的I/O模型,在异步I/O模型中,当用户线程发起read操作之后,立刻就可以开始去做其他的事情。而另外一方面,从内核的角度,当它收到asynchronous read之后,它会立刻返回,说明read请求已经成功发起,因此不会对用户线程产生任何block。然后内核会等待数据准备完成,然后将数据拷贝到用户线程,当这一切都完成之后,内核就会给用户线程发一个信号,告诉它read操作完成了。也就说用户线程完全不需要实际的整个I/O操作是如何进行的,只需要先发起一个请求,当接受内核返回成功的信号时表示I/O操作已经完成,可以直接去使用数据了,异步I/O模型中,由操作系统内核去等待数据就绪,copy数据到用户空间,用户线程始终没有阻塞。
特点:我们调用aio_read函数,给内核传递描述符、缓冲区指针,缓冲区大小和文件偏移,并告诉内核当整个操作完成的时候如何通知我们。该系统调用后就立即返回,而且在等待I/O完成期间,我们的进程不被阻塞
 
 
 
 
参考资料:

以上是关于通信模型socket的主要内容,如果未能解决你的问题,请参考以下文章

python之路 socketsocket server

java网络编程学习之——构建基于多线程的网络通信模型1

socket通信

Python全栈开发之10网络编程

分布式理论,架构设计Socket和IO模型

分布式理论,架构设计Socket和IO模型