Linux系统中的I/O
Posted 清水寺扫地僧
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux系统中的I/O相关的知识,希望对你有一定的参考价值。
文章目录
1. I/O是什么
I/O:在计算机中指Input/Output,就是输入和输出。由于程序和运行时数据是在内存中驻留,由CPU来执行,涉及到数据交换的地方,通常是磁盘、网卡等,就需要I/O接口。
2. 阻塞(Block)和非阻塞(Non-Block)I/O:均是同步I/O
2.1 阻塞I/O:一次请求I/O直至完成
- 当用户线程发起I/O请求后,会进行系统调用(system call)来让内核(Kernel)进行I/O操作(系统调用是用户空间和内核空间的一个通道);
- 此时用户线程阻塞,等待内核将数据准备好;
- 内核将数据准备好后会将数据从内核空间拷贝到用户空间,并返回给用户线程结束阻塞。
2.2 非阻塞I/O:多次请求I/O直至完成
- 由用户线程发起I/O请求,进行系统调用来让内核进行I/O操作;
- 此时如果内核没有准备好数据则会直接返回error,并不会阻塞用户线程,用户线程可以重复发起I/O请求;
- 当用户线程发起请求并且内核已经将数据准备好后,会将数据从内核空间拷贝到用户空间(这个过程是需要阻塞用户线程的),返回给用户。
2.3 区别
阻塞I/O: 用户线程发起I/O操作,紧接着由内核线程来执行I/O操作,在阻塞I/O中内核线程并不会立即返回而是等待数据拷贝到内存空间时才返回,在此期间用户线程处于阻塞状态;
下图所示,使用recv的默认参数一直等数据直到拷贝到用户空间,这段时间内进程始终阻塞。这一过程就可以看成是使用了阻塞I/O模型,很显然,这种I/O模型是同步的。
非阻塞I/O: 与阻塞IO不同,内核线程在执行I/O操作后立即返回,若结果为error则用户线程可以重新发起请求而不会被阻塞,一旦内核将数据准备好了且用户线程发起了I/O请求那么将数据拷贝到用户空间。
下图所示,recv不管有没有获取到数据都将返回,如果没有数据那么一段时间后再调用recv看看,如此循环。这就是非阻塞I/O模型。但是它只有是检查无数据的时候是非阻塞的,在数据到达的时候依然要等待复制数据到用户空间,因此它还是同步I/O。
3. 同步(Synchronous)和异步(Asynchronous)I/O
3.1 同步I/O:阻塞(等待完成)和非阻塞(问询完成)都是同步I/O
同步I/O的关键在于在真正读取数据的时候用户线程是否被阻塞。非阻塞I/O虽然在用户发起请求时会立即返回,但是当内核准备好数据之后,仍然需要用户线程发起请求才会将数据从内核空间拷贝到用户空间,因此非阻塞I/O属于同步I/O。
同步I/O分为阻塞和不阻塞的I/O,不阻塞的话要指定X_NONBLOCK选项,返回时ERRNO为EAGAIN或EWOULDBLOCK,则需再次调用I/O/read,即若是I/O没有进行完,则会进入忙等待的状态。也即 I/O到达时,由用户将I/O内容从内核中拉出至用户空间缓冲区当中。
3.2 异步I/O:I/O发起则不需向内核确认I/O内容准备好
用户线程发起IO操作后,可以立即去做其他事情,另一方面,对于内核线程当它收到异步数据之后会立即返回,不会对用户线程造成阻塞。当内核将数据准备好之后会将数据从内核空间拷贝到用户空间,内核会发送给用户一个信号通知用户IO操作已完成。
异步I/O操作是不阻塞的,和其它的处理可以重叠进行,即计算和I/O重叠,充分利用了DMA特性,可以不经过CPU。
aio_read中指定用户空间缓冲区,用来接收内核所接收的I/O内容,同时还指定了signal hander/callbacks。同时,I/O完成后,内核直接将I/O内容推至指定的用户空间缓冲区。
3.3 区别
异步IO与非阻塞IO的区别在于,当用户线程发起一次IO操作不需要在此去确认内核是否准备好数据。异步IO中内核准备好数据后会将数据从内核空间自动拷贝到用户空间。
4. 总结及归纳
用户进程发起请求从内核中获取数据那么这时候有两种情况:
(一)操作系统还没有准备好数据,那么这时候怎么办,有两种方法:
- 1.1 让用于进程等着(这种情况就是阻塞);
- 1.2 如果没有数据就返回一个ERROR,不需要用户进程干等(这种情况就是非阻塞);
(二)过了一会儿操作系统准备好数据了,这时候又有两种方法:
- 2.1 啥也不管,等着用户进程再次来请求才把数据给它(这种情况就是同步);
- 2.2 负责到底,数据准备好,直接给到用户进程,并且还发出一个信号,告诉用户进程数据已经准备好(这种情况就是异步);
以上是关于Linux系统中的I/O的主要内容,如果未能解决你的问题,请参考以下文章
Linux 内核Linux 操作系统结构 ( Linux 内核在操作系统中的层级 | Linux 内核子系统及关系 | 进程调度 | 内存管理 | 虚拟文件系统 | 网络管理 | 进程间通信 )