Linux文件的I/O操作

Posted 周先森

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux文件的I/O操作相关的知识,希望对你有一定的参考价值。

C标准函数与系统函数的区别

 

标准函数printf调用应用层api,然后应用层api调用内核层api,再通过内核层api调用硬件设备

 

一个pirntf打印helloworld那么sys_write需要输出几次到显示设备?

Printf把helloworld送到缓冲区,然后由"文件表述符一次执行一个字符"一共10次

然后送到缓冲区,再有sys_write一次输出到显示设备

I/O缓冲区

每一个FILE文件流都有一个缓冲区buffer,默认大小8192Byte。

文件描述符

一个进程默认打开3个文件描述符

STDIN_FILENO 0

STDOUT_FILENO 1

STDERR_FILENO 2

Open/close

新打开文件返回文件描述符表中未使用的最小文件描述符。

open函数可以打开或创建一个文件。

#include <sys/types.h>

#include <sys/stat.h>

#include <fcntl.h>

int open(const char *pathname, int flags);

int open(const char *pathname, int flags, mode_t mode);

返回值:成功返回新分配的文件描述符,出错返回-1并设置errno

int open(const char *pathname, int flags, ...);

 

一部分man 2 open 参考文档

open(2)的Man Page:

* O_APPEND 表示追加。如果文件已有内容,这次打开文件所写的数据附加到文件的末尾

而不覆盖原来的内容。

* O_CREAT 若此文件不存在则创建它。使用此选项时需要提供第三个参数mode,表示该

文件的访问权限。

* O_EXCL 如果同时指定了O_CREAT,并且文件已存在,则出错返回。

* O_TRUNC 如果文件已存在,并且以只写或可读可写方式打开,则将其长度截断(Truncate)

为0字节。

* O_NONBLOCK 对于设备文件,以O_NONBLOCK方式打开可以做非阻塞I/O(Nonblock I/

O),非阻塞I/O在下一节详细讲解。

注意open函数与C标准I/O库的fopen函数有些细微的区别:

以可写的方式fopen一个文件时,如果文件不存在会自动创建,而open一个文件时必须

明确指定O_CREAT才会创建文件,否则文件不存在就出错返回。

以w或w+方式fopen一个文件时,如果文件已存在就截断为0字节,而open一个文件时必

须明确指定O_TRUNC才会截断文件,否则直接在原来的数据上改写。

第三个参数mode指定文件权限,可以用八进制数表示,比如0644表示-rw-r-r–,也可

以用S_IRUSR、S_IWUSR等宏定义按位或起来表示,详见open(2)的Man Page。要注意的是,

文件权限由open的mode参数和当前进程的umask掩码共同决定。

O_CREAT

使用o_CREAT创建一个文件

python@ubuntu:~/linuxC$ cat open.c

#include <sys/types.h>

#include <sys/stat.h>

#include <fcntl.h>

#include <stdio.h>

 

int main(void)

{

int fd;

 

fd=open("abc",O_CREAT,0777); //创建文件后的权限

printf("fd=%d",fd);

 

return 0;

 

}

python@ubuntu:~/linuxC$ gcc open.c -o app

python@ubuntu:~/linuxC$ ./app

python@ubuntu:~/linuxC$ ls -l

总用量 16

-rwxrwxr-x 1 python python 0 1月 19 18:39 abc

-rwxrwxr-x 1 python python 8656 1月 19 18:40 app

-rw-rw-r-- 1 python python 197 1月 19 18:39 open.c

 

 

使用

argc

python@ubuntu:~/linuxC$ cat createFile.c

#include<stdio.h>

#include <sys/types.h>

#include <sys/stat.h>

#include <fcntl.h>

#include <stdio.h>

#include <stdlib.h>

//argc传递执行命令的个数 argv记录命令

int main(int argc,char *argv[])

{

int fd;

printf("%d",argc);

if (argc<2){

printf("./app fileName\\n");

exit(1);//在任何函数中调用程序结束或程序退出

}

fd=open(argv[1],O_CREAT,0644);

printf("fd=%d\\n",fd);

 

return 0;//调用是函数返回,在main是程序结束

 

}

python@ubuntu:~/linuxC$ gcc createFile.c -o app

python@ubuntu:~/linuxC$ ./app linux

2fd=3

python@ubuntu:~/linuxC$ ls -l

总用量 20

-rw-r--r-- 1 python python 0 1月 19 18:50 2

-rwxrwxr-x 1 python python 0 1月 19 18:39 abc

-rwxrwxr-x 1 python python 8760 1月 19 18:53 app

-rw-rw-r-- 1 python python 445 1月 19 18:50 createFile.c

-rw-r--r-- 1 python python 0 1月 19 18:53 linux

-rw-rw-r-- 1 python python 197 1月 19 18:39 open.c

-rw-r--r-- 1 python python 0 1月 19 18:53 wer

 

O_RDWR

读写文件

python@ubuntu:~/linuxC$ cat writeFile.c

#include <sys/types.h>

#include <sys/stat.h>

#include <fcntl.h>

#include <stdlib.h>

#include <stdio.h>

#include <string.h>

#include <unistd.h>

 

int main(int argc,char *argv[])

{

int fd;

char buf[1024]="helloworld";

if (argc < 2){

printf("./app fileName\\n");

exit(1);

}

fd = open(argv[1],O_CREAT | O_RDWR,0644);

write(fd, buf, strlen(buf));

printf("fd=%d\\n",fd);

 

close(fd);

 

return 0;

}

python@ubuntu:~/linuxC$ gcc writeFile.c -o app

python@ubuntu:~/linuxC$ ./app linux

fd=3

python@ubuntu:~/linuxC$ cat linux

helloworldpython@ubuntu:~/linuxC$

O_EXCL

并且文件已存在,则出错返回

python@ubuntu:~/linuxC$ cat writeFile.c

#include <sys/types.h>

#include <sys/stat.h>

#include <fcntl.h>

#include <stdlib.h>

#include <stdio.h>

#include <string.h>

#include <unistd.h>

 

int main(int argc,char *argv[])

{

int fd;

char buf[1024]="helloworld";

if (argc < 2){

printf("./app fileName\\n");

exit(1);

}

fd = open(argv[1],O_CREAT | O_RDWR | O_EXCL ,0644);

write(fd, buf, strlen(buf));

printf("fd=%d\\n",fd);

 

close(fd);

 

return 0;

}

python@ubuntu:~/linuxC$ gcc writeFile.c -o app

//因为文件中有了,所有在创建的是哈报错了

python@ubuntu:~/linuxC$ ./app linux

fd=-1

python@ubuntu:~/linuxC$ ./app test

fd=3

python@ubuntu:~/linuxC$ ls -l

总用量 32

-rw-r--r-- 1 python python 0 1月 19 18:50 2

-rwxrwxr-x 1 python python 0 1月 19 18:39 abc

-rwxrwxr-x 1 python python 8976 1月 19 19:10 app

-rw-rw-r-- 1 python python 445 1月 19 18:50 createFile.c

-rw-r--r-- 1 python python 10 1月 19 19:01 linux

-rw-rw-r-- 1 python python 197 1月 19 18:39 open.c

-rw-r--r-- 1 python python 10 1月 19 19:10 test

-rw-r--r-- 1 python python 0 1月 19 18:53 wer

-rw-rw-r-- 1 python python 450 1月 19 19:10 writeFile.c

O_APPEND

#include <sys/types.h>

#include <sys/stat.h>

#include <fcntl.h>

#include <stdlib.h>

#include <stdio.h>

#include <string.h>

#include <unistd.h>

 

int main(int argc,char *argv[])

{

int fd;

char buf[1024]="helloworld";

if (argc < 2){

printf("./app fileName\\n");

exit(1);

}

fd = open(argv[1], O_RDWR | O_APPEND ,0644);

write(fd, buf, strlen(buf));

printf("fd=%d\\n",fd);

 

close(fd);

 

return 0;

}

python@ubuntu:~/linuxC$ gcc writeFile.c -o app

python@ubuntu:~/linuxC$ ./app linux //追家内容

fd=3

python@ubuntu:~/linuxC$ cat linux

helloworldhelloworldpython@ubuntu:~/linuxC$ ./app linux

fd=3

python@ubuntu:~/linuxC$ cat linux

helloworldhelloworldhelloworldpython@ubuntu:~/linuxC$

 

umaks权限

python@ubuntu:~/linuxC$ cat writeFile.c

#include <sys/types.h>

#include <sys/stat.h>

#include <fcntl.h>

#include <stdlib.h>

#include <stdio.h>

#include <string.h>

#include <unistd.h>

 

umask(0);//默认设置为0 在当前进程

 

int main(int argc,char *argv[])

{

int fd;

char buf[1024]="helloworld";

if (argc < 2){

printf("./app fileName\\n");

exit(1);

}

fd = open(argv[1], O_RDWR | O_APPEND ,0777); //这样就不会执行当前环境先的umask所以也就能设置这个文件权限777了

write(fd, buf, strlen(buf));

printf("fd=%d\\n",fd);

 

close(fd);

 

return 0;

}

 

 

 

 

 

实验

输入一个文件拷贝内容到另外的一个文件中

python@ubuntu:~/linuxC$ cat copyFile.c

#include <stdio.h>

#include <stdlib.h>

#include <sys/types.h>

#include <sys/stat.h>

#include <fcntl.h>

#include <unistd.h>

 

#define SIZE 8192

int main(int argc,char *argv[])

{

char buf[SIZE];

int fd_src,fd_dest,len;

if(argc<3)

{

printf("./mycp src dest\\n");

exit(1);

}

 

fd_src = open(argv[1],O_RDONLY);

fd_dest = open (argv[2],O_CREAT | O_WRONLY | O_TRUNC , 0633);

/*

* 成功返回读取字节数

* 督导文件末尾返回0

* 读取失败返回-1

*/

while((len=read(fd_src,buf,sizeof(buf)))>0)

{

write(fd_dest,buf,len);

}

close(fd_src);

close(fd_dest);

return 0;

 

}

 

python@ubuntu:~/linuxC$ gcc copyFile.c -o app

python@ubuntu:~/linuxC$ ./app linux test

python@ubuntu:~/linuxC$ cat test

helloworldhelloworldhelloworld

 

阻塞和非阻塞

读常规文件是不会阻塞的,不管读多少字节,read一定会在有限的时间内返回。从终端

设备或网络读则不一定,如果从终端输入的数据没有换行符,调用read读终端设备就会阻

塞,如果网络上没有接收到数据包,调用read从网络读就会阻塞,至于会阻塞多长时间也是

不确定的,如果一直没有数据到达就一直阻塞在那里。同样,写常规文件是不会阻塞的,而

向终端设备或网络写则不一定。

现在明确一下阻塞(Block)这个概念。当进程调用一个阻塞的系统函数时,该进程被

置于睡眠(Sleep)状态,这时内核调度其它进程运行,直到该进程等待的事件发生了(比

如网络上接收到数据包,或者调用sleep指定的睡眠时间到了)它才有可能继续运行。与睡

眠状态相对的是运行(Running)状态,在Linux内核中,处于运行状态的进程分为两种情

况:

正在被调度执行。CPU处于该进程的上下文环境中,程序计数器(eip)里保存着该进程

的指令地址,通用寄存器里保存着该进程运算过程的中间结果,正在执行该进程的指令,正

在读写该进程的地址空间。

就绪状态。该进程不需要等待什么事件发生,随时都可以执行,但CPU暂时还在执行另

一个进程,所以该进程在一个就绪队列中等待被内核调度。系统中可能同时有多个就绪的进

程,那么该调度谁执行呢?内核的调度算法是基于优先级和时间片的,而且会根据每个进程

的运行情况动态调整它的优先级和时间片,让每个进程都能比较公平地得到机会执行,同时

要兼顾用户体验,不能让和用户交互的进程响应太慢。

下面这个小程序从终端读数据再写回终端。

阻塞读取终端

python@ubuntu:~/linuxC$ cat terminal.c

#include<stdio.h>

#include<stdlib.h>

#include<unistd.h> //POSIX标准定义的unix类系统定义符号常量的头文件, 包含了许多UNIX系统服务的函数原型,

 

int main()

{

char buf[10];

int n;

n=read(STDIN_FILENO,buf,10); //标准等待输入

if (n < 0 )

{

perror("read STDIN_FILENO");

exit(1);

}

write(STDOUT_FILENO,buf,n); //标准输出

 

return 0;

 

}

python@ubuntu:~/linuxC$ gcc terminal.c -o app

python@ubuntu:~/linuxC$ ./app

linux

linux

 

非阻塞读终端

#include <unistd.h>

#include <fcntl.h>

#include <errno.h>

#include <string.h>

#include <stdlib.h>

#define MSG_TRY "try again\\n"

int main(void)

{

char buf[10];

int fd, n;

fd = open("/dev/tty", O_RDONLY|O_NONBLOCK);

if(fd<0) {

perror("open /dev/tty");

exit(1);

}

tryagain:

n = read(fd, buf, 10);

if (n < 0) {

if (errno == EAGAIN) {

sleep(1); //没有文件那么休眠1秒,打印一句话,接着在来读取一次

write(STDOUT_FILENO, MSG_TRY, strlen(MSG_TRY));

goto tryagain;

}

perror("read /dev/tty");

exit(1);

}write(STDOUT_FILENO, buf, n);

close(fd);

return 0;

}

非阻塞读终端和等待超时

#include <unistd.h>

#include <fcntl.h>

#include <errno.h>

#include <string.h>

#include <stdlib.h>

#define MSG_TRY "try again\\n"

#define MSG_TIMEOUT "timeout\\n"

int main(void)

{

char buf[10];

int fd, n, i;

fd = open("/dev/tty", O_RDONLY|O_NONBLOCK);

if(fd<0) {

perror("open /dev/tty");

exit(1);

}

for(i=0; i<5; i++) {

n = read(fd, buf, 10);

if(n>=0)

break;

if(errno!=EAGAIN) { //没有文件就是EAGAIN

perror("read /dev/tty");

exit(1);

}

sleep(1);

write(STDOUT_FILENO, MSG_TRY, strlen(MSG_TRY));

}

if(i==5)

write(STDOUT_FILENO, MSG_TIMEOUT, strlen(MSG_TIMEOUT));

else

write(STDOUT_FILENO, buf, n);

close(fd);

return 0;

}

 

 

 

errno标识

The <errno.h> header file defines the integer variable errno, which is set by

system calls and some library functions in the event of an error to indicate

what went wrong. Its value is significant only when the return value of the

call indicated an error (i.e., -1 from most system calls; -1 or NULL from most

library functions); a function that succeeds is allowed to change errno.

 

Valid error numbers are all nonzero; errno is never set to zero by any system

call or library function.

 

errno 会从系统定义的错误文件中,匹配到一个值,并且打印对应错误值的消息

 

 

python@ubuntu:~/linuxC$ cat errno.c

#include <sys/stat.h>//文件的属性

#include <unistd.h>// POSIX 操作系统 API 的访问功能的头文件的名称

#include <sys/types.h> //基本系统数据类型

#include <fcntl.h>//定义了很多宏和open

#include <stdio.h>

#include <errno.h> //错误的标志

 

int main()

{

int fd=open("abc",O_WRONLY);

if ( fd < 0)

{

printf("errno=%d\\n",errno);

perror("main open"); //错误标志前面的提示

}

printf("fd=%d\\n",fd);

return 0;

}

python@ubuntu:~/linuxC$ gcc errno.c -o app

python@ubuntu:~/linuxC$ ./app

errno=2 //当前的标准为2

main open: No such file or directory

fd=-1

 

系统默认的标志

python@ubuntu:~/linuxC$ cat /usr/include/asm-generic/errno-base.h

#ifndef _ASM_GENERIC_ERRNO_BASE_H

#define _ASM_GENERIC_ERRNO_BASE_H

 

#define    EPERM         1    /* Operation not permitted */

#define    ENOENT         2    /* No such file or directory */ //这是刚刚上面的那一条

#define    ESRCH         3    /* No such process */

#define    EINTR         4    /* Interrupted system call */

#define    EIO         5    /* I/O error */

#define    ENXIO         6    /* No such device or address */

#define    E2BIG         7    /* Argument list too long */

#define    ENOEXEC         8    /* Exec format error */

#define    EBADF         9    /* Bad file number */

#define    ECHILD        10    /* No child processes */

#define    EAGAIN        11    /* Try again */

#define    ENOMEM        12    /* Out of memory */

#define    EACCES        13    /* Permission denied */

#define    EFAULT        14    /* Bad address */

#define    ENOTBLK        15    /* Block device required */

#define    EBUSY        16    /* Device or resource busy */

#define    EEXIST        17    /* File exists */

#define    EXDEV        18    /* Cross-device link */

#define    ENODEV        19    /* No such device */

#define    ENOTDIR        20    /* Not a directory */

#define    EISDIR        21    /* Is a directory */

#define    EINVAL        22    /* Invalid argument */

#define    ENFILE        23    /* File table overflow */

#define    EMFILE        24    /* Too many open files */

#define    ENOTTY        25    /* Not a typewriter */

#define    ETXTBSY        26    /* Text file busy */

#define    EFBIG        27    /* File too large */

#define    ENOSPC        28    /* No space left on device */

#define    ESPIPE        29    /* Illegal seek */

#define    EROFS        30    /* Read-only file system */

#define    EMLINK        31    /* Too many links */

#define    EPIPE        32    /* Broken pipe */

#define    EDOM        33    /* Math argument out of domain of func */

#define    ERANGE        34    /* Math result not representable */

 

#endif

 

 

strerron

python@ubuntu:~/linuxC$ cat errno.c

#include <sys/stat.h>//文件的属性

#include <unistd.h>// POSIX 操作系统 API 的访问功能的头文件的名称

#include <sys/types.h> //基本系统数据类型

#include <fcntl.h>//定义了很多宏和open

#include <stdio.h>

#include <errno.h> //错误的标志

#include <string.h>

 

int main()

{

int fd=open("abc",O_WRONLY);

if ( fd < 0)

{

printf("errno=%d\\n",errno);

// perror("main open");

printf("main open %s\\n",strerror(errno));

}

printf("fd=%d\\n",fd);

return 0;

}

python@ubuntu:~/linuxC$ gcc errno.c -o app

python@ubuntu:~/linuxC$ ./app

errno=2

main open No such file or directory //跟error差不多只是,没有:而已

fd=-1

 

lseek

每个打开的文件都记录着当前读写位置,打开文件时读写位置是0,表示文件开头,通

常读写多少个字节就会将读写位置往后移多少个字节。但是有一个例外,如果以O_APPEND方

式打开,每次写操作都会在文件末尾追加数据,然后将读写位置移到新的文件末尾。lseek

和标准I/O库的fseek函数类似,可以移动当前读写位置(或者叫偏移量)。

SYNOPSIS

#include <sys/types.h>

#include <unistd.h>

 

off_t lseek(int fd, off_t offset, int whence);

 

DESCRIPTION

The lseek() function repositions the offset of the open file associated with

the file descriptor fd to the argument offset according to the directive whence

as follows:

 

SEEK_SET

The offset is set to offset bytes.

 

SEEK_CUR

The offset is set to its current location plus offset bytes.

 

SEEK_END

The offset is set to the size of the file plus offset bytes.

 

 

 

 

设置偏移量写


python@ubuntu:~/linuxC$ cat lseek.c

#include <sys/stat.h>//文件的属性

#include <unistd.h>// POSIX 操作系统 API 的访问功能的头文件的名称

#include <sys/types.h> //基本系统数据类型

#include <fcntl.h>//定义了很多宏和open

#include <stdlib.h>

#include <errno.h> //错误的标志

#include <string.h>

#include <stdio.h>

 

 

int main()

{

int fd = open("abc",O_RDWR);

if ( fd <0 )

{

perror("open abc");

return 0;

}

 

lseek(fd, 0x1000, SEEK_SET); //0x1000 4k

write(fd, "a",1);

close(fd);

return 0;

}

python@ubuntu:~/linuxC$ gcc lseek.c -o app

python@ubuntu:~/linuxC$ touch abc

python@ubuntu:~/linuxC$ ls -l

总用量 44

-rw-r--r-- 1 python python 0 1月 19 18:50 2

-rw-rw-r-- 1 python python 0 1月 22 11:09 abc

python@ubuntu:~/linuxC$ ./app

python@ubuntu:~/linuxC$ ls -l

总用量 48

-rw-r--r-- 1 python python 0 1月 19 18:50 2

-rw-rw-r-- 1 python python 4097 1月 22 11:09 abc

-rw-rw-r-- 1 python python 454 1月 19 19:17 writeFile.c

获取文件的大小

python@ubuntu:~/linuxC$ cat lseek.c

#include <sys/stat.h>//文件的属性

#include <unistd.h>// POSIX 操作系统 API 的访问功能的头文件的名称

#include <sys/types.h> //基本系统数据类型

#include <fcntl.h>//定义了很多宏和open

#include <stdlib.h>

#include <errno.h> //错误的标志

#include <string.h>

#include <stdio.h>

 

 

int main()

{

int fd = open("abc",O_RDWR);

if ( fd <0 )

{

perror("open abc");

return 0;

}

 

lseek(fd, 0x1000, SEEK_SET); //0x1000 4k

write(fd, "a",1);

printf("abc Size=%d\\n",lseek(fd,0,SEEK_END));

close(fd);

return 0;

}

python@ubuntu:~/linuxC$ ./app

abc Size=4097

Fcntl

#include <unistd.h>

#include <fcntl.h>

#include <errno.h>

#include <string.h>

#include <stdlib.h>

#define MSG_TRY "try again\\n"

int main(void)

{

char buf[10];

int n;

int flags;

flags = fcntl(STDIN_FILENO, F_GETFL); //获取

flags |= O_NONBLOCK; //设置为非阻塞

if (fcntl(STDIN_FILENO, F_SETFL, flags) == -1) { //在设置回去为非阻塞

perror("fcntl");

exit(1);

}

tryagain:

n = read(STDIN_FILENO, buf, 10);

if (n < 0) {

if (errno == EAGAIN) {

sleep(1);

write(STDOUT_FILENO, MSG_TRY, strlen(MSG_TRY));

goto tryagain;

}

perror("read stdin");

exit(1);

}

write(STDOUT_FILENO, buf, n);

return 0;

}

 

ioctl

ioctl用于向设备发控制和配置命令,有些命令也需要读写一些数据,但这些数据是

不能用read/write读写的,称为Out-of-band数据。也就是说,read/write读写的数据是

in-band数据,是I/O操作的主体,而ioctl命令传送的是控制信息,其中的数据是辅助的数

据。例如,在串口线上收发数据通过read/write操作,而串口的波特率、校验位、停止位通

过ioctl设置,A/D转换的结果通过read读取,而A/D转换的精度和工作频率通过ioctl设置。

#include <sys/ioctl.h>

int ioctl(int d, int request, ...);

d是某个设备的文件描述符。request是ioctl的命令,可变参数取决于request,通常是

一个指向变量或结构体的指针。若出错则返回-1,若成功则返回其他值,返回值也是取决于

request。

以下程序使用TIOCGWINSZ命令获得终端设备的窗口大小。

python@ubuntu:~/linuxC$ cat ioct.c

#include <stdio.h>

#include <stdlib.h>

#include <unistd.h>

#include <sys/ioctl.h>

int main(void)

{

struct winsize size;

if (isatty(STDOUT_FILENO) == 0) //终端的输出是否0当前

exit(1);

if(ioctl(STDOUT_FILENO, TIOCGWINSZ, &size)<0) { //把当前终端的行和列复制到size

perror("ioctl TIOCGWINSZ error");

exit(1);

}

printf("%d rows, %d columns\\n", size.ws_row, size.ws_col);

return 0;

}

python@ubuntu:~/linuxC$ gcc ioct.c -o app

python@ubuntu:~/linuxC$ ./app

24 rows, 89 columns

 

总结

以上是关于Linux文件的I/O操作的主要内容,如果未能解决你的问题,请参考以下文章

Linux操作系统基础I/O

linux上的缓冲异步文件I/O

Linux文件的I/O操作

Linux操作系统——文件I/O - 知其然,知其所以然

linux常用文件I/O操作之文件共享的实现方式

RK3568平台开发系列讲解(Linux系统篇)详解文件 I/O 操作