每天进步一点点——Linux中的文件描写叙述符与打开文件之间的关系

Posted jhcelue

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了每天进步一点点——Linux中的文件描写叙述符与打开文件之间的关系相关的知识,希望对你有一定的参考价值。

转载请说明出处:http://blog.csdn.net/cywosp/article/details/38965239


1. 概述
    在Linux系统中一切皆能够看成是文件,文件又可分为:普通文件、文件夹文件、链接文件和设备文件。文件描写叙述符(file descriptor)是内核为了高效管理已被打开的文件所创建的索引。其是一个非负整数(一般是小整数),用于指代被打开的文件。全部运行I/O操作的系统调用都通过文件描写叙述符。程序刚刚启动的时候。0是标准输入,1是标准输出,2是标准错误。

假设此时去打开一个新的文件,它的文件描写叙述符会是3。

POSIX标准要求每次打开文件时(含socket)必须使用当前进程中最小可用的文件描写叙述符号码,因此,在网络通信过程中稍不注意就有可能造成串话。标准文件描写叙述符图例如以下:

技术分享

文件描写叙述与打开的文件相应模型例如以下图:
技术分享

2. 文件描写叙述限制
    在编写文件操作的或者网络通信的软件时,刚開始学习的人一般可能会遇到“Too many open files”的问题。这主要是由于文件描写叙述符是系统的一个重要资源。尽管说系统内存有多少就能够打开多少的文件描写叙述符。可是在实际实现过程中内核是会做对应的处理的,一般最大打开文件数会是系统内存的10%(以KB来计算)(称之为系统级限制)。查看系统级别的最大打开文件数能够使用sysctl -a | grep fs.file-max命令查看。

与此同一时候,内核为了不让某一个进程消耗掉全部的文件资源。其也会对单个进程最大打开文件数做默认值处理(称之为用户级限制),默认值通常是1024,使用ulimit -n命令能够查看。在Webserver中,通过更改系统默认值文件描写叙述符的最大值来优化server是最常见的方式之中的一个。详细优化方式请查看http://blog.csdn.net/kumu_linux/article/details/7877770


3. 文件描写叙述符合打开文件之间的关系
    每个文件描写叙述符会与一个打开文件相相应。同一时候。不同的文件描写叙述符也会指向同一个文件。同样的文件能够被不同的进程打开也能够在同一个进程中被多次打开。系统为每个进程维护了一个文件描写叙述符表,该表的值都是从0開始的。所以在不同的进程中你会看到同样的文件描写叙述符,这样的情况下同样文件描写叙述符有可能指向同一个文件,也有可能指向不同的文件。

详细情况要详细分析。要理解详细其概况怎样,须要查看由内核维护的3个数据结构。

    1. 进程级的文件描写叙述符表
    2. 系统级的打开文件描写叙述符表
    3. 文件系统的i-node表

进程级的描写叙述符表的每一条目记录了单个文件描写叙述符的相关信息。
    1. 控制文件描写叙述符操作的一组标志。

(眼下,此类标志仅定义了一个,即close-on-exec标志)

    2. 对打开文件句柄的引用

内核对所有打开的文件的文件维护有一个系统级的描写叙述符表格(open file description table)。有时,也称之为打开文件表(open file table)。并将表格中各条目称为打开文件句柄(open file handle)。

一个打开文件句柄存储了与一个打开文件相关的所有信息,例如以下所看到的:

    1. 当前文件偏移量(调用read()和write()时更新,或使用lseek()直接改动)
    2. 打开文件时所使用的状态标识(即,open()的flags參数)
    3. 文件訪问模式(如调用open()时所设置的仅仅读模式、仅仅写模式或读写模式)
    4. 与信号驱动相关的设置
    5. 对该文件i-node对象的引用
    6. 文件类型(比如:常规文件、套接字或FIFO)和訪问权限
    7. 一个指针,指向该文件所持有的锁列表
    8. 文件的各种属性,包含文件大小以及与不同类型操作相关的时间戳

下图展示了文件描写叙述符、打开的文件句柄以及i-node之间的关系。图中。两个进程拥有诸多打开的文件描写叙述符。

技术分享
    在进程A中。文件描写叙述符1和30都指向了同一个打开的文件句柄(标号23)。这可能是通过调用dup()、dup2()、fcntl()或者对同一个文件多次调用了open()函数而形成的。
    进程A的文件描写叙述符2和进程B的文件描写叙述符2都指向了同一个打开的文件句柄(标号73)。这样的情形可能是在调用fork()后出现的(即,进程A、B是父子进程关系)。或者当某进程通过UNIX域套接字将一个打开的文件描写叙述符传递给还有一个进程时,也会发生。

再者是不同的进程独自去调用open函数打开了同一个文件,此时进程内部的描写叙述符正好分配到与其它进程打开该文件的描写叙述符一样。

    此外,进程A的描写叙述符0和进程B的描写叙述符3分别指向不同的打开文件句柄。但这些句柄均指向i-node表的同样条目(1976),换言之,指向同一个文件。发生这样的情况是由于每一个进程各自对同一个文件发起了open()调用。同一个进程两次打开同一个文件。也会发生类似情况。


4. 总结
    1. 因为进程级文件描写叙述符表的存在,不同的进程中会出现同样的文件描写叙述符。它们可能指向同一个文件,也可能指向不同的文件
    2. 两个不同的文件描写叙述符,若指向同一个打开文件句柄,将共享同一文件偏移量。因此,假设通过当中一个文件描写叙述符来改动文件偏移量(由调用read()、write()或lseek()所致),那么从还有一个描写叙述符中也会观察到变化,不管这两个文件描写叙述符是否属于不同进程,还是同一个进程。情况都是如此。

    3. 要获取和改动打开的文件标志(比如:O_APPEND、O_NONBLOCK和O_ASYNC),可运行fcntl()的F_GETFL和F_SETFL操作,其对作用域的约束与上一条颇为类似。
    4. 文件描写叙述符标志(即。close-on-exec)为进程和文件描写叙述符所私有。对这一标志的改动将不会影响同一进程或不同进程中的其它文件描写叙述符






參考
[4] 《Linux/UNIX系统编程手冊》






















以上是关于每天进步一点点——Linux中的文件描写叙述符与打开文件之间的关系的主要内容,如果未能解决你的问题,请参考以下文章

Java计算机二级题库,每天进步一点点

linux /proc/cpuinfo 文件描写叙述

Linux 文件描写叙述符设置为非堵塞的方法

日常Java练习题(每天进步一点点系列)

Linux编程socket编程

memcached在Java中的应用以及magent的配置-每天进步一点点