Linux中的inode到底是啥

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux中的inode到底是啥相关的知识,希望对你有一定的参考价值。

参考技术A 要了解 Linux 操作系统上的 inode 前,我们先来说说 Linux操作系统上的文件。对于 Linux 操作系统而言,[一切皆文件]。而文件是无法独立于存储介质(这里指的是物理磁盘或内存、闪存等)存在的,一切操作系统上的文件都无时无刻不在和存储介质打交道。

例如,读取文件时需要将文件从磁盘中加载到内存中,当文件操作结束后,文件又会被存储到磁盘中。那么,既然文件要被存储到磁盘中,而磁盘是有容量限制的,那么也就是说磁盘上能存放的物理文件的数量是有限的。

如果你已经理解了这一个观点,那么恭喜你,你大体上已经知道了 inode 是干什么的。

没错, inode 是用来标识操作系统的文件的一个特征描述,而且操作系统上的 inode 并非无穷无尽,通常在你安装操作系统后,系统上的 inode 数量就已经确定了下来(不过,你可以动态修改 inode 的数量)。

你可以通过 sysctl -a 查询系统上的 inode 数量。

如上, fs.inode-nr 中的 70212 标识当前操作系统已分配的 inode 数量;21785 表示单前操作系统剩余空闲的 inode 数量

刚刚说过, inode 是用来标识文件的一个特征,这是为什么呢?

Linux 系统为每一个文件都分配了一个 inode 编号,这个编号中记录了文件相关的一些元信息,通过这些元信息可以用来唯一标识一个文件。

你可以通过 ls -i 查看任意一个文件的 inode 编号

而要查看文件的元信息,你需要使用 stat filename

如上,即为一个文件的 inode 信息。这其中包含:

事实上,刚刚通过 stat logrotate.man 中还包括一个字段 硬链接:1 。

为什么硬链接会出现在 inode 信息中?

一般情况下,操作系统中一个文件对应一个 inode ,但是这种规则却不适用于 硬链接 文件。盖因Linux操作系统上,允许多个文件指向同一个 inode 编号。(参考自: 理解inode - 阮一峰的网络日志 (ruanyifeng.com) )

硬链接场景下,可以使用不同的文件名访问同一个文件的内容,对文件内容、属性等的修改会传递到其他文件。但删除一个链接文件,并不影响其他文件的访问。

例如,建立 logrotate.man 的硬链接文件

建立硬链接后,通过 stat 可以看到 硬链接的数量变为 2 了。

这个时候我们删除原始的链接文件,查看链接后的文件内容

删除硬链接的原始文件后,可以成功读取链接后的文件内容,此时,硬链接数量又变为了 1。

出现这种情况的原因在于,硬链接实际上是对文件增加了一个索引,这个索引指向文件的 inode 编号。当硬链接的数量大于 1 时,说明该文件除去自身外,还有多个硬链接。当硬链接的数量等于 0 时,此时操作系统已经没有任何文件指向该 inode ,也即是操作系统会回收 inode 。

事实上,每删除一个文件,是对该文件硬链接数的「减一」操作。当文件的硬链接数归 0 时,这个文件会被操作系统彻底清除掉。

最后,通常情况下,操作系统分配的 inode 数量是完全够用的,但出于一些程序或人为的意外可能会导致操作系统的 inode 溢出,你可以通过 df -ih 查看系统分区下 inode 的使用情况以便及时作出应对措施。

计算机中的“句柄”到底是啥意思呢

https://www.cnblogs.com/Nick-Hu/p/7154197.html 里提到:

所谓句柄,实际上是一个数据,是一个 long (长整型)的数据。句柄是windows用来标识被应用程序所建立或使用的对象的唯一整数。 但是人家想了解的是,linux 中的句柄又是啥意思呢?

https://www.orchome.com/518

1. 句柄就是一个标识符,只要获得对象的句柄,我们就可以对对象进行任意的操作。

2. 句柄不是指针,操作系统用句柄可以找到一块内存,这个句柄可能是标识符,map的key, 也可能是指针,看操作系统怎么处理的了。fd算是在某种程度上替代句柄吧;linux 有相应机制,但没有统一的句柄类型,各种类型的系统资源由各自的类型来标识,由各自的接口操作。

粗暴的解释:

最早的windows开发书籍,handle 是被翻译成 “把手” 的。虽然不好听,但是个人认为非常传神。

  • 虽然你握住的只是把手,却能拉动整扇门,而且你根本不用在意那门长什么样子
  • 一扇门如果有多个把手,被不同的人(进程)握住,门往哪儿走就不好说了

设计这么一个句柄的原因在于 句柄可以防止用户随意读写操作系统内核的文件对象 。 无论是linux 还是windows, 文件句柄总是和内核的文件对象相关联的,但如何关联细节用户并不可见。内核可以通过句柄计算出内核文件对象的地址,但此能力并不对用户开放。

在linux中的句柄

在linux系统设计里面遵循一切都是文件的原则,即磁盘文件、目录、网络套接字、管道等,所有这些都是文件,在我们进行打开的时候会返回一个fd, 即是文件句柄。如果频繁的打开文件,或者打开网络套接字而忘记释放就会有句柄泄漏的现象。在linux系统中对进程可以调用的文件句柄数进行了限制,在默认情况下每个进程可以调用的最大句柄数是1024个,如果超出了这个限制,进程将无法获得新的句柄,从而导致不能打开新的文件或者网络套接字,对于线上服务器即会出现服务被拒绝的情况。

下面举一个实际的例子,在linux中,值为0,1,2的fd分别代表标准输入、标准输出和标准错误输出。在程序中打开文件得到的fd从3开始增长。fd具体是什么呢?在内核中,每一个进程都有 一个私有的“打开文件表”,这个表是一个指针数组,每一个元素都指向一个内核的打开文件对象。而fd, 就是这个表的下标。当用户打开一个文件时,内核会在内部生成一个打开文件对象,并在这个表里找到一个空项,让这一项指向生成的打开文件对象,并返回这一项的下标作为fd。由于这个表处于内核,并且用户无法访问到,因此用户即使拥有fd,也无法得到打开文件对象的地址,只能够通过系统提供的函数来操作。

在程序设计中,句柄是一种特殊的智能指针。当一个应用程序要应用其他系统(如数据库、操作系统)所管理的内存块或对象时,就要使用句柄。

句柄与普通指针的区别在于,指针包含的是引用对象的内存地址,而句柄则是由系统所管理的引用标识,该标识可以被系统重新定位到一个内存地址上。这种间接访问对象的模式增强了系统对引用对象的控制

 

以上是关于Linux中的inode到底是啥的主要内容,如果未能解决你的问题,请参考以下文章

Linux中的双点(..)和单点(.)是啥?

arcmap 是啥中了?做啥用的?

Linux中的两种link方式

inode 列 (proc/net/tcp(6)) 中的值是啥意思?

linux中的目录

linux/unix中soft link和hard link的区别是啥