操作系统-4.1-文件

Posted 2021-09-01 LL.LEBRON

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了操作系统-4.1-文件相关的知识，希望对你有一定的参考价值。

操作系统-4.1-文件

本文讲文件的属性 and 文件逻辑结构 and 文件目录。

1. 初识文件管理

1.1文件的属性

一个文件有哪些属性？

文件名：由创建文件的用户决定文件名，主要是为了方便用户找到文件，同一目录下不允许有重名文件。
标识符：一个系统内的各文件标识符唯一，对用户来说毫无可读性，因此标识符只是操作系统用于区分各个文件的一种内部名称。
类型：指明文件的类型。
位置：文件存放的路径（让用户使用）、在外存中的地址（操作系统使用，对用户不可见）。
大小：指明文件大小。
创建时间、上次修改时间
文件所有者信息
保护信息：对文件进行保护的访问控制信息。

1.2文件内部的数据应该怎样组织起来？

无结构文件：（如文本文件）由一些二进制或字符流组成，又称“流式文件”。
有结构文件：（如数据库表）有一组相似的记录组成，又称“记录式文件“。

记录：是一组相关数据项的集合。

1.3操作系统应该向上提供哪些功能？

可以“创建文件”，(点击新建后，图形化交互进程在背后调用了“create系统调用“）。
可以“读文件”，将文件数据读入内存，才能让CPU处理（双击后,“记事本”应用程序通过操作系统提供的“读文件”功能，即read系统调用，将文件数据从外存读入内存，并显示在屏幕上)。
可以“写文件”，将更改过的文件数据写回外存（我们在“记事本”应用程序中编辑文件内容，点击“保存”后，“记事本”应用程序通过操作系统提供的“写文件”功能，即 write系统调用，将文件数据从内存写回外存)。
可以“删除文件”，（点了“删除”之后，图形化交互进程通过操作系统提供的“删除文件”功能，即delete系统调用，将文件数据从外存中删除)。

向上提供的几个最基本的功能：

创建文件(create系统调用)
删除文件(delete系统调用)
读文件(read系统调用)
写文件(write系统调用)
打开文件(open系统调用)。读/写文件之前，需要“打开文件”。
关闭文件(close系统调用)。读/写文件结束之后，需要“关闭文件”。

1.4从上往下看，文件应如何存放在外存？

1.5其他需要由操作系统实现的文件管理功能

文件共享：使多个用户可以共享使用一个文件。
文件保护：如何保证不同的用户对文件有不同的操作权限。

1.6总结

2.文件的逻辑结构

2.1无结构文件

按文件是否有结构分类，可以分为无结构文件，有结构文件两种。

无结构文件：文件内部的数据就是一系列二进制流或字符流组成。又称”流式文件“。如：Windows操作系统中的.txt文件。

注：文件内部的数据其实就是一系列字符流，没有明显的结构特性。因此也不用探讨无结构文件的“逻辑结构”问题。

2.2有结构文件

有结构文件：由一组相似的记录组成，又称“记录式文件”。每条记录又若干个数据项组成。如：数据库表文件。一般来说，每条记录有一个数据项可作为关键字。根据各条记录的长度(占用的存储空间）是否相等，又可分为定长记录和可变长记录两种。

2.3有结构文件的逻辑结构

2.3.1顺序文件

顺序文件：文件中的记录一个接一个地顺序排列（逻辑上），记录可以是定长的或可变长的。

各个记录在物理上可以顺序存储或链式存储。

顺序存储：逻辑上相邻的记录，物理上也相邻（类似于顺序表）。
- 可变长记录：无法实现随机存取，每次只能从第一个记录开始依次往后查找。
- 定长记录：可实现随机随机存取，记录长度为L，则第i个记录存放的相对位置是i*L。
  1. 若采用串结构，无法快速找到某关键字对应的记录。
  2. 若采用顺序结构，可以快速找到某关键字对应的记录（如折半查找）。
链式存储：逻辑上相邻的记录，物理上不一定相邻（类似于链表）。
- 无论是定长/可变长记录，都无法实现随机存取，每次只能从第一个记录开始依次往后查找。

顺序文件还可以分为串结构和顺序结构：

串结构：记录之间的顺序于关键字无关。（串结构通常按照记录存入的时间决定记录的顺序）。
顺序结构：记录之间的顺序按关键字顺序排列。

2.3.2索引文件

对于可变长记录文件，要找到第i个记录，必须先顺序第查找前i-1个记录，但是很多应用场景中又必须使用可变长记录。如何解决这个问题？

索引表本身是定长记录的顺序文件。因此可以快速找到第i个记录对应的索引项。

可将关键字作为索引号内容，若按关键字顺序排列，则还可以支持按照关键字折半查找。

每当要增加/删除一个记录时，需要对索引表进行修改。由于索引文件有很快的检索速度，因此主要用于对信息处理的及时性要求比较高的场合。

另外，可以用不同的数据项建立多个索引表。如：学生信息表中，可用关键字“学号”建立一张索引表。也可用“姓名”建立一张索引表。这样就可以根据“姓名”快速地检索文件了。
(Eg: SQL就支持根据某个数据项建立索引的功能)

2.3.3索引顺序文件

思考索引文件的缺点：每个记录对应一个索引表项，因此索引表可能会很大。比如：文件的每个记录平均只占8B，而每个索引表项占32个字节，那么索引表都要比文件内容本身大4倍，这样对存储空间的利用率就太低了。

索引顺序文件：是索引文件和顺序文件思想的结合。索引顺序文件中，同样会为文件建立一张索引表，但不同的是：并不是每个记录对应一个索引表项，而是一组记录对应一个索引表项。

索引顺序文件的检索效率分析：

为了进一步提高检索效率，可以为顺序文件建立多级索引表。例如，对于一个含 $10^6$ 个记录的文件，可先为该文件建立一张低级索引表，每100个记录为一组，故低级索引表中共有10000个表项(即10000个定长记录)，再把这10000个定长记录分组，每组100个，为其建立顶级索引表，故顶级索引表中共有100个表项。

2.4总结

3.文件目录

3.1文件控制块

FCB的有序集合称为“文件目录”，一个FCB就是一个文件目录项。FCB中包含了文件的基本信息（文件名、物理地址、逻辑结构、物理结构等），存取控制信息（是否可读/可写、禁止访问的用户名单等)，使用信息（如文件的建立时间、修改时间等)。
最重要，最基本的还是文件名、文件存放的物理地址。

FCB 实现了文件名和文件之间的映射。使用户（用户程序）可以实现“按名存取”。

3.2目录结构

3.2.1单级目录结构

单级目录结构：早期操作系统并不支持多级目录，整个系统只建立一张目录表，每个文件占一个目录项。

单级目录实现了“按名存取”，但是不允许文件重名。
在创建一个文件时，需要先检查目录表中有没有重名文件，确定不重名后才能允许建立文件，并将新文件对应的目录项插入目录表中。
显然，单级目录结构不适用于多用户操作系统。

3.2.2两级目录结构

两级目录结构：早期的多用户操作系统，采用两级目录结构。分为主文件目录和用户文件目录。

3.2.3多级目录结构

3.2.4无环图目录结构

可以用不同的文件名指向同一个文件，甚至可以指向同一个目录（共享同一目录下的所有内容）。

需要为每个共享结点设置一个共享计数器，用于记录此时有多少个地方在共享该结点。用户提出删除结点的请求时，只是删除该用户的FCB、并使共享计数器减1，并不会直接删除共享结点。只有共享计数器减为0时，才删除结点。

注意：共享文件不同于复制文件。在共享文件中，由于各用户指向的是同一个文件，因此只要其中一个用户修改了文件数据，那么所有用户都可以看到文件数据的变化。

3.3索引节点

其实在查找各级目录的过程中只需要用到“文件名”这个信息，只有文件名匹配时，才需要读出文件的其他信息。因此可以考虑让目录表“瘦身”来提升效率。

所以引入了索引节点。可以把除了文件名之外的文件描述信息都放到这里来。

思考：这样做有什么好处？

假设一个FCB是64B，磁盘块的大小为1KB，则每个盘块中只能存放16个FCB。若一个文件目录中共有640个目录项，则共需要占用640/16= 40个盘块。因此按照某文件名检索该目录，平均需要查询320个目录项，平均需要启动磁盘20次（每次磁盘I/O读入一块）。

若使用索引结点机制，文件名占14B，索引结点指针站2B，则每个盘块可存放64个目录项，那么按文件名检索目录平均只需要读入320/64=5个磁盘块。显然，这将大大提升文件检索速度。

当找到文件名对应的目录项时，才需要将索引结点调入内存，索引结点中记录了文件的各种信息，包括文件在外存中的存放位置，根据“存放位置”即可找到文件。

存放在外存中的索引结点称为“磁盘索引结点”，当索引结点放入内存后称为“内存索引结点”。

相比之下内存索引结点中需要增加一些信息，比如：文件是否被修改、此时有几个进程正在访问该文件等。

3.4总结

以上是关于操作系统-4.1-文件的主要内容，如果未能解决你的问题，请参考以下文章

操作系统-4.1-文件

文章目录

操作系统-4.1-文件

1. 初识文件管理

1.1文件的属性

1.2文件内部的数据应该怎样组织起来？

1.3操作系统应该向上提供哪些功能？

1.4从上往下看，文件应如何存放在外存？

1.5其他需要由操作系统实现的文件管理功能

1.6总结

2.文件的逻辑结构

2.1无结构文件

2.2有结构文件

2.3有结构文件的逻辑结构

2.3.1顺序文件

2.3.2索引文件

2.3.3索引顺序文件

2.4总结

3.文件目录

3.1文件控制块

3.2目录结构

3.2.1单级目录结构

3.2.2两级目录结构

3.2.3多级目录结构

3.2.4无环图目录结构

3.3索引节点

3.4总结