UNIX 环境高级编程 文件和目录
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了UNIX 环境高级编程 文件和目录相关的知识,希望对你有一定的参考价值。
函数stat , fstat , fstatat , lstat
stat函数返回与此文件有关的信息结构。
fstat函数使用已打开的文件描述符(而stat则使用文件名)
fstatat函数 为一个相对于当前打开目录的路径名返回文件信息。
lstat函数返回该符号链接的有关信息,而不是该符号链接引用的文件的信息。
使用stat最多的地方可能就是 ls -l 命令。
st_mode 与 S_IFMT 进行 与 运算 在与 S_IFXXX常量相比较,来判断类型。
文件类型
1.普通文件: 无论是文本文件还是二进制文件对UNIX内核来说没有区别。
2.目录文件: 这种文件包含了其他文件的名字以及指向与这些文件有关信息的指针。
3.块特殊文件: 提供对设备带缓冲的访问。
4.字符特殊文件: 提供对设备不带缓冲的访问
5.FIFO : 用于进程通信, 称之为 管道
6.socket:用于网络通信
7.符号链接:这种文件指向另一个文件
文件类型信息包含在stat结构的 st_mode 成员中。
设置用户ID 和 设置组ID
实际用户ID :
我们实际上是谁
实际组ID :
有效用户ID:
用于文件访问权限检查
有效组ID :
保存的设置用户ID:
由exec函数保存
保存的设置组ID :
实际用户ID和组ID : 表示我们究竟是谁。取自口令文件中的登陆项
有效用户ID,有效组ID ,附属组ID : 决定了我们的文件访问权限
保存的设置用户ID和设置组ID : 执行一个程序时,包含了有效用户ID和有效组ID的副本。(8.11节详细说明)
通常 有效用户ID等于实际用户ID。有效组ID等于实际组ID
每个文件有一个所有者和组所有者。 分别由 stat结构中的 st_uid 和 st_gid指定。
执行程序时,进程的 有效ID 通常就是 实际ID。
但是,可以在文件模式字(st_mode)中设置一个特殊标识,含义是“当执行此文件时,将进程的有效用户ID设置为文件所有者的用户ID(st_uid),同样可以设置组ID。
在文件模式字中的这两位,被称为 设置用户ID(set-user-id) 和 设置组ID(set-group-id) 位。
例如:
若文件的所有者是root,并且设置了该文件的设置用户ID位,那么该程序由一个进程执行时,该进程具有root权限。无论执行此进程的实际用户ID是什么都是这样。
设置用户ID 和 设置组ID 都包含在文件的 st_mode 值中。 可以分别用常量 S_ISUID 和 S_ISGID 测试。
文件访问权限
st_mode 也包含对文件的访问权限位 。
每个文件有 9 个权限位, 分成 3 类:
S_IRUSR 用户读
S_IWUSR 用户写
S_IXUSR 用户执行
S_IRGRP 组读
S_IWGRP 组写
S_IXGRP 组执行
S_IROTH 其他读
S_IWOTH 其他写
S_IXOTH 其他执行
用户指的是 文件所有者(owner) 。
- 用名字打开文件时,对该名字包含的没一个目录,包括可能隐含的当前工作目录 都应具有执行权限。对于目录的读权限,允许我们获取该目录中所有文件名的列表。对目录的执行权限可使我们通过该目录,进而搜索该目录,寻找一个特定的文件名。
- 对于一个文件的读权限,决定了我们能否打开现有文件进行读操作。与 open函数的 O_RDONLY 和 O_RDWR标志相关。
- 对于一个文件的写权限,决定了我们能否打开现有文件进行写操作。与 open函数的 O_WRONLY 和 O_RDWR标志相关。
- 为了在 open函数中对一个文件指定 O_TRUNC标志,必须对该文件具有写权限。
- 为了在一个目录中创建一个新文件,必须对该目录具有写权限和执行权限。
- 问了删除一个现有文件,必须对包含该文件的目录具有写权限和执行权限。对该文件本身不需要有读,写权限。
- 如果用 7 个 exec函数中的任何一个执行某个文件,都必须对该文件具有执行权限。并且该文件必须是一个普通文件。
进程每次打开,创建或删除一个文件时,内核就进行文件访问权限测试。
测试分为4步,顺序执行:
1.若 有效ID 是 root , 则允许访问。
2.若 有效ID 等于 所有者ID 的情况下。 那么如果所有者适当的访问权限被设置则允许访问,否则拒绝。
3.若 有限组ID 或 进程的附属组ID 之一 等于文件的组ID。如果适当的访问权限被设置,则允许访问,否则拒绝。
4.若 其他用户 适当的访问权限位被设置,则允许访问, 否则拒绝。
新文件和目录的所有权
新文件的用户ID设置为进程的有效用户ID。
关于组ID,可选择下列其一作为新文件的组ID:
1.新文件的组ID可以是进程的有效组ID。
2.新文件的组ID可以是他所在目录的组ID。
函数 access 和 faccessat
内核以 进程的有效用户ID 和 有效组ID 为基础测试访问权限测试。
如果希望按 实际用户ID 和 实际组ID 来测试访问能力。既可以用 access 和 faccessat 函数来进行访问权限测试(该测试与默认的一样,但将 有效ID 改为 实际ID)
int access ( const char * pathname , int mode );
int faccessat ( int fd , const char * pathname , int mode , int flag );
若成功返回 0 , 否则返回-1
如果测试文件是否已存在,mode 为 F_OK;否则 mode 是下列常量的 按位或:
R_OK 测试读权限
W_OK 测试写权限
X_OK 测试执行权限
函数 umask
mode_t umask ( mode_t cmask )
相当于设置创建文件时,默认的权限。
cmask 由 9个访问权限位 中的 若干个 ”或“ 构成。
在文件模式创建屏蔽字中为1的位,在文件mode中的相应位会被关闭。
若希望任何用户都能读文件,则应将umask设置为0。
函数 chmod , fchmod , fchmodat
用来改变现有文件的访问权限
int chmod ( const char *pathname , mode_t mode );
int fchmod ( int fd , mode_t mode );
int fchmodat ( int fd , const char *pathname , mode_t mode , int flag );
chmod函数 在指定的文件上进行操作, fchmod对已打开的文件进行操作 , fchmodat函数的fd参数可以指定相对的目录。若pathname为绝对路径,或fd参数取值为AT_FDCWD的时候与chmod是相同的。
fchmodat函数的flag参数 可以用来改变fchmodat的行为,设置AT_SYMLINK_NOFOLLOW标志时,fchmodat 不会跟随符号链接。
为了改变一个文件的权限位 , 进程的有效ID必须等于文件的所有者ID , 除非该进程具有ROOT权限。
参数mode是如下常量按位或:
S_ISUID 执行时设置用户ID
S_ISGID 执行时设置组ID
S_ISVTX 保存正文(黏着位)
S_IRWXU 用户(所有者)读,写,执行
S_IRUSR 用户(所有者)读
S_IWUSR 用户(所有者)写
S_IXUSR 用户(所有者)执行
S_IRWXG 组读,写,执行
S_IRGRP 组读
S_IWGRP 组写
S_IXGRP 组执行
S_IRWXO 其他读,写,执行
S_IROTH 其他读
S_IWOTH 其他写
S_IXOTH 其他执行
只有root才能设置黏着位。
新创建文件的组ID可能不是调用进程所属的组。也可能是父目录的组ID。人如果新文件的组ID不等于进程的有效组ID或者进程附属组ID的一个,而且进程没有root权限,那么设置组ID会被自动关闭。防止用户创建一个设置组ID文件。
黏着位
如果一个可执行程序被设置了黏着位,那么当程序第一次被执行,在终止的时候,程序正文部分的一个副本仍被保存在交换区。使得下次执行的时候能较快将其载入内存。
如果对一个目录设置了黏着位,那么只有对该目录具有写权限的用户并且满足下列条件之一,才能删除或重命名该目录下的文件:
- 拥有此文件
- 拥有此目录
- 是超级用户
函数 chown , fchown , fchownat , lchown
可用于更改用户ID和组ID。如果参数owner或group中的任意一个是-1,则对应的ID不变。
int chown ( const char *pathname , uid_t owner , gid_t group)
int fchown ( int fd , uid_t owner , gid_t group )
int fchownat ( int fd , const char *pathname , uid_t owner , gid_t group , int flag )
int lchown ( const char *pathname , uid_t owner , gid_t group )
在符号链接的情况下, lchown 和 设置了 AT_SYMLINK_NOFOLLOW标志的fchownat 更改符号链接本身的所有者。
fchown函数改变fd参数指向的打开文件的所有者。
文件长度
stat结构成员 st_size 表示 以字节为单位的文件的长度。只对普通文件,目录文件,符号链接有意义。
对于普通文件,长度可为0
对于目录文件,文件长度一般是一个数(如16或512)的倍数。
对于符号链接,文件长度就是文件名中的实际字节数。
文件的空洞
空洞是由所设置的偏移量超过文件尾端,并写入了某些数据后造成的。
对于没有写过的字节位置,read函数读到的字节是0。
如果使用实用程序(如cat)复制这个文件,那么所有空洞将被填满。其中所有书记数据字节皆填写为0。
文件截断
为了截断文件可以调用函数 truncate 和 ftruncate
int truncate ( const char *pathname , off_t length );
int ftruncate ( const char *pathname , off_t length);
这两个函数将一个现有文件长度截断为length。如果文件长度大于length,则超过length以外的数据就不能再访问。如果以前的长度小于length,文件长度将增加。
文件系统
书113页
函数 link , linkat , unlink , unlinkat , remove
创建一个指向现有文件的链接的方法是使用 link 函数 或 linkat 函数。
int link (const char *existingpath , const char *newpath )
int linkat ( int efd , const char *existingpath , int nfd , const char *newpath , int flag )
这两个函数创建一个新目录项newpath,它引用现有文件existingpath。如果 newpath已存在,则返回出错。只创建newpath中的最后一个分量,路径中的其他部分应当已经存在。
对于linkat函数,现有文件是通过efd和existingpath参数指定的,新的路径名通过nfd和newpath参数指定。
当有文件是符号链接时,有flag来控制linkat函数指向 现有符号链接的链接 还是 创建指向现有符号链接所指向的文件的链接(AT_SYMLINK_FOLLOW )
创建新目录项和增加链接计数应当是一个原子操作。
为了删除一个现有的目录项,可以调用unlink函数
int unlink ( const char *pathname )
int unlinkat ( int fd , const char *pathname , int flag)
这两个函数删除目录项 , 并将由 pathname 所引用文件的链接计数减1
只有当链接计数为0,该文件的内容才可被删除,如果有进程打开了该文件,其内容也不能删除。
如果 flag 参数设置为 AT_REMOVEDIR 。 函数可以类似于 rmdir 一样删除目录。
也可以用 remove 函数解除一个文件或目录的链接。 对于文件 remove的功能与unlink功能相同。对于目录 remove 与 rmdir 相同
int remove ( const char *pathname )
函数 rename 和 renameat
文件或目录可以用rename函数或者renameat函数进行重命名
根据oldname是指文件,目录还是符号链接。有几种情况需要加以说明。
- 如果oldname指的是一个文件,那么为该文件或符号链接重命名。在这种情况下,如果newname已存在,则它不能则它不能引用一个目录。如果newname不是一个目录,则先将该目录项删除然后将oldname重名为newname。对于包含oldname和newname的目录,调用进程需要具有写权限。
- 如果oldname指的是一个目录,那么为该目录重命名。如果newname已存在,则它必须引用一个目录,而且该目录应当是空目录(该目录中只有 . 和 ..)。如果newname存在(空目录),则先将其删除,然后将oldname重命名为newname。另外,当为一个目录重命名时,newname 不能包含 oldname作为其路径前缀。
- 如果oldname或newname引用符号链接,则处理的是符号链接本身,而不是他所引用的文件。
- 不能对 . 和 .. 重命名
- 如果oldname 和 newname 引用同一个文件。则函数不做任何更改而成功返回。
符号链接
符号链接是对一个文件的间接指针,与硬链接有所不同,硬链接直接指向文件的i节点。
- 硬链接通常要求链接和文件位于同一文件系统中。
- 只有ROOT才能创建指向目录的硬链接
符号链接已经它指向和中对象并无任何文件系统的限制。任何用户都可以创建指向目录的符号链接。符号链接一般用于将一个文件或整个目录结构移至系统中另一位置。
当使用以名字引用文件的函数时,应当了解该函数是否处理符号链接。
创建和读取符号链接
可以用 symlink 或 symlinkat 函数创建一个符号链接。
int symlink ( const char * actualpath , const char *sympath ) ;
int symlinkat ( const char *actualpath , int fd , const char *sympath) ;
函数创建一个指向 actualpath 的新目录项 sympath。创建符号链接时,不要求 actualpath已存在。并且不需要位于同一文件系统。
由于open函数跟随符号链接,使用 readlink 和 readlinkat 函数 可以打开该链接本身。
ssize_t readlink ( const char *restrict pathname , char *restrict buf , size_t bufsize ) ;
ssize_t readlinkat ( const char *restrict pathname , int fd , char * restrict buf , size_t bufsize );
这两个函数组合了open,read,close的所有操作。如果成功则返回读入buf的字节数。
文件时间
在 stat 结构中,对每个文件维护了 3 个 时间字段。
字段 |
说明 |
例子 |
ls 选项 |
st_atim |
文件数据最后的访问时间 |
read |
-u |
st_stim |
文件数据的最后修改时间 |
write |
默认 |
st_ctim |
i节点状态的最后更改时间 |
chown,chmod |
-c |
函数 futimens , utimensat 和 utimes
可以用来修改一个文件的访问时间和修改时间。
int futimens ( int fd , const struct timespec times[2] ) ;
int utimensat ( int fd , const char *path, const struct timespec times[2] , int flag );
times数组的第一个元素包含访问时间,第二个元素包含修改时间。
时间戳可按下列4种方式之一进行指定:
函数 mkdir, mkdirat , rmdir
mkdir 和 mkdirat 用来创建目录 , rmdir 用来删除目录
int mkdir ( const char *pathname , mode_t mode );
int mkdirat ( int fd , const char *pathname , mode_t mode );
int rmdir ( const char *pathname );
读目录
DIR *opendir ( const char *pathname );
DIR *fdopendir ( int fd );
struct dirent *readdir ( DIR *dp );
void rewinddir ( DIR *dp )
int closedir (DIR *dp )
long telldur (DIR *dp )
void seekdir ( DIR *dp , long loc )
在头文件 <dirent.h> 中的dirent结构与实现有关。
至少包含两个成员:
ino_t d_ino; //i-node number
char d_name[];
函数 chdir , fchdir , getcwd
每个进程都有一个当前工作目录,此目录是所有相对路径名的起点。
int chdir ( const char *pathname );
int fchdir ( int fd );
两个函数分别用pathname 和 打开文件描述符 指定新的当前工作目录。
当前工作目录是进程的一个属性,所以它只影响调用 chdir 的进程本身。
char *getcwd ( char *buf , size_t size );
该缓冲区必须有足够的长度容纳绝对路径名加上终止null字节。
以上是关于UNIX 环境高级编程 文件和目录的主要内容,如果未能解决你的问题,请参考以下文章