第十章、文件查找和压缩
本章内容
- 使用locate命令
- 使用find命令
- 压缩和解压缩工具
文件查找
- 在文件系统上查找符合条件的文件
- 文件查找:locate, find
非实时查找(数据库查找):locate
实时查找:find
locate
- 查询系统上预建的文件索引数据库
/var/lib/mlocate/mlocate.db
- 依赖于事先构建的索引
索引的构建是在系统较为空闲时自动进行(周期性任务),管理员手动更新数据库(updatedb)
- 索引构建过程需要遍历整个根文件系统,极消耗资源
- 工作特点:
查找速度快
模糊查找
非实时查找
搜索的是文件的全路径,不仅仅是文件名
可能只搜索用户具备读取和执行权限的目录
即普通用户执行需要rx权限。
locate命令
- locate KEYWORD
- 有用的选项
-i 不区分大小写的搜索
-n N 只列举前N个匹配项目
-r 使用正则表达式
- 示例
搜索名称或路径中带有“conf”的文件
locate conf
使用Regex来搜索以“.conf”结尾的文件
locate -r ‘\.conf$’
注意:要执行实时查找文件内容时,需要用updatedb命令手动更新这个数据库后,才能实现实时查找;但是,会占用系统资源,在生产环境中慎用!
find
- 实时查找工具,通过遍历指定路径完成文件查找
- 工作特点:
查找速度略慢
精确查找
实时查找
可能只搜索用户具备读取和执行权限的目录
- 语法:
find [OPTION]... [查找路径] [查找条件] [处理动作]
- 查找路径:指定具体目标路径;默认为当前目录,默认递归搜索,进入目录下所有目录和文件
- 查找条件:指定的查找标准,可以文件名、大小、类型、权限等标准进行;默认为找出指定路径下的所有文件
- 处理动作:对符合条件的文件做操作,默认输出至屏幕
- 查找条件
指搜索层级
-maxdepth level 最大搜索目录深度,指定目录为第1级
-mindepth level 最小搜索目录深度(详见附录1.1)
根据文件名和inode查找:
-name "文件名称":支持使用glob
*, ?, [], [^]
-iname "文件名称":不区分字母大小写
-inum n 按inode号查找
-samefile name 相同inode号的文件
-links n 链接数为n的文件
-regex "PATTERN":以PATTERN匹配整个文件路径字符串,而不仅仅是文件名称
根据属主、属组查找:
-user USERNAME:查找属主为指定用户(UID)的文件
-group GRPNAME: 查找属组为指定组(GID)的文件
-uid UserID:查找属主为指定的UID号的文件
-gid GroupID:查找属组为指定的GID号的文件
-nouser:查找没有属主的文件
-nogroup:查找没有属组的文件
根据文件类型查找:
-type TYPE:
?f: 普通文件
?d: 目录文件
?l: 符号链接文件
?s:套接字文件
?b: 块设备文件
?c: 字符设备文件
?p: 管道文件
组合条件:
与:-a
或:-o
非:-not, !
德?摩根定律:
(非 A) 或 (非 B) = 非(A 且 B)
(非 A) 且 (非 B) = 非(A 或 B)
示例:
!A -a !B = !(A -o B)
!A -o !B = !(A -a B)
根据文件大小来查找:
-size [+|-]#UNIT(UNIT代表单位)
常用单位:k, M, G,c(byte)
#UNIT: (#-1, #]
如:6k 表示(5k,6k]
-#UNIT:[0,#-1]
如:-6k 表示[0,5k]
+#UNIT:(#,∞)
如:+6k 表示(6k,∞)
根据时间戳:
以“天”为单位;
-atime [+|-]#,
#: [#,#+1)
+#: [#+1,∞]
-#: [0,#)
-mtime
-ctime
以“分钟”为单位:
-amin
-mmin
-cmin
根据权限查找:
-perm [/|-]MODE
MODE: 精确权限匹配
/MODE:任何一类(u,g,o)对象的权限中只要能一位匹配即可,或关系,+ 从centos7开始淘汰
-MODE:每一类对象都必须同时拥有指定权限,与关系
0 表示不关注(和/|-组合使用时)
.find -perm 755 会匹配权限模式恰好是755的文件
.只要当任意人有写权限时,find -perm +222就会匹配
.只有当每个人都有写权限时,find -perm -222才会匹配
.只有当其它人(other)有写权限时,find -perm -002(等价/002)才会匹配
find示例
find -name snow.png
find -iname snow.png
find / -name “*.txt”
find /var –name “*log*”
find -user joe -not -group joe
find -user joe -o -user jane
find -not \( -user joe -o -user jane \)
find / -user joe -o -uid 500
找出/tmp目录下,属主不是root,且文件名不以f开头的文件
find /tmp \( -not -user root -a -not -name ‘f*‘ \) -ls
find /tmp -not \( -user root -o -name ‘f*‘ \) –ls
排除目录
示例:
查找/etc/下,除/etc/sane.d目录的其它所有.conf后缀的文件
find /etc -path ‘/etc/sane.d’ -a -prune
-o -name “*.conf”
查找/etc/下,除/etc/sane.d和/etc/fonts两个目录的其它所有.conf后缀的文件
find /etc \(–path ‘/etc/sane.d’ –o –path ’/etc/fonts’ \)
-a -prune –o -name “*.conf”
- 处理动作
-print:默认的处理动作,显示至屏幕
-ls:类似于对查找到的文件执行“ls -l”命令
-delete:删除查找到的文件
-fls file:查找到的所有文件的长格式信息保存至指定文件中
-ok COMMAND {} \; 对查找到的每个文件执行由COMMAND指定的命令,对于每个文件执行命令之前,都会交互式要求用户确认(详见附录1.2)
-exec COMMAND {} \; 对查找到的每个文件执行由COMMAND指定的命令
{}: 用于引用查找到的文件名称自身
find传递查找到的文件至后面指定的命令时,查找到所有符合条件的文件一次性传递给后面的命令
参数替换xargs
- 由于很多命令不支持管道|来传递参数,而日常工作中有这个必要,所以就有了xargs命令
- xargs用于产生某个命令的参数,xargs 可以读入 stdin 的数据,并且以空格符或回车符将 stdin 的数据分隔成为arguments
- 注意:文件名或者是其他意义的名词内含有空格符的情况
- 有些命令不能接受过多参数,命令执行可能会失败,xargs可以解决
- 示例:
ls f* |xargs rm
find /sbin -perm +700 |ls -l 这个命令是错误的
find /sbin -perm +7000 | xargs ls –l
- find和xargs格式:find | xargs COMMAND
find示例
- find -name “*.conf” -exec cp {} {}.orig \;
备份配置文件,添加.orig这个扩展名
- find /tmp -ctime +3 -user joe -ok rm {} \;
提示删除存在时间超过3天以上的joe的临时文件
- find ~ -perm -002 -exec chmod o-w {} \;
在你的主目录中寻找可被其它用户写入的文件
- find /data –type f -perm 644 -name “*.sh” –exec chmod 755 {} \;
- find /home –type d -ls
Gnome 搜索工具
- 位置->搜索文件……
- 图形化搜索工具,可搜索
?命令
?内容
?用户/组群
?大小
?修改时间
压缩、解压缩及归档工具
- .file-roller
- .compress/uncompress: .Z
- .gzip/gunzip: .gz
- .bzip2/bunzip2: .bz2
- .xz/unxz: .xz
- .zip/unzip
- .tar
- .cpio
compress/uncompress
- compress [-dfvcVr] [-b maxbits] [file ...]
-d: 解压缩,相当于uncompress
-c: 结果输出至标准输出,不删除原文件
-v: 显示详情
- uncompress 解压缩
- zcat file.Z >file (解压缩,zcat file.Z将文件内容展开显示到屏幕上)
(详见附录1.3)
gzip/gunzip
- gzip [OPTION]... FILE ...
-d: 解压缩,相当于gunzip
-c: 将压缩或解压缩的结果输出至标准输出
-#:1-9,指定压缩比,值越大压缩比越大 (默认是6)
- zcat:不显式解压缩的前提下查看文本文件内容
- 实例:
gzip -c messages >messages.gz
gzip -c -d messages.gz > messages
zcat messages.gz > messages
(zcat查看压缩文件内容不看后缀,但是gzip解压缩看后缀)
bzip2/bunzip2/bzcat
- bzip2 [OPTION]... FILE ...
-k: keep, 保留原文件
-d:解压缩
-#:1-9,压缩比,默认为9
- bzcat:不显式解压缩的前提下查看文本文件内容
xz/unxz/xzcat
- xz [OPTION]... FILE ...
-k: keep, 保留原文件
-d:解压缩
-#:1-9,压缩比,默认为6
- xzcat: 不显式解压缩的前提下查看文本文件内容
zip/unzip
- 打包压缩(Windows和Linux都有,可以压缩文件夹)
zip –r /testdir/sysconfig /etc/sysconfig/(-r压文件夹)
(压缩后文件,自动带zip后缀)(压缩前文件)
- 解包解压缩
unzip sysconfig.zip
cat /var/log/messages | zip messages -
unzip -p message > message
tar工具
- Tar(Tape ARchive,磁带归档的缩写)
- tar [OPTION]...
(1) 创建归档
tar -c -f /PATH/TO/SOMEFILE.tar FILE...
(2) 追加文件至归档: 注:不支持对压缩文件追加
tar -r -f /PATH/TO/SOMEFILE.tar FILE...
(3) 查看归档文件中的文件列表
tar -t -f /PATH/TO/SOMEFILE.tar
(4) 展开归档
tar -x -f /PATH/TO/SOMEFILE.tar
tar -x -f /PATH/TO/SOMEFILE.tar -C /PATH/
(5) 结合压缩工具实现:归档并压缩
-j: bzip2, -z: gzip, -J: xz
- -T选项指定输入文件,-X选项指定包含要排除的文件列表
tar zcvf mybackup.tgz -T /root/includefilelist -X /root/excludefilelist
像:file -f filelist.txt 失败识别文件列表中的所有文件类型
- 分割大的 tar 文件为多份小文件:
split –b Size –d tar-file-name prefix-name
split -b 1M –d mybackup.tgz mybackup-parts
split -b 1M mybackup.tgz mybackup-parts
- 合并:
cat mybackup-parts* > mybackup.tar.gz(详见附录1.4)
cpio
- 功能:复制文件从或到归档
- cpio命令是通过重定向的方式将文件进行打包备份,还原恢复的工具,它可以解压以“.cpio”或者“.tar”结尾的文件
- cpio [选项] > 文件名或者设备名
- cpio [选项] < 文件名或者设备名
- 选项
-o 将文件拷贝打包成文件或者将文件输出到设备上
-i 解包,将打包文件解压或将设备上的备份还原到系统
-t 预览,查看文件内容或者输出到设备上的文件内容
-v 显示打包过程中的文件名称。
-d 解包生成目录,在cpio还原时,自动的建立目录(一般默认就行)
-c 一种较新的存储方式
- 示例
将etc目录备份:
find ./etc -print |cpio -ov >etc.cpio
内容预览
cpio –tv < etc.cpio
解包文件
cpio –idv < etc.cpio
cpio -idv etc/sysconfig/ksm <etc.cpio(从包文件中挑一个文件解包)
默认解包到当前目录下
总结:压缩后解压缩可能丢失某些权限,像ACL权限,ACL权限可以单独还原。
附录:
1.1 查找条件
面试题:只在第二层搜索
[[email protected] ~]#find /etc -maxdepth 2 -mindepth 2 -name "network"
/etc/sysconfig/network
最大搜索层级和最小搜索层级都为2
[[email protected] ~]#find /root -regex "\.txt$"
[[email protected] ~]#find /root -regex ".*\.txt$"
/root/ectF%/pki/nssdb/pkcs11.txt
/root/ectF%/htdig/cookies.txt
/root/ect2017-11-13/pki/nssdb/pkcs11.txt
/root/ect2017-11-13/htdig/cookies.txt
正则表达式是精确查找,第一条命令是只找文件名是.txt的文件,第二条命令是查找以.txt结尾的文件
1.2 处理动作
[[email protected] app]# find -name "*.conf" -ok cp {} /root/{}.bak \;
< cp ... ./f1.conf > ? y
< cp ... ./f2.conf > ? y
[[email protected] app]# cd /root/
[[email protected] ~]# ll
drwxr-xr-x. 2 root root 4096 Nov 7 18:01 Downloads
-rw-r--r--. 1 root root 0 Nov 28 08:53 f1.conf.bak
-rw-r--r--. 1 root root 0 Nov 28 08:53 f2.conf.bak
-ok最后的\;是固定语法,提示是否修改文件。
[[email protected] app]# find -name "*.conf" -exec cp {} /root/{}.bak \;
不提示用户直接做处理,如果是删除命令就会十分危险,而且它是将接收的参数一个给后面的cp处理,如果是很多的参数会导致命令不能处理,只有将exec改为xargs即可,它会一个一个的传参数给后面的命令处理。
1.3 压缩解压缩工具
[[email protected] app]# compress f1.conf
[[email protected] app]# ll
total 288
drwxr-xr-x. 2 root root 4096 Nov 23 20:17 amingshell
-rw-r--r--. 1 root root 264280 Nov 28 09:17 f1.conf.Z
-rw-r--r--. 1 root root 0 Nov 28 08:52 f2.conf
可以看到compress压缩完文件后就将原文件删除了
[[email protected] app]# compress -c f1.conf
] ? Z-AHw6Z%ic-n^oX T?pBǚ7qBe||1\?M.t]\?WweWxx3^?R)r;zVol!7‘?92C`0J0^/vH?;0f3h. t
[[email protected] app]# ll
total 704
drwxr-xr-x. 2 root root 4096 Nov 23 20:17 amingshell
-rw-r--r--. 1 root root 688895 Nov 28 09:17 f1.conf
-rw-r--r--. 1 root root 0 Nov 28 08:52 f2.conf
drwxr-xr-x. 3 root root 4096 Nov 27 14:58 scripts
[[email protected] app]# compress -c f1.conf >f1.conf.Z
[[email protected] app]# compress -c f1.conf >f1.conf.Z
[[email protected] app]# ll
total 964
drwxr-xr-x. 2 root root 4096 Nov 23 20:17 amingshell
-rw-r--r--. 1 root root 688895 Nov 28 09:17 f1.conf
-rw-r--r--. 1 root root 264280 Nov 28 09:27 f1.conf.Z
-rw-r--r--. 1 root root 0 Nov 28 08:52 f2.conf
加入-c选项确实没有将原文件删除,但压缩结果输出到屏幕上,没有 生成压缩文件,需要重定向到文件中才行
1.4 tar工具
[[email protected] app]# tar -cvf etc.tar /etc/
[[email protected] app]# split -b 5m etc.tar etc
[[email protected] app]# ll
-rw-r--r--. 1 root root 5242880 Nov 28 10:06 etcaa
-rw-r--r--. 1 root root 5242880 Nov 28 10:06 etcab
-rw-r--r--. 1 root root 5242880 Nov 28 10:06 etcac
-rw-r--r--. 1 root root 5242880 Nov 28 10:06 etcad
-rw-r--r--. 1 root root 5242880 Nov 28 10:06 etcae
-rw-r--r--. 1 root root 5242880 Nov 28 10:06 etcaf
-rw-r--r--. 1 root root 1730560 Nov 28 10:06 etcag
-rw-r--r--. 1 root root 33187840 Nov 28 10:04 etc.tar
将打包的文件切割成每个5m的文件
[[email protected] app]# cat etca* >etc2.tar
[[email protected] app]# ll
total 98200
drwxr-xr-x. 2 root root 4096 Nov 23 20:17 amingshell
-rw-r--r--. 1 root root 33187840 Nov 28 10:09 etc2.tar
将文件进行还原
[[email protected] app]# split -b 5M -d etc.tar etc
[[email protected] app]# ll
total 130612
drwxr-xr-x. 2 root root 4096 Nov 23 20:17 amingshell
-rw-r--r--. 1 root root 5242880 Nov 28 10:12 etc00
-rw-r--r--. 1 root root 5242880 Nov 28 10:12 etc01
-rw-r--r--. 1 root root 5242880 Nov 28 10:12 etc02
-rw-r--r--. 1 root root 5242880 Nov 28 10:12 etc03
-rw-r--r--. 1 root root 5242880 Nov 28 10:12 etc04
-rw-r--r--. 1 root root 5242880 Nov 28 10:12 etc05
-rw-r--r--. 1 root root 1730560 Nov 28 10:12 etc06
-d 选项是以数字方式进行切分