第十章文件查找和压缩

Posted sunan

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了第十章文件查找和压缩相关的知识,希望对你有一定的参考价值。

第十章、文件查找和压缩

本章内容

  • 使用locate命令
  • 使用find命令
  • 压缩和解压缩工具

文件查找

  • 在文件系统上查找符合条件的文件
  • 文件查找:locate, find

非实时查找(数据库查找):locate

实时查找:find

locate

  • 查询系统上预建的文件索引数据库

/var/lib/mlocate/mlocate.db

  • 依赖于事先构建的索引

索引的构建是在系统较为空闲时自动进行(周期性任务),管理员手动更新数据库(updatedb)

  • 索引构建过程需要遍历整个根文件系统,极消耗资源
  • 工作特点:

查找速度快

模糊查找

非实时查找

搜索的是文件的全路径,不仅仅是文件名

可能只搜索用户具备读取和执行权限的目录

即普通用户执行需要rx权限。

locate命令

  • locate KEYWORD
  • 有用的选项

-i 不区分大小写的搜索

-n N 只列举前N个匹配项目

-r 使用正则表达式

  • 示例

搜索名称或路径中带有“conf”的文件

locate conf

使用Regex来搜索以“.conf”结尾的文件

locate -r ‘\.conf$’

注意:要执行实时查找文件内容时,需要用updatedb命令手动更新这个数据库后,才能实现实时查找;但是,会占用系统资源,在生产环境中慎用!

find

  • 实时查找工具,通过遍历指定路径完成文件查找
  • 工作特点:

查找速度略慢

精确查找

实时查找

可能只搜索用户具备读取和执行权限的目录

  • 语法:

find [OPTION]... [查找路径] [查找条件] [处理动作]

  1. 查找路径:指定具体目标路径;默认为当前目录,默认递归搜索,进入目录下所有目录和文件      
  2. 查找条件:指定的查找标准,可以文件名、大小、类型、权限等标准进行;默认为找出指定路径下的所有文件
  3. 处理动作:对符合条件的文件做操作,默认输出至屏幕
  • 查找条件

指搜索层级

-maxdepth level 最大搜索目录深度,指定目录为第1级

-mindepth level 最小搜索目录深度(详见附录1.1)

根据文件名和inode查找:

-name "文件名称":支持使用glob

*, ?, [], [^]

-iname "文件名称":不区分字母大小写

-inum n 按inode号查找

-samefile name 相同inode号的文件

-links n 链接数为n的文件

-regex "PATTERN":以PATTERN匹配整个文件路径字符串,而不仅仅是文件名称

根据属主、属组查找:

-user USERNAME:查找属主为指定用户(UID)的文件

-group GRPNAME: 查找属组为指定组(GID)的文件

-uid UserID:查找属主为指定的UID号的文件

-gid GroupID:查找属组为指定的GID号的文件

-nouser:查找没有属主的文件

-nogroup:查找没有属组的文件

根据文件类型查找:

-type TYPE:

?f: 普通文件

?d: 目录文件

?l: 符号链接文件

?s:套接字文件

?b: 块设备文件

?c: 字符设备文件

?p: 管道文件

组合条件:

与:-a

或:-o

非:-not, !

德?摩根定律:

(非 A) 或 (非 B) = 非(A 且 B)

(非 A) 且 (非 B) = 非(A 或 B)

示例:

!A -a !B = !(A -o B)

!A -o !B = !(A -a B)

根据文件大小来查找:

-size [+|-]#UNIT(UNIT代表单位)

常用单位:k, M, G,c(byte)

#UNIT: (#-1, #]

如:6k 表示(5k,6k]

-#UNIT:[0,#-1]

如:-6k 表示[0,5k]

+#UNIT:(#,∞)

如:+6k 表示(6k,∞)

根据时间戳

以“天”为单位;

-atime [+|-]#,

#: [#,#+1)

+#: [#+1,∞]

-#: [0,#)

-mtime

-ctime

以“分钟”为单位:

-amin

-mmin

-cmin

根据权限查找:

-perm [/|-]MODE

MODE: 精确权限匹配

/MODE:任何一类(u,g,o)对象的权限中只要能一位匹配即可,或关系,+ 从centos7开始淘汰

-MODE:每一类对象都必须同时拥有指定权限,与关系

0 表示不关注(和/|-组合使用时)

.find -perm 755 会匹配权限模式恰好是755的文件

.只要当任意人有写权限时,find -perm +222就会匹配

.只有当每个人都有写权限时,find -perm -222才会匹配

.只有当其它人(other)有写权限时,find -perm -002(等价/002)才会匹配

find示例

find -name snow.png

find -iname snow.png

find / -name “*.txt”

find /var –name “*log*”

find -user joe -not -group joe

find -user joe -o -user jane

find -not \( -user joe -o -user jane \)

find / -user joe -o -uid 500

找出/tmp目录下,属主不是root,且文件名不以f开头的文件

find /tmp \( -not -user root -a -not -name ‘f*‘ \) -ls

find /tmp -not \( -user root -o -name ‘f*‘ \) –ls

排除目录

示例:

查找/etc/下,除/etc/sane.d目录的其它所有.conf后缀的文件

find /etc -path ‘/etc/sane.d’ -a -prune

-o -name “*.conf”

查找/etc/下,除/etc/sane.d和/etc/fonts两个目录的其它所有.conf后缀的文件

find /etc \(–path ‘/etc/sane.d’ –o –path ’/etc/fonts’ \)

-a -prune –o -name “*.conf”

 

  • 处理动作

-print:默认的处理动作,显示至屏幕

-ls:类似于对查找到的文件执行“ls -l”命令

-delete:删除查找到的文件

-fls file:查找到的所有文件的长格式信息保存至指定文件中

-ok COMMAND {} \; 对查找到的每个文件执行由COMMAND指定的命令,对于每个文件执行命令之前,都会交互式要求用户确认(详见附录1.2)

-exec COMMAND {} \; 对查找到的每个文件执行由COMMAND指定的命令

{}: 用于引用查找到的文件名称自身

find传递查找到的文件至后面指定的命令时,查找到所有符合条件的文件一次性传递给后面的命令

参数替换xargs

  • 由于很多命令不支持管道|来传递参数,而日常工作中有这个必要,所以就有了xargs命令
  • xargs用于产生某个命令的参数,xargs 可以读入 stdin 的数据,并且以空格符或回车符将 stdin 的数据分隔成为arguments
  • 注意:文件名或者是其他意义的名词内含有空格符的情况
  • 有些命令不能接受过多参数,命令执行可能会失败,xargs可以解决
  • 示例:

ls f* |xargs rm

find /sbin -perm +700 |ls -l 这个命令是错误的

find /sbin -perm +7000 | xargs ls –l

  • find和xargs格式:find | xargs COMMAND

find示例

  • find -name “*.conf” -exec cp {} {}.orig \;

备份配置文件,添加.orig这个扩展名

  • find /tmp -ctime +3 -user joe -ok rm {} \;

提示删除存在时间超过3天以上的joe的临时文件

  • find ~ -perm -002 -exec chmod o-w {} \;

在你的主目录中寻找可被其它用户写入的文件

  • find /data –type f -perm 644 -name “*.sh” –exec chmod 755 {} \;
  • find /home –type d -ls

Gnome 搜索工具

  • 位置->搜索文件……
  • 图形化搜索工具,可搜索

?命令

?内容

?用户/组群

?大小

?修改时间

压缩、解压缩及归档工具

  • .file-roller
  • .compress/uncompress: .Z
  • .gzip/gunzip: .gz
  • .bzip2/bunzip2: .bz2
  • .xz/unxz: .xz
  • .zip/unzip
  • .tar
  • .cpio

compress/uncompress

  • compress [-dfvcVr] [-b maxbits] [file ...]

-d: 解压缩,相当于uncompress

-c: 结果输出至标准输出,不删除原文件

-v: 显示详情

  • uncompress 解压缩
  • zcat file.Z >file (解压缩,zcat file.Z将文件内容展开显示到屏幕上)

(详见附录1.3)

gzip/gunzip

  • gzip [OPTION]... FILE ...

-d: 解压缩,相当于gunzip

-c: 将压缩或解压缩的结果输出至标准输出

-#:1-9,指定压缩比,值越大压缩比越大 (默认是6)

  • zcat:不显式解压缩的前提下查看文本文件内容
  • 实例:

gzip -c messages >messages.gz

gzip -c -d messages.gz > messages

zcat messages.gz > messages

(zcat查看压缩文件内容不看后缀,但是gzip解压缩看后缀)

bzip2/bunzip2/bzcat

  • bzip2 [OPTION]... FILE ...

-k: keep, 保留原文件

-d:解压缩

-#:1-9,压缩比,默认为9

  • bzcat:不显式解压缩的前提下查看文本文件内容

xz/unxz/xzcat

  • xz [OPTION]... FILE ...

-k: keep, 保留原文件

-d:解压缩

-#:1-9,压缩比,默认为6

  • xzcat: 不显式解压缩的前提下查看文本文件内容

zip/unzip

  • 打包压缩(Windows和Linux都有,可以压缩文件夹)

zip    –r     /testdir/sysconfig      /etc/sysconfig/(-r压文件夹)

    (压缩后文件,自动带zip后缀)(压缩前文件)

  • 解包解压缩

unzip sysconfig.zip

cat /var/log/messages | zip messages -

unzip -p message > message

tar工具

  • Tar(Tape ARchive,磁带归档的缩写)
  • tar [OPTION]...

(1) 创建归档

tar -c -f /PATH/TO/SOMEFILE.tar FILE...

(2) 追加文件至归档: 注:不支持对压缩文件追加

tar -r -f /PATH/TO/SOMEFILE.tar FILE...

(3) 查看归档文件中的文件列表

tar -t -f /PATH/TO/SOMEFILE.tar

(4) 展开归档

tar -x -f /PATH/TO/SOMEFILE.tar

tar -x -f /PATH/TO/SOMEFILE.tar -C /PATH/

(5) 结合压缩工具实现:归档并压缩

-j: bzip2, -z: gzip, -J: xz

  • -T选项指定输入文件,-X选项指定包含要排除的文件列表

tar zcvf mybackup.tgz -T /root/includefilelist -X /root/excludefilelist

像:file -f filelist.txt 失败识别文件列表中的所有文件类型

  • 分割大的 tar 文件为多份小文件:

split –b Size –d tar-file-name prefix-name

split -b 1M –d mybackup.tgz mybackup-parts

split -b 1M mybackup.tgz mybackup-parts

  • 合并:

cat mybackup-parts* > mybackup.tar.gz(详见附录1.4)

cpio

  • 功能:复制文件从或到归档
  • cpio命令是通过重定向的方式将文件进行打包备份,还原恢复的工具,它可以解压以“.cpio”或者“.tar”结尾的文件
  • cpio [选项] > 文件名或者设备名
  • cpio [选项] < 文件名或者设备名
  • 选项

-o 将文件拷贝打包成文件或者将文件输出到设备上

-i 解包,将打包文件解压或将设备上的备份还原到系统

-t 预览,查看文件内容或者输出到设备上的文件内容

-v 显示打包过程中的文件名称。

-d 解包生成目录,在cpio还原时,自动的建立目录(一般默认就行)

-c 一种较新的存储方式

  • 示例

将etc目录备份:

find ./etc -print |cpio -ov >etc.cpio

内容预览

cpio –tv < etc.cpio

解包文件

cpio –idv < etc.cpio

cpio -idv etc/sysconfig/ksm <etc.cpio(从包文件中挑一个文件解包)

默认解包到当前目录下

总结:压缩后解压缩可能丢失某些权限,像ACL权限,ACL权限可以单独还原。

附录:

1.1 查找条件

面试题:只在第二层搜索

[[email protected] ~]#find /etc -maxdepth 2 -mindepth 2 -name "network"

/etc/sysconfig/network

最大搜索层级和最小搜索层级都为2

[[email protected] ~]#find /root  -regex "\.txt$"

[[email protected] ~]#find /root  -regex ".*\.txt$"

/root/ectF%/pki/nssdb/pkcs11.txt

/root/ectF%/htdig/cookies.txt

/root/ect2017-11-13/pki/nssdb/pkcs11.txt

/root/ect2017-11-13/htdig/cookies.txt

正则表达式是精确查找,第一条命令是只找文件名是.txt的文件,第二条命令是查找以.txt结尾的文件

1.2 处理动作

[[email protected] app]# find -name "*.conf" -ok cp {} /root/{}.bak \;

< cp ... ./f1.conf > ? y

< cp ... ./f2.conf > ? y

[[email protected] app]# cd /root/

[[email protected] ~]# ll

drwxr-xr-x. 2 root root 4096 Nov  7 18:01 Downloads

-rw-r--r--. 1 root root    0 Nov 28 08:53 f1.conf.bak

-rw-r--r--. 1 root root    0 Nov 28 08:53 f2.conf.bak

-ok最后的\;是固定语法,提示是否修改文件。

[[email protected] app]# find -name "*.conf" -exec cp {} /root/{}.bak \;

不提示用户直接做处理,如果是删除命令就会十分危险,而且它是将接收的参数一个给后面的cp处理,如果是很多的参数会导致命令不能处理,只有将exec改为xargs即可,它会一个一个的传参数给后面的命令处理。

1.3 压缩解压缩工具

[[email protected] app]# compress  f1.conf

[[email protected] app]# ll

total 288

drwxr-xr-x. 2 root root   4096 Nov 23 20:17 amingshell

-rw-r--r--. 1 root root 264280 Nov 28 09:17 f1.conf.Z

-rw-r--r--. 1 root root      0 Nov 28 08:52 f2.conf

可以看到compress压缩完文件后就将原文件删除了

[[email protected] app]# compress  -c f1.conf

] ? Z-AHw6Z%ic-n^oX T?pBǚ7qBe||1\?M.t]\?WweWxx3^?R)r;zVol!7‘?92C`0J0^/vH?;0f3h.  t

[[email protected] app]# ll

total 704

drwxr-xr-x. 2 root root   4096 Nov 23 20:17 amingshell

-rw-r--r--. 1 root root 688895 Nov 28 09:17 f1.conf

-rw-r--r--. 1 root root      0 Nov 28 08:52 f2.conf

drwxr-xr-x. 3 root root   4096 Nov 27 14:58 scripts

[[email protected] app]# compress -c f1.conf >f1.conf.Z

[[email protected] app]# compress  -c f1.conf >f1.conf.Z

[[email protected] app]# ll

total 964

drwxr-xr-x. 2 root root   4096 Nov 23 20:17 amingshell

-rw-r--r--. 1 root root 688895 Nov 28 09:17 f1.conf

-rw-r--r--. 1 root root 264280 Nov 28 09:27 f1.conf.Z

-rw-r--r--. 1 root root      0 Nov 28 08:52 f2.conf

加入-c选项确实没有将原文件删除,但压缩结果输出到屏幕上,没有 生成压缩文件,需要重定向到文件中才行

1.4 tar工具

[[email protected] app]# tar -cvf etc.tar /etc/

 [[email protected] app]# split -b 5m etc.tar  etc

[[email protected] app]# ll

-rw-r--r--. 1 root root  5242880 Nov 28 10:06 etcaa

-rw-r--r--. 1 root root  5242880 Nov 28 10:06 etcab

-rw-r--r--. 1 root root  5242880 Nov 28 10:06 etcac

-rw-r--r--. 1 root root  5242880 Nov 28 10:06 etcad

-rw-r--r--. 1 root root  5242880 Nov 28 10:06 etcae

-rw-r--r--. 1 root root  5242880 Nov 28 10:06 etcaf

-rw-r--r--. 1 root root  1730560 Nov 28 10:06 etcag

-rw-r--r--. 1 root root 33187840 Nov 28 10:04 etc.tar

将打包的文件切割成每个5m的文件

[[email protected] app]# cat etca* >etc2.tar

[[email protected] app]# ll

total 98200

drwxr-xr-x. 2 root root     4096 Nov 23 20:17 amingshell

-rw-r--r--. 1 root root 33187840 Nov 28 10:09 etc2.tar

将文件进行还原

[[email protected] app]# split -b 5M -d etc.tar  etc

[[email protected] app]# ll

total 130612

drwxr-xr-x. 2 root root     4096 Nov 23 20:17 amingshell

-rw-r--r--. 1 root root  5242880 Nov 28 10:12 etc00

-rw-r--r--. 1 root root  5242880 Nov 28 10:12 etc01

-rw-r--r--. 1 root root  5242880 Nov 28 10:12 etc02

-rw-r--r--. 1 root root  5242880 Nov 28 10:12 etc03

-rw-r--r--. 1 root root  5242880 Nov 28 10:12 etc04

-rw-r--r--. 1 root root  5242880 Nov 28 10:12 etc05

-rw-r--r--. 1 root root  1730560 Nov 28 10:12 etc06

-d 选项是以数字方式进行切分

以上是关于第十章文件查找和压缩的主要内容,如果未能解决你的问题,请参考以下文章

第8章,文件查找与压缩工具

Linux运维学习第四周记

文件查找和压缩

文件查找和压缩

Linux学习- 文件查找和压缩

马哥-文件查找和压缩-查找篇