Linux基础命令---显示文本grep

Posted 一生有你llx

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux基础命令---显示文本grep相关的知识,希望对你有一定的参考价值。

grep

      按照指定的模式,在文件中搜索匹配的行,将结果显示在标准输出。另外还有两个指令egrep相当于grep –E,fgrep相当于grep -F。如果没有给出文件名,那么从标准输入读取。

     此命令的适用范围:RedHat、RHEL、Ubuntu、CentOS、SUSE、openSUSE、Fedora。

 

1、语法

     grep [选项]  PATTERN files

     grep [OPTIONS]  [-e PATTERN | -f FILE]  [FILE...]

 

2、选项列表

选项

说明

-V | --version

显示命令版本信息

--help

显示帮助文档

匹配选择

 

-E | --extended-regexp

使用扩展规则表达式解释匹配模式

-F | --fixed-strings

将匹配模式看做固定字符串

-G | --basic-regexp

使用基本规则表达式解释匹配模式

-P | --perl-regexp

使用perl表达式解释匹配模式

文件和目录选择控制

 

-a | --text

忽略二进制数据

--binary-files=TYPE

如果文件的前几个字节表示该文件包含二进制数据,则假定该文件类型是TYPE。默认情况下,TYPE为二进制,grep通常输出一行消息表示二进制文件匹配,如果没有匹配则不输出消息。如果类型不匹配,grep假定二进制文件不匹配;这相当于-i选项。如果TYPE是文本,grep会像处理文本一样处理二进制文件;这相当于-a选项。警告:“grep-binary-files=text”可能会输出二进制垃圾,如果输出是终端,并且终端驱动程序将其中的一些解释为命令,则会产生严重的副作用。

-D action | --devices=ACTION

如果输入文件是一个设备文件,那么用指定的action处理。read,像普通文件一样读取设备,skip,忽略设备

-d action | --directories=ACTION

如果查找的是目录文件,那么使用指定的操作处理。read,像普通文件一样读取目录;skip,忽略目录;recursive,递归当时读取子目录下文件。

--exclude=per

忽略文件名匹配per的文件       

--exclude-from=FILE

跳过其基本名称与从FILE中读取的任何文件名全局匹配的文件。

--exclude-dir=DIR

从递归搜索中排除匹配模式DIR的目录

-I

处理二进制文件,就像它不包含匹配的数据一样;等价于“--binary-files=without-match”

--include=GLOB

只搜索其基本名称与GLOB匹配的文件

-R | -r | --recursive

递归方式读取目录下所有文件

行数控制

 

-A num | --after-context=NUM

显示匹配行以及之后指定的行数

-B num | --before-context=NUM

显示匹配行以及之前指定的行数

-C num | -NUM | --context=NUM

显示匹配行以及之前和之后的指定行数

输出行控制

 

-b | --byte-offset

在显示匹配的行之前,打印该行第一个字符的偏移位置

-H | --with-filename

为每个匹配的行显示文件名,如果有多个文件的话,这是默认操作

-h | --no-filename

显示匹配的行,但是不显示文件名。如果搜索一个文件时,这是默认操作

-n | --line-number

显示匹配的行之前,显示行号

-T | --initial-tab

确保实际行内容的第一个字符位于制表符停止上,使制表符的对齐看起来正常。

-u | --unix-byte-offsets

报告Unix样式的字节偏移量。此开关使grep报告字节偏移量,就像文件是Unix样式的文本文件一样

-Z | --null

输出一个零字节(ASCII null字符),而不是通常跟随文件名的字符。例如,“grep –lz”在每个文件名之后输出一个零字节,而不是通常的换行符。

输出控制

 

-c | --count

统计符合匹配的行数

--color[=WHEN] |  --colour[=WHEN]

用转义序列包围匹配(非空)字符串、匹配行、上下文行、文件名、行号、字节偏移量和分隔符(用于字段和上下文行组),以便在终端上显示它们的颜色。颜色由环境变量grep_colors定义。仍然支持不推荐的环境变量grep_color,但它的设置没有优先级。WHEN的有效值是never,always,auto。

-L | --files-without-match

禁止正常输出;而是打印通常不会输出的每个输入文件的名称。扫描将在第一次匹配的时候停止。

-l

显示内容符合指定匹配模式的文件名

-m num  |  --max-count=NUM

在匹配num行之后,停止搜索

-o | --only-matching

只显示匹配行的匹配字符

-q | --quite

静默模式,搜索完成之后返回0

-s | --no-messages

不显示文件不存在和文件不可读的错误信息

模式控制

 

-e parttern  |  --regexp=PATTERN

设置匹配模式

-f file  | --file=FILE

将给定的文件内容作为匹配模式

-i  |  --ignore-case

忽略大小写

-v | --invert-match

显示不符合匹配模式的行

-w | --word-regexp

显示整个字都匹配的行

-x | --line-regexp

显示整行都匹配的行

其他选项

 

--line-buffered

对输出使用行缓冲。这会导致性能损失。

--mmap

如果可能,使用mmap(2)系统调用来读取输入,而不是默认的read(2)系统调用。在某些情况下,mmap会产生更好的性能。但是,-mmap可能导致未定义的行为(包括核心转储),如果一个输入文件在grep运行时收缩,或者如果发生I/O错误。

-U | --binary

将文件视为二进制文件。

-z | --null-data

将输入视为一组行,每一行以零字节(ASCII NUL字符)结尾,而不是换行符。

 

3、环境变量

     grep的行为受到以下环境变量的影响。

     GREP_OPTIONS,此变量指定放置在任何显式选项前面的默认选项。选项规范由空格分隔。反斜杠转义下一个字符,因此它可以指定包含空格或反斜杠的选项。例如,如果GREP_OPTIONS是’--binary-files=without-match --directories=skip’,那么grep执行的时候就假设已经有了这两个选项。

     GREP_COLOR,此变量指定用于突出显示匹配(非空)文本的颜色。

     GREP_COLORS,指定用于突出显示输出的各个部分的颜色和其他属性。它的值是一个以冒号分隔的功能列表,默认为ms=01;31:mc=01;31:sl=:cx=:fn=35:ln=32:bn=32:se=36,省略了rv和ne布尔功能(即false)。支持的功能如下所示。

          sl=,用于整个选定行的SGR子字符串(即-v命令行选项省略时的匹配行,或指定-v时不匹配的行)。但是,如果指定了布尔rv功能和-v命令行选项,则它将应用于上下文匹配行。默认值为空(即终端的默认颜色对)。

          cx=,用于整个上下文行的SGR子字符串(即省略-v命令行选项时的非匹配行,或指定-v时的匹配行)。但是,如果指定了布尔RV功能和-v命令行选项,则它将适用于选定的非匹配行。默认值为空(即终端的默认颜色对)。

          rv,当指定-v命令行选项时,逆转(掉期)“sl=”和“cx=”功能的布尔值。缺省值为false(即省略了功能)。

          mt=01;31,用于匹配任何行中的非空文本的sgr子字符串。(这仅在省略-v命令行选项时使用。)当启动时,sl=(或cx=)能力的效果保持活跃。默认值是当前行背景上的粗体红色文本前景。

          ms=01;31,用于匹配选定行中的非空文本的sgr子字符串。(这仅在省略-v命令行选项时使用。)当启动时,sl=(或cx=)能力的效果保持活跃。默认值是当前行背景上的粗体红色文本前景。

          mc=01;31,用于匹配上下文行中的非空文本的sgr子字符串。(这仅在省略-v命令行选项时使用。)当启动时,sl=(或cx=)能力的效果保持活跃。默认值是当前行背景上的粗体红色文本前景。

          fn=35,用于任何内容行前缀的文件名的SGR子字符串。默认值是终端默认背景上的洋红色文本前景。

          ln=32,任何内容行前缀的行号的SGR子字符串。默认值是终端默认背景上的绿色文本前景。

          bn=32,用于任何内容行前缀的字节偏移的SGR子字符串。默认值是终端默认背景上的绿色文本前景。

          se=36,当指定了非零上下文(--),SGR子字符串用于在选定的行字段(:)、上下文行字段之间(-)和相邻行组之间插入分隔符。默认值是终端默认背景上的青色文本前景。

          ne,布尔值,该值防止在每次彩色项结束时使用擦除入行(EL)对右(33[K]清除到行尾的值。这是在不支持EL的终端上需要的。对于没有应用Back_COLOR_ERASE(BCE)布尔终止功能的终端、所选择的高亮颜色不影响背景、或者当EL太慢或导致过多闪烁时,它在其他情况下是有用的。默认值为false(即省略功能)

     LC_ALL, LC_COLLATE, LANG,这些变量指定LC_COLLATE类别的区域设置,该类别确定用于解释范围表达式(如[a-z])的排序序列。

     LC_ALL, LC_CTYPE, LANG,这些变量指定LC_CTYPE类别的区域设置,它决定字符的类型,例如,哪些字符是空格。

     LC_ALL, LC_MESSAGES, LANG,这些变量指定LC_MESSAGES类别的区域设置,它确定grep用于消息的语言。默认的C语言环境使用美式英语消息。

     POSIXLY_CORRECT,如果设置,grep的行为与POSIX.2所要求的一样;否则,grep的行为更像其他GNU程序。POSIX.2要求必须将文件名后面的选项视为文件名;默认情况下,这些选项被排到操作数列表的前面,并被视为选项。此外,POSIX.2还要求将未被承认的选项诊断为“非法”,但由于它们并不真正违反法律,默认情况是将它们诊断为“无效”。POSIXLY_RIDER还禁用_N_GNU_NOOPTION_ARGV_LANGS_,如下所述。

     _N_GNU_nonoption_argv_flags_,(这里N是grep的数字进程ID。)如果此环境变量值的ith字符为1,则不要将grep的ith操作数视为选项,即使它似乎是选项之一。shell可以为其运行的每个命令在环境中放置此变量,指定哪些操作数是文件名通配符展开的结果,因此不应被视为选项。此行为仅在GNU C库中可用,且仅在未设置POSIXLY_RIDER时才可用。

 

4、退出码

     通常,如果找到选定的行,则退出状态为0,否则为1。但是,如果发生错误,退出状态为2,除非使用-q、--quite、--slient选项,并找到选定的行。但是,请注意,对于grep、CMP和diff等程序,POSIX只要求在出现错误时的退出状态大于1;因此,出于可移植性的考虑,建议使用对此一般条件进行测试的逻辑,而不是与2严格相等的逻辑。

 

5、实例

     1)显示文件中以2开头的行

[[email protected] weijie]# cat 2.c

123

23

212

[[email protected] weijie]# grep ^2 2.c         //显示以2开头的行

23

212

     2)显示不包含23的行 

[[email protected] weijie]# grep -v 23 2.c

212

     3)显示整个字都匹配的行 

[[email protected] weijie]# grep -w 23 2.c

23

以上是关于Linux基础命令---显示文本grep的主要内容,如果未能解决你的问题,请参考以下文章

Linux基础命令之grep

linux基础命令

Linux

linux基础命令 grep

3.linux基础(下)

Linux安全基础:grep命令的使用