grep及正则表达式

Posted 2021-05-02 生信菜鸟团

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了grep及正则表达式相关的知识，希望对你有一定的参考价值。

这是我在寒假学习Linux时所做的笔记，若有什么不足之处大家可以留言呐~

grep及正则表达式

grep, egrep, fgrep

grep

grep（global search regular expression(RE) and print out the line，全面搜索正则表达式并把行打印出来）是一种强大的文本搜索工具，它能使用正则表达式搜索文本，并把匹配的行打印出来。

Pattern：由文本字符和正则表达式的元字符组合而成匹配条件
grep [options] PATTERN [FILE…]

-i 忽略字符大小写的差别。
--color 用颜色突出显示匹配的字符。
-v 反转查找，显示没有被模式匹配到的行。
-o 只输出文件中匹配到的部分。

元字符：注意与路径匹配（glob）中的区别

.：匹配任意单个字符
[]：匹配指定范围内的任意单个字符
[^]：匹配指定范围外的任意单个字符

字符集合：外面还要加 [ ]

[:digit:], [:lower:], [:upper:], [:punct:], [:space:], [:alpha:], [:alnum:]

字符匹配次数（贪婪模式，即尽可能长得匹配）：

*：匹配其前面的字符任意次
.*：任意长度的任意字符
\?：匹配其前面的字符1次或0次
\{m,n\}：匹配其前面的字符至少m次，至多n次
\{1,\}：至少1次
\：用于转义

位置锚定：

^：锚定行首，此字符后面的任意内容必须出现在行首
$：锚定行尾，此字符前面的任意内容必须出现在行尾
^$：空白行
\<或\b：锚定词首，其后面的任意字符必须作为单词首部出现
\>或\b：锚定词尾，其前面的任意字符必须作为单词的尾部出现

分组：

\(\)
\(ab\)* ：把 ab 当做一个整体

分组的目的是为了后向引用

\1：引用第一个左括号以及与之对应的右括号所包括的所有内容
\2：引用第二个左括号以及与之对应的右括号所包括的所有内容
\3：引用第三个左括号以及与之对应的右括号所包括的所有内容

`egrep` 就是 `grep -E`

fgrep：(fast) 不支持正则表达式

正则表达式：REGular EXPression, REGEXP

Basic REGEXP：基本
Extended REGEXP：扩展

基本正则表达式：

.：匹配任意单个字符
[]：匹配指定范围内的任意单个字符
[^]：匹配指定范围外的任意单个字符

次数匹配：

*：匹配其前面的字符任意次
\?：0或1次
\{m,n\}：匹配其前面的字符至少m次，至多n次
.*：任意长度的任意字符

锚定：

^：锚定行首，此字符后面的任意内容必须出现在行首
$：锚定行尾，此字符前面的任意内容必须出现在行尾
^$：空白行
\<或\b：锚定词首，其后面的任意字符必须作为单词首部出现
\>或\b：锚定词尾，其前面的任意字符必须作为单词的尾部出现

分组：

\(\)
\(ab\)* ：把 ab 当做一个整体

分组的目的是为了后向引用

\1：引用第一个左括号以及与之对应的右括号所包括的所有内容
\2：引用第二个左括号以及与之对应的右括号所包括的所有内容
\3：引用第三个左括号以及与之对应的右括号所包括的所有内容

grep：使用基本正则表达式定义的模式来过滤文本的命令；

-E 将范本样式为延伸的普通表示法来使用，意味着使用能使用扩展正则表达式。
-A<显示列数> 除了显示符合范本样式的那一行之外，并显示该行之后的内容。
-B<显示列数> 除了显示符合范本样式的那一行之外，并显示该行之前的内容。
-C<显示列数> 除了显示符合范本样式的那一行之外，并显示该行前后行的内容。

扩展正则表达式：

字符匹配：与之前一样

次数匹配：加上以下内容

+：匹配其前面的字符至少1次
{m,n}：不用转义

位置锚定：与之前一样

分组：与之前一样（不用转义）

或者：

|：or
C|cat：C或cat
(C|c)at：Cat或cat

grep及正则表达式

grep及正则表达式

grep, egrep, fgrep

grep

元字符：注意与路径匹配（glob）中的区别

字符集合：外面还要加 [ ]

字符匹配次数（贪婪模式，即尽可能长得匹配）：

位置锚定：

分组：

egrep 就是 grep -E

fgrep：(fast) 不支持正则表达式

正则表达式：REGular EXPression, REGEXP

基本正则表达式：

次数匹配：

锚定：

分组：

grep：使用基本正则表达式定义的模式来过滤文本的命令；

扩展正则表达式：

或者：

`egrep` 就是 `grep -E`