grep及正则表达式

Posted 生信菜鸟团

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了grep及正则表达式相关的知识,希望对你有一定的参考价值。

这是我在寒假学习Linux时所做的笔记,若有什么不足之处大家可以留言呐~

grep及正则表达式

grep, egrep, fgrep

grep

grep(global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。

  • Pattern:由文本字符和正则表达式的元字符组合而成匹配条件

  • grep [options] PATTERN [FILE…]

-i 忽略字符大小写的差别。
--color 用颜色突出显示匹配的字符。
-v 反转查找,显示没有被模式匹配到的行。
-o 只输出文件中匹配到的部分。

元字符:注意与路径匹配(glob)中的区别

.:匹配任意单个字符
[]:匹配指定范围内的任意单个字符
[^]:匹配指定范围外的任意单个字符

字符集合:外面还要加 [ ]

[:digit:], [:lower:], [:upper:], [:punct:], [:space:], [:alpha:], [:alnum:]

字符匹配次数(贪婪模式,即尽可能长得匹配):

*:匹配其前面的字符任意次
.*:任意长度的任意字符
\?:匹配其前面的字符1次或0次
\{m,n\}:匹配其前面的字符至少m次,至多n次
\{1,\}:至少1次
\:用于转义

位置锚定:

^:锚定行首,此字符后面的任意内容必须出现在行首
$:锚定行尾,此字符前面的任意内容必须出现在行尾
^$:空白行
\<或\b:锚定词首,其后面的任意字符必须作为单词首部出现
\>或\b:锚定词尾,其前面的任意字符必须作为单词的尾部出现

分组:

\(\)
\(ab\)* :把 ab 当做一个整体

分组的目的是为了后向引用

\1:引用第一个左括号以及与之对应的右括号所包括的所有内容
\2:引用第二个左括号以及与之对应的右括号所包括的所有内容
\3:引用第三个左括号以及与之对应的右括号所包括的所有内容

egrep 就是 grep -E

fgrep:(fast) 不支持正则表达式

正则表达式:REGular EXPression, REGEXP

  • Basic REGEXP:基本

  • Extended REGEXP:扩展

基本正则表达式:

.:匹配任意单个字符
[]:匹配指定范围内的任意单个字符
[^]:匹配指定范围外的任意单个字符

次数匹配:

*:匹配其前面的字符任意次
\?:0或1次
\{m,n\}:匹配其前面的字符至少m次,至多n次
.*:任意长度的任意字符

锚定:

^:锚定行首,此字符后面的任意内容必须出现在行首
$:锚定行尾,此字符前面的任意内容必须出现在行尾
^$:空白行
\<或\b:锚定词首,其后面的任意字符必须作为单词首部出现
\>或\b:锚定词尾,其前面的任意字符必须作为单词的尾部出现

分组:

\(\)
\(ab\)* :把 ab 当做一个整体

分组的目的是为了后向引用

\1:引用第一个左括号以及与之对应的右括号所包括的所有内容
\2:引用第二个左括号以及与之对应的右括号所包括的所有内容
\3:引用第三个左括号以及与之对应的右括号所包括的所有内容

grep:使用基本正则表达式定义的模式来过滤文本的命令;

-E 将范本样式为延伸的普通表示法来使用,意味着使用能使用扩展正则表达式。
-A<显示列数> 除了显示符合范本样式的那一行之外,并显示该行之后的内容。
-B<显示列数> 除了显示符合范本样式的那一行之外,并显示该行之前的内容。
-C<显示列数> 除了显示符合范本样式的那一行之外,并显示该行前后行的内容。

扩展正则表达式:

字符匹配:与之前一样

次数匹配:加上以下内容

+:匹配其前面的字符至少1次
{m,n}:不用转义

位置锚定:与之前一样

分组:与之前一样(不用转义)

或者:

|:or
C|cat:C或cat
(C|c)at:Cat或cat



猜你喜欢

▼ 如果你生信基本技能已经入门,需要提高自己,请关注下面的生信技能树,看我们是如何完善生信技能,成为一个生信全栈工程师。

grep及正则表达式
grep及正则表达式

▼ 如果你是初学者,请关注下面的生信菜鸟团,了解生信基础名词,概念,扎实的打好基础,争取早日入门。

grep及正则表达式


      

    

以上是关于grep及正则表达式的主要内容,如果未能解决你的问题,请参考以下文章

正则表达式和grep用法,及文本查看处理工具

grep文本查看工具及正则表达式

正则表达式及grep

grep及正则表达式

grep及正则表达式

grep命令及正则表达式