正则表达式工具(上)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则表达式工具(上)相关的知识,希望对你有一定的参考价值。

grep

1)查找特定字符

-n 显示行号

-i 不区分大小写

-v 反向查找

技术图片

技术图片

技术图片

2)利用中括号“[]”来查找集合字符

技术图片

技术图片

技术图片

技术图片

技术图片

技术图片

技术图片

3)查找行首“^”与行尾字符“$”

技术图片

技术图片

技术图片

技术图片

技术图片

*4)查找任意一个字符“.”与重复字符“”**

技术图片

技术图片

技术图片

技术图片

5)查找连续字符范围“{}”

技术图片

技术图片

技术图片
技术图片

egrep

常见元字符如下

  • 作用:重复一个或者一个以上的前一个字符

? 作用:零个或者一个的前一个字符

| 作用:使用或者(or)的方式找出多个字符

() 作用:查找“组”字符串

()+ 作用:辨别多个重复的组

技术图片

技术图片

技术图片
技术图片

技术图片
技术图片

sed

sed(Stream EDitor)是一个强大而简单的文本解析转换工具,可以读取文本,并根据指定的条件对文本内容进行编辑(删除、替换、添加、移动等),最后输出所有行或者仅输出处理的某些行。sed 也可以在无交互的情况下实现相当复杂的文本处理操作,被广泛应用于 Shell 脚本中,用以完成各种自动化处理任务。

sed 的工作流程主要包括读取、执行和显示三个过程。

读取:sed 从输入流(文件、管道、标准输入)中读取一行内容并存储到临时的缓冲区中(又称模式空间,pattern space)。
执行:默认情况下,所有的 sed 命令都在模式空间中顺序地执行,除非指定了行的地址,否则 sed 命令将会在所有的行上依次执行。
显示:发送修改后的内容到输出流。再发送数据后,模式空间将会被清空。
在所有的文件内容都被处理完成之前,上述过程将重复执行,直至所有内容被处理完。~~

sed 命令常见用法
通常情况下调用 sed 命令有两种格式,如下所示。其中,“参数”是指操作的目标文件,当存在多个操作对象时用,文件之间用逗号“,”分隔;而 scriptfile 表示脚本文件,需要用“-f”选项指定,当脚本文件出现在目标文件之前时,表示通过指定的脚本文件来处理输入的目标文件。

常见的 sed 命令选项主要包含以下几种。

?-e 或--expression=:表示用指定命令或者脚本来处理输入的文本文件。
?-f 或--file=:表示用指定的脚本文件来处理输入的文本文件。
?-h 或--help:显示帮助。
?-n、--quiet 或 silent:表示仅显示处理后的结果。
?-i:直接编辑文本文件。

常见的操作包括以下几种。

?a:增加,在当前行下面增加一行指定内容。
?c:替换,将选定行替换为指定内容。
?d:删除,删除选定的行。
?i:插入,在选定行上面插入一行指定内容。
?p:打印。
?s:替换,替换指定字符。
?y:字符转换。

1)输出符合条件的文本(p 表示正常输出)

技术图片

技术图片
技术图片
技术图片

技术图片

技术图片

技术图片

技术图片
技术图片

技术图片

2)删除符合条件的文本(d)

技术图片
技术图片

技术图片

技术图片
3)替换符合条件的文本

sed ‘s/the/THE/‘ test.txt //将每行中的第一个the 替换为 THE
sed ‘s/l/L/3‘ test.txt //将每行中的第 3 个l 替换为L
sed ‘s/the/THE/g‘ test.txt //将文件中的所有the 替换为THE
sed ‘s/o//g‘ test.txt //将文件中的所有o 删除(替换为空串)
sed ‘s/^/#/‘ test.txt //在每行行首插入#号
sed ‘/the/s/^/#/‘ test.txt //在包含the 的每行行首插入#号
sed ‘s/$/EOF/‘ test.txt //在每行行尾插入字符串EOF
sed ‘3,5s/the/THE/g‘ test.txt //将第 3~5 行中的所有the 替换为 THE
sed ‘/the/s/o/O/g‘ test.txt //将包含the 的所有行中的o 都替换为 O

技术图片

技术图片
技术图片

4)迁移符合条件的文本
其中,H,复制到剪贴板;g、G,将剪贴板中的数据覆盖/追加至指定行;w,保存为文件;r,读取指定文件;a,追加指定内容。

sed ‘/the/{H;d};$G‘ test.txt //将包含the 的行迁移至文件末尾,{;}用于多个操作

sed ‘1,5{H;d};17G‘ test.txt //将第 1~5 行内容转移至第 17 行后

sed ‘/the/w out.file‘ test.txt //将包含the 的行另存为文件out.file

sed ‘/the/r /etc/hostname‘ test.txt //将文件/etc/hostname 的内容添加到//包含the 的每行以后

sed ‘3aNew‘ test.txt //在第 3 行后插入一个新行,内容为 New

sed ‘/the/aNew‘ test.txt //在包含the 的每行后插入一个新行,内容为 New

sed ‘3aNew1 New2‘ test.txt //在第 3 行后插入多行内容,中间的 表示换行

技术图片

技术图片
技术图片

技术图片

以上是关于正则表达式工具(上)的主要内容,如果未能解决你的问题,请参考以下文章

正则表达式笔记

linux下的grep,egrep及正则表达式

正则表达式工具(上)

半小时学会正则表达式(上)

正则表达式引发的惨案

grep与正则表达式