Linux下的强大工具之一sed（转）,Shell必备

Posted 2020-08-04 losbyday

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Linux下的强大工具之一sed（转）,Shell必备相关的知识，希望对你有一定的参考价值。

sed命令基本用法
sed是一个非交互式文本编辑器，它可以对文本文件和标准输入进行编辑，标准输入可以是来自键盘输入、文件重定向、字符串、变量、来自管道的文本等等。
sed从文本的一个文本行或标准输入中读取数据，将其复制到缓存区，然后读取命令行或脚本的第一个命令，对此命令要求的行号进行编辑，重复此过程，直到命令行或脚本中所有命令都执行完了。sed可以一次性处理所有的编辑命令，非常高效

sed适用于下面三种场合：
* 编辑相对于交互式文本编辑器而言太大的场合
* 编辑命令太复杂，在交互式文本编辑器中难以输入的情况
* 对文件扫描一遍，但是需要执行多个编辑函数的情况

sed只是对缓存区中原始文件的副本进行编辑，并不编辑原始文件。因此，如果需要保存更改内容，需要将输出重定向到另一个文件，可以使用下面的命令：
sed ‘sed命令‘ input_file > result_file
或者还有另一种方法就是 -w 选项，这个后面讲到

有三种方式调用sed：
① 直接在shell命令行上调用
# sed [选项] ‘sed命令‘ 输入文件
② 将sed命令插入脚本文件后，通过sed命令调用脚本：
# sed [选项] -f sed脚本文件名输入文件
③ 将sed命令写入脚本文件后，将其+x变成可执行
./sed脚本文件输入文件
第三种方式需要在文件头部加上 #!/bin/sed

sed命令的常用选项：
-n 不打印所有行到标准输出
-e 表示将下一个字符串解析为sed编辑命令，如果只传递一个编辑命令，-e可以省略
-f 表示正在调用sed脚本文件

sed命令通常由定位文本行和sed编辑命令两部分组成，sed编辑命令对定位到的行进行各种编辑处理
sed提供两种方式定位文本行：
* 使用行号，指定一行或者行号范围
* 使用正则表达式

sed命令定位文本行的方法：


选项	意义
x	x为指定行号
x,y	指定从x到y的行号范围
/pattern/	查询包含模式的行
/pattern/pattern/	查询包含两个模式的行
/pattern/,x	从与pattern的匹配行到x号行之间的行
x,/pattern/	从x号行到与pattern的匹配行之间的行
x,y!	查询不包含x和y行号的行

===================================分割线=======================
sed编辑命令表

选项	意义
p	打印匹配行
=	打印匹配行号
a\	在定位行之后追加文本信息
i\	在定位行之前插入文本信息
d	删除定位行
c\	用新文本替换定位行
s	使用替换模式替换相应的模式
r	从另一个文件中读文本
w	将文本写入到另一个文件中
y	变换字符
q	第一个模式匹配完成后退出
l	显示与八进制ASCII码等价的控制字符
{}	在定位行执行的命令组
n	读取下一个输入行，用下一个命令处理新的行
h	将模式缓存区的文本复制到保持缓存区
H	将模式缓存区的文本追加到保持缓存区
x	互换模式缓存区和保持缓存区的内容
g	将保持缓存区的内容复制到模式缓存区
G	将保持缓存区的内容追加到模式缓存区

========================分割线============================
各个选项和编辑命令详解：
1，sed命令的-n选项和p命令
# sed -n ‘1p‘ input
# sed ‘1p‘ input
从输出可以看出，加了-n后标准输出上只有第一行打印出来了，而不加-n时候，先打印第一行，然后打印整个文件内容。所以-n选项的意义是：不打印sed编辑内容也就是input的全部内容。只打印匹配的行
# sed -n ‘3,6p‘ input --> 打印从3到6行
# sed -n ‘/certificate/p‘ input --> 打印匹配模式行，注意大小写是敏感的

2，sed命令的-e选项
由于sed不支持同时带多个编辑命令的用法，因此需要用-e选项指定每个编辑命令
# sed -n -e ‘/Certificate/p‘ -e ‘/Certificate/=‘ input

3，sed命令的-f选项
-f选项只有调用sed脚本文件时才起作用，追加文本、插入文本、修改文本、删除文本和替换文本等功能往往需要几条sed命令才能完成，所以，往往将这些命令写入sed脚本，然后调用sed脚本来完成。
下面是这个sed的脚本：
Sed代码 1. #!/bin/sed -f
2. /file:/a\
3. We append a new line.\
4. We append another line.
注：上面的/file:/a\中的\表示在换新行后添加内容，而下面内容中的\也表示换行。

4.2.2 sed文本定位的一组例子
1. 匹配元字符
如果目标字符串中包含元字符，需要使用转义符\屏蔽其特殊意义。
# sed -n ‘/\./p‘ input --> 打印含有.的行
2. 使用元字符进行匹配
sed可以灵活使用正则表达式的元字符进行匹配，不过注意的是：$在正则表达式中表示行尾，但是在sed命令中却表示最后一行，而写在//中间的$就表示行尾了，哈哈。
# sed -n ‘$p‘ input --> 打印最后一行
# sed -n ‘/^$/p‘ input -> 打印空行
3. !符号
!表示取反，也就是不满足条件的时候就处理
# sed -n ‘/.*this/!p‘ input --> 打印不包含this的行
# sed -n ‘3,6!p‘ input --> 打印不在3至6行间的行

4.2.3 sed基本编辑命令的一组例子
1. 插入文本
插入文本和追加文本类似，区别仅仅是追加文本是在匹配行的后面插入，而插入文本是在匹配行的前面插入
sed插入文本符号位i\，插入文本的格式为：
sed ‘指定地址 i\text‘ 输入文件
新建名为insert.sed的脚本，内容如下：
Bash代码 1. #!/bin/sed -f
2. # this is comment
3. # date : 2013/06/02
4. # author : xiongneng
5. /this is/i\
6. We insert a new line #插入的文本内容

2. 修改文本
修改文本是指将所匹配的问本行用新文本代替，也就是只能整行替换，sed修改文本符号位c\
sed ‘指定行 c\text‘ 输入文件

3. 删除文本
sed删除文本命令可以将指定行或指定行范围进行删除，sed的删除文本符号为d
sed ‘指定行 d‘ 输入文件

4.替换文本
sed替换文本将所匹配的文本行中找到的字符串用新的字符串去代替，常用。而上面的修改文本只能整行，sed替换文本符号为s
sed -n ‘s/被替换的字符串/新的字符串/p‘ --> 只替换每行中第一次找到的
sed -n ‘s/被替换的字符串/新的字符串/gp‘ --> 替换每行中所有找到的
sed -n ‘s/被替换的字符串/新的字符串/np‘ --> 替换每行中第n次找到的
sed替换文本中有个重要的符号&，它表示保存被替换的字符串以供调用。
比如下面两条命令等级：（都是将this字符串用括号括起来）
# sed -n ‘s/this/(&)/gp‘ input
# sed -n ‘s/this/(this)/gp‘ input

5. 写入到一个新文件
上面提到的都是对缓存区中输入文件的复制内容进行编辑，如果要保存编辑结果，需要将编辑后的文本重定向到另一个文件，sed写入文件符号为w，基本格式为：
# sed -n ‘1,5 w output‘ input
# sed -n ‘/this/2 output‘ input
# sed -n ‘s/this/(&)/gw output‘ input --> 将this加上括号后，匹配行写入到output中去
注：这里写到新文件中的只有匹配的行修改后的数据，如果要整个文件内容都写进去，使用重定向>> 或者>

6. 从文件中读入文本内容
sed命令还可以将其他文件中的内容读入，并附加在指定地址后，sed读入文件的符号为r
# sed ‘/this/r otherfile‘ input

7. 退出命令
sed命令的q选项表示完成指定地址匹配后立即退出
# sed -n ‘/this/p‘ input --> 打印出匹配的全部字符串
# sed -n -e ‘/this/p‘ -e ‘/this/q‘ test.txt --> 找到第一个匹配的打印后就立即退出

8. 变换命令
sed命令的y选项表示字符变换，它将一系列的字符变换为相应的字符，逐个处理的
# sed ‘y/被变换的字符序列/变换的字符序列/‘ 输入文件
# sed ‘y/12345/ABCDE‘ input --> 将input中1变成A，2变成B，3变成C，4变成D，5变成E

9. 显示控制字符
sed 1命令可以显示出文件中的控制字符，比如退格键、F1键、Shift键等
# sed -n ‘1,$1‘ input

10. 在定位行执行命令组
sed编辑命令中的{}可以指定在定位行上所执行的命令组，它的作用与sed的-e选项类似，都是为了在定位行执行多个编辑命令。
下面的命令等价：
# sed -n -e ‘/this/p‘ -e ‘/this/q‘ test.txt
# sed -n ‘/this/{p;q}‘ test.txt -->显然这个更NB点

4.2.4 sed高级编辑命令的一组例子
1. 处理匹配行的下一行
sed编辑命令n的意义是读取下一个输入行，用n后面的一个命令处理该行，由于此时通常有个多个编辑命令，所以命令n需要与{}配合使用
# sed ‘/this is/{n;s/her/him/;}‘ input --> 找到this is关键词那行，然后将它下一行的her替换成him

2. sed缓存区的处理
前面提到的所有编辑命令都是将输入文件复制到缓存区，对缓存区的复制内容进行处理。实际上，sed有两个缓存区，模式缓存区 Pattern Buffer 和保持缓存区 Hold Buffer。前面都是Pattern Buffer，而保持缓存区是另一个内存空间，sed的一些编辑命令可以对保持缓存区进行处理，并与模式缓存区的内容互换
# sed h、x、G命令的用法
# sed ‘/subject/h; /object/x; $G‘ input
解释下：
第一个h命令是将模式缓存区内容复制到保持缓存区，也就是说当找到subject的行的时候，就将该行复制到Hold Buffer，如果该行有object关键词就将模式缓存区和保持缓存内容互换后输出模式缓存区内容，第三条命令表示如果是到了最后一行，就直接输出保持缓存区内容。

h和H、g和G是两组对应的命令
h和H命令是将模式缓存区内容替换掉保持缓存区内容，不过h是副本，即将保持缓存区的就内容覆盖掉，而H是追加，即在保持缓存区内容上增加新的内容
g和G是将保持缓存区内容替换掉模式缓存区内容，同样，g是副本、G是追加。

3.利用分号;分割多个编辑命令，这个比起-e选项更NB一点。^_^
# sed ‘/subject/h; /object/x; $G‘ input

以上是关于Linux下的强大工具之一sed（转）,Shell必备的主要内容，如果未能解决你的问题，请参考以下文章

Shell文本处理工具(Linux三剑客 grep sed awk )

linux_awk（一)

linux里面的sed命令怎么用,做啥的?请详细说明

linux shell基础awk命令(编辑中)

linux sed使用（转）