文本处理工具sed
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了文本处理工具sed相关的知识,希望对你有一定的参考价值。
sed用法
一、sed简介
sed是一种在线编辑器,它一次处理一行内容!!!处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断循环,直到文件末尾。如果没有使用特殊命令,那么模式空间的内容会在两个循环之间清除,而保留空间的内容不会清除。使用sed处理文件,内容并没有改变,除非使用重定向存储输出。sed主要用来自动编辑一个或多个文件;简化对文件的反复操作;编写转换程序等。
二、地址定界:可以通过定址来定位所希望编辑的行
(1)#: 指定的行。比如sed -n ‘2p‘ 表示对第二行进行打印处理,p表示打印
(2)/pattern/:被此处模式所能够匹配到的每一行
比如sed -n ‘/b/p‘ 表示对包含字符b的行进行打印处理
(1)#,# :表示第#行到第#行
比如sed -n ‘2,4p‘表示打印第二行到第四行的内容
(2)#,+# :比如3,+2 表示第3行到第3+2行。用法同上。不再示例
(3)/pat1/,/pat2/:表示第一次被/part1/匹配到的行开始直到第一次被/part2/匹配到的行结束
比如:sed -n ‘/b/,/d/p‘表示打印第一次匹配到的包含字符b的行开始直到第一次匹配到的包含字符d的行结束
(4)#,/pat1/:表示从第#行开始直到第一次被/part1/匹配到的行结束。用法同上。不再示例
比如sed -n ‘1~2p‘ 表示从第1行开始,每两行匹配一行。即只打印奇数行。
sed -n ‘2~2p‘ 表示只打印偶数行
三、用法
sed [option] ‘script’ inputfile
常用选项:
-n | 不输出模式空间内容到屏幕,即不自动打印。(默认打印) |
-e | 多点编辑,对每行处理时,可以有多个Script |
-f | 把Script写到文件当中,在执行sed时-f 指定文件路径,如果是多个Script,换行写 |
-r | 支持扩展的正则表达式 |
-i | 直接将处理的结果写入文件 |
-i.bak | 在将处理的结果写入文件之前备份一份 |
(1)-n:通过下图两条命令对比可发现,-n可以取消默认打印。
(2)-e:即表示对每行进行处理时,可以有多个执行命令
(3)-f:比如在文件ab中写具体执行命令(不需要加单引号),使用-f就可以使用ab中的script对文件进行处理
(4)-r :支持扩展的正则,sed本来就支持基本正则,加上-r就支持扩展正则。
(5)-i :比如sed -n -i ‘2p‘ ap,表示将结果直接写入文件。Sed一般不改变原文件,使用-i就会修改原文件内容了。
(6)-i.bak : 比如sed -i.bak ‘p‘ ap,表示在修改原文件之前备份一份
四、编辑命令:
(1) d: 删除模式空间匹配的行
比如:sed ‘2d‘ ap 表示删除ap文件中的第二行
(2)p:打印当前模式空间内容,追加到默认输出之后
P:打印当前模式空间内容,追加至默认输出之前
比如sed ‘2p‘ ap表示打印第二行,并且把该行追加到默认输出的第二行之后
(3)a [\]text:在指定行后面追加文本,支持使用\n实现多行追加
比如sed ‘2a\123\n456‘ ap表示在第二行之后追加123\n456
(4)i [\]text:在行前面插入文本,用法同a[\]text
比如sed ‘2i\123\n456‘ ap表示在第二行之前插入123\n456
(5)c [\]text:替换行为单行或多行文本
比如sed ‘2c\123\n456‘ ap 表示替换第二行为123\n456
(6)w /path/somefile: 保存模式匹配的行至指定文件的末尾
W /path/somefile :追加模式空间的第一行到文件的末尾。
比如sed -n ‘3w /root/3.file‘ ap 表示将ap中的第三行保存至 /root/3.file
(7)r /path/somefile:读取指定文件的文本至模式空间中匹配到的行后(匹配到的每行后边都加)
比如sed ‘1,3r /root/fl.txt ‘ ap表示读取/root/fl.txt 中的内容插入到ap中匹配到第1、2、3行之后
(8)=: 为模式空间中的行打印行号
比如sed ‘=‘ ap 表示给ap文件中的每一行都打印行号 ,行号独占一行
(9)! : 模式空间中匹配行取反处理
比如sed -n ‘2!p‘ ap 表示打印除第2行之外的行
(10)g :把保留空间的内容覆盖至模式空间
比如sed ‘g‘ ap表示把ap中每行内容替换成空行(保留空间本来为空,所以把空行覆盖至模式空间)
比如sed ‘G‘ ap表示给ap文件每行之后加空行(保留空间本来为空,所以把空行追加至模式空间)
(11)n :读取下一个输入行,覆盖至模式空间。比如首先取出第一行至模式空间,本来应该处理第一行,但是使用n之后,就会取出第二行覆盖至模式空间,从而处理第二行而不是第一行。
比如sed -n ‘n;p‘ ap表示打印出2、4、6....等偶数行。(;功能同-e)
N :追加下一个输入行到模式空间。相当于模式空间读入两行内容,处理完之后,再读入两行,当有基数行时,最后一行不处理。
(12) h :把模式空间的内容覆盖至保留空间
比如sed ‘1!G;h;$!d‘ ap 表示倒序显示。因为1!G表示如果不是第一行就把保留空间的内容追加到模式空间,h表示把模式空间的内容覆盖到保留空间,$!d表示如果不是最后一行就删除模式空间的内容,所以直到最后一行进入模式空间,然后把保留空间的内容追加到模式空间,此时不需要再删除,那么模式空间的内容就被输出。
H :追加模式空间的内容到保留空间
比如 sed ‘H;g;$!d‘ ap表示在文件开头加一个空行。H表示将模式空间的内容追加到保留空间,保留空间本身是空行,所以使用g再把保留空间内容覆盖至模式空间时,在第1行前面有个空行。
(13)d :删除模式空间的行。
比如 sed ‘n;d‘ ap 表示删除偶数行,因为n的作用使模式空间只处理偶数行,其他行默认输出
D:删除模式空间的第一行。
比如sed ‘N;D‘ ap 表示只显示最后一行,因为N;D使模式空间每次进去一行就会删除前一行,直到最后一行进去删除前一行结束,然后默认打印最后一行。
五、替换标记
s///:查找替换,支持使用其它分隔符,[email protected]@@,s###替换标记
格式:s/匹配的内容/替换的内容/[替换标记]
(1)g:表示行内全面替换。
比如sed ‘s/dog/cat/g‘ ab表示查找ab文件中的dog替换为cat
而sed ‘s/dog/cat/‘ ab表示查找每一行第一个dog替换为cat
比如 sed ‘s/dog/cat/p‘ ab表示查找每一行第一个dog替换为cat,并且打印该行
比如sed ‘s/dog/cat/w 3.file‘ ab 表示替换完成之后将该行写入3.file文件
以上就是关于sed的一些常用的命令,你是否懂了呢???是骡子是马拉出来溜溜就知道啦练习一下吧!
1、删除/etc/fstab文件中所有以#开头,后面至少跟一个空白字符的行的行首的#和空白字符
sed -r ‘s/^#[[:space:]]+//‘ /etc/fstab
2、在/etc/fstab文件中不以#开头的行的行首增加#号
cat /etc/fstab |sed ‘s/^[^#]/#&/‘
3、处理/etc/fstab路径,使用sed命令取出其目录名和基名
echo /etc/fstab |sed -r ‘s#(^/.*/)([^/].*/?$)#dirname:\1\nbasename:\2#‘
以上是关于文本处理工具sed的主要内容,如果未能解决你的问题,请参考以下文章