使用awk命令循环查找并修改后输出。

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用awk命令循环查找并修改后输出。相关的知识,希望对你有一定的参考价值。

文件1.dat中保存如下数据
farfaef=ferAB.CD
fefhui=fgyijiAB.CD
ferhi=AB.CD
farfaef=ferFRE.CD
fefhui=fgyijiFF.CE
ferhi=FF.CO
文件2.dat中保存了如下数据
AB.CD
FRE.CD
FF.CE
FF.CO
1.dat的这些数据中要把“=”与2.dat中间的数据全部删除了,并且在3.dat输出结果如下。
farfaef=AB.CD
fefhui=AB.CD
ferhi=AB.CD
farfaef=FRE.CD
fefhui=FF.CE
ferhi=FF.CO
(注:元素数据一列,AB.CD数据一列)
个人理解是拿2.dat的每一行,去遍历1.dat,遇到哪一行有2.dat的数据就修改后输出到3.dat

问一下,是去掉的部分都是小写字母,而保留的2.dat中的都是大写字母和"."的组合吗;如果是的话,用下面的命令去掉等号后的非大写字母和非“.”的字符就可以了,如下:

awk 'gsub(/=[^A-Z.]*/,"=");print' 1.dat > 3.dat

要是还是必须用题目上说的要求,再追问吧~


按照题目的要求的话,可以用以下命令实现:

awk -F '=' 'NR==FNRa[$0]NR!=FNRfor(i in a)if(match($2,i))print $1"="i;nextprint $0' 2.dat  1.dat > 3.dat

上面的命令遇到1.dat中的后面部分没有在2.dat中出现的情况则会输出1.dat中原来的内容。如果不需要输出这些没有被替换的内容,则去掉最后的print即可。

追问

无法输出3.dat

追答

我运行的结果,是可以的,1.dat在最后一行加入了不命中的,最后结果会输入到3.dat,运行结果如下所示:

test$ cat 1.dat 
farfaef=ferAB.CD
fefhui=fgyijiAB.CD
ferhi=AB.CD
farfaef=ferFRE.CD
fefhui=fgyijiFF.CE
ferhi=FF.CO
ferhi=awdkwAB.BB
test$ cat 2.dat 
AB.CD
FRE.CD
FF.CE
FF.CO
test$ awk -F '=' 'NR==FNRa[$0]NR!=FNRfor(i in a)if(match($2,i))print $1"="i;nextprint' 2.dat  1.dat > 3.dat
test$ cat 3.dat 
farfaef=AB.CD
fefhui=AB.CD
ferhi=AB.CD
farfaef=FRE.CD
fefhui=FF.CE
ferhi=FF.CO
ferhi=awdkwAB.BB
test$

参考技术A awk -F"=" 'NR==FNRa[$0]=$0NR>FNRfor(i in a)if($2 ~ i)print $1"="i' 2.dat 1.dat

追问

能否把没有命中2.dat任何一行的数据也一起输出呢?

追答

你给我的文本中,好像都命中了吧?

追问

1中有一些注释什么的,都一起被删除了,我一开始忘了写明

追答

其实上边那个人写的已经符合你的需求了,我俩思路是一样的。

awk -F"=" 'NR==FNRa[$0]=$0NR>FNRfor(i in a)if($2~i)print $1"="i;nextprint'

awk查找指定行指定列的数据 并输出到文件

1、打开一个文件,如下图所示。

2、然后点击右下角的行,列,如下图所示。

3、接下来会弹出一个界面,如下图所示。

4、我们直接输入数字就可以了,如下图所示。

5、接着光标就跳转到指定的数字行了。

6、最后底下也变了,如下图所示。

参考技术A

1、首先awk截取指定域,在日志的处理和监控中,经常会截取指定的字符来进行后续处理。

2、awk中的判断输出,awk -F: 'if($3>=1000)print "CommonUser:",$1' /etc/passwd如果uid大于等于1000,输出用户名,否者不输出,-F后边跟字符的分隔符,不加-F默认空格分隔。

3、NR 表示文件中的行号,表示当前是第几行,NF 表示文件中的当前行列的个数。

4、在 awk 中使用数学运算,经常会遇到需要统计相同key的value总和。

5、最后在 awk 中使用正则表达式 //中是要匹配的字符,awk '/^math/ print '  123.txt--------匹配以math开头的行。

参考技术B 每一列的表示方法以$开头,如$1代表第一列。要答应制定的列,有一个比较容易理解的编程命令:awk 'print$1"\t"$2"\t"$5' input.txt > output.txt
上面的命令中,双引号中是一个tab键,代表将指定的列用制表符隔开。input.txt是输入文件,output.txt是输出文件。上面的命令就表示将input.txt中的第1,2,5列提取出来放入output文件中。
参考技术C 获取1.txt中第二行第三列的数据,输出到2.txt。
# cat 1.txt
1 2 3
4 5 6
7 8 9
# cat 1.txt|awk 'NR==2print $3' > 2.txt
# cat 2.txt
6
参考技术D cat a.log
1 2 3
1 2 3

cat a.log | awk 'print $2' >b.log

cat b.log
2
2

以上是关于使用awk命令循环查找并修改后输出。的主要内容,如果未能解决你的问题,请参考以下文章

awk查找指定行指定列的数据 并输出到文件

Linux文本处理三剑客之awk

将awk脚本写在文件里:一种高效的awk循环循环方式

如何编写AWK命令来查找差异和比较

在grep命令后使用时不显示awk的输出[重复]

使用awk迭代unix命令nm并通过多个文件求和输出