使用awk命令循环查找并修改后输出。

Posted 2023-04-04

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了使用awk命令循环查找并修改后输出。相关的知识，希望对你有一定的参考价值。

文件1.dat中保存如下数据
farfaef=ferAB.CD
fefhui=fgyijiAB.CD
ferhi=AB.CD
farfaef=ferFRE.CD
fefhui=fgyijiFF.CE
ferhi=FF.CO
文件2.dat中保存了如下数据
AB.CD
FRE.CD
FF.CE
FF.CO
1.dat的这些数据中要把“=”与2.dat中间的数据全部删除了，并且在3.dat输出结果如下。
farfaef=AB.CD
fefhui=AB.CD
ferhi=AB.CD
farfaef=FRE.CD
fefhui=FF.CE
ferhi=FF.CO
（注：元素数据一列，AB.CD数据一列）
个人理解是拿2.dat的每一行，去遍历1.dat，遇到哪一行有2.dat的数据就修改后输出到3.dat

问一下，是去掉的部分都是小写字母，而保留的2.dat中的都是大写字母和"."的组合吗；如果是的话，用下面的命令去掉等号后的非大写字母和非“.”的字符就可以了，如下:

awk 'gsub(/=[^A-Z.]*/,"=");print' 1.dat > 3.dat

要是还是必须用题目上说的要求，再追问吧~

按照题目的要求的话，可以用以下命令实现：

awk -F '=' 'NR==FNRa[$0]NR!=FNRfor(i in a)if(match($2,i))print $1"="i;nextprint $0' 2.dat 1.dat > 3.dat

上面的命令遇到1.dat中的后面部分没有在2.dat中出现的情况则会输出1.dat中原来的内容。如果不需要输出这些没有被替换的内容，则去掉最后的print即可。

追问

无法输出3.dat

追答

我运行的结果，是可以的，1.dat在最后一行加入了不命中的，最后结果会输入到3.dat，运行结果如下所示：

test$ cat 1.dat
farfaef=ferAB.CD
fefhui=fgyijiAB.CD
ferhi=AB.CD
farfaef=ferFRE.CD
fefhui=fgyijiFF.CE
ferhi=FF.CO
ferhi=awdkwAB.BB
test$ cat 2.dat
AB.CD
FRE.CD
FF.CE
FF.CO
test$ awk -F '=' 'NR==FNRa[$0]NR!=FNRfor(i in a)if(match($2,i))print $1"="i;nextprint' 2.dat 1.dat > 3.dat
test$ cat 3.dat
farfaef=AB.CD
fefhui=AB.CD
ferhi=AB.CD
farfaef=FRE.CD
fefhui=FF.CE
ferhi=FF.CO
ferhi=awdkwAB.BB
test$

参考技术A awk -F"=" 'NR==FNRa[$0]=$0NR>FNRfor(i in a)if($2 ~ i)print $1"="i' 2.dat 1.dat

追问

能否把没有命中2.dat任何一行的数据也一起输出呢？

追答

你给我的文本中，好像都命中了吧？

追问

1中有一些注释什么的，都一起被删除了，我一开始忘了写明

追答

其实上边那个人写的已经符合你的需求了，我俩思路是一样的。

awk -F"=" 'NR==FNRa[$0]=$0NR>FNRfor(i in a)if($2~i)print $1"="i;nextprint'

awk查找指定行指定列的数据并输出到文件

1、打开一个文件，如下图所示。

2、然后点击右下角的行，列，如下图所示。

3、接下来会弹出一个界面，如下图所示。

4、我们直接输入数字就可以了，如下图所示。

5、接着光标就跳转到指定的数字行了。

6、最后底下也变了，如下图所示。

参考技术A

1、首先awk截取指定域，在日志的处理和监控中，经常会截取指定的字符来进行后续处理。

2、awk中的判断输出，awk -F: 'if($3>=1000)print "CommonUser:",$1' /etc/passwd如果uid大于等于1000，输出用户名，否者不输出，-F后边跟字符的分隔符,不加-F默认空格分隔。

3、NR 表示文件中的行号，表示当前是第几行，NF 表示文件中的当前行列的个数。

4、在 awk 中使用数学运算，经常会遇到需要统计相同key的value总和。

5、最后在 awk 中使用正则表达式 //中是要匹配的字符，awk '/^math/ print ' 123.txt--------匹配以math开头的行。

参考技术B 每一列的表示方法以$开头，如$1代表第一列。要答应制定的列，有一个比较容易理解的编程命令：awk 'print$1"\t"$2"\t"$5' input.txt > output.txt
上面的命令中，双引号中是一个tab键，代表将指定的列用制表符隔开。input.txt是输入文件，output.txt是输出文件。上面的命令就表示将input.txt中的第1，2，5列提取出来放入output文件中。参考技术C 获取1.txt中第二行第三列的数据，输出到2.txt。
# cat 1.txt
1 2 3
4 5 6
7 8 9
# cat 1.txt|awk 'NR==2print $3' > 2.txt
# cat 2.txt
6 参考技术D cat a.log
1 2 3
1 2 3

cat a.log | awk 'print $2' >b.log

cat b.log
2
2

以上是关于使用awk命令循环查找并修改后输出。的主要内容，如果未能解决你的问题，请参考以下文章

使用awk命令循环查找并修改后输出。

awk查找指定行指定列的数据 并输出到文件

awk查找指定行指定列的数据并输出到文件