AWK

Posted lelin

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了AWK相关的知识,希望对你有一定的参考价值。

AWK 内置变量表

技术图片

1、常用操作

[chengmo@localhost ~]$ awk ‘/^root/print $0‘ /etc/passwd 
root:x:0:0:root:/root:/bin/bash

/^root/ 为选择表达式,$0代表是逐行

 

2、设置字段分隔符号(FS使用方法)

[chengmo@localhost ~]$ awk ‘BEGINFS=":"/^root/print $1,$NF‘ /etc/passwd
root /bin/bash

 

FS为字段分隔符,可以自己设置,默认是空格,因为passwd里面是”:”分隔,所以需要修改默认分隔符。NF是字段总数,$0代表当前行记录,$1-$n是当前行,各个字段对应值。

 

3、记录条数(NR,FNR使用方法)

[chengmo@localhost ~]$ awk ‘BEGINFS=":"print NR,$1,$NF‘ /etc/passwd
1 root /bin/bash
2 bin /sbin/nologin
3 daemon /sbin/nologin
4 adm /sbin/nologin
5 lp /sbin/nologin
6 sync /bin/sync
7 shutdown /sbin/shutdown
……

NR得到当前记录所在行

 

4、设置输出字段分隔符(OFS使用方法)

[chengmo@localhost ~]$ awk ‘BEGINFS=":";OFS="^^"/^root/print FNR,$1,$NF‘ /etc/passwd
1^^root^^/bin/bash

 

OFS设置默认字段分隔符

 

 

5、设置输出行记录分隔符(ORS使用方法)

 

[chengmo@localhost ~]$ awk ‘BEGINFS=":";ORS="^^"print FNR,$1,$NF‘ /etc/passwd       
1 root /bin/bash^^2 bin /sbin/nologin^^3 daemon /sbin/nologin^^4 adm /sbin/nologin^^5 lp /sbin/nologin

 

从上面看,ORS默认是换行符,这里修改为:”^^”,所有行之间用”^^”分隔了。

 

6、输入参数获取(ARGC ,ARGV使用)

[chengmo@localhost ~]$ awk ‘BEGINFS=":";print "ARGC="ARGC;for(k in ARGV) print k"="ARGV[k]; ‘ /etc/passwd
ARGC=2
0=awk
1=/etc/passwd

 

ARGC得到所有输入参数个数,ARGV获得输入参数内容,是一个数组。

 

7、获得传入的文件名(FILENAME使用)

[chengmo@localhost ~]$ awk ‘BEGINFS=":";print FILENAMEprint FILENAME‘ /etc/passwd

/etc/passwd

FILENAME,$0-$N,NF 不能使用在BEGIN中,BEGIN中不能获得任何与文件记录操作的变量。

 

8、获得linux环境变量(ENVIRON使用)

[chengmo@localhost ~]$ awk ‘BEGINprint ENVIRON["PATH"];‘ /etc/passwd    
/usr/lib/qt-3.3/bin:/usr/kerberos/bin:/usr/lib/ccache:/usr/lib/icecc/bin:/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin:/usr/java/jdk1.5.0_17/bin:/usr/java/jdk1.5.0_17/jre/bin:/usr/local/mysql/bin:/home/web97/bin

ENVIRON是子典型数组,可以通过对应键值获得它的值。

 

9、输出数据格式设置:(OFMT使用)

[chengmo@localhost ~]$ awk ‘BEGINOFMT="%.3f";print 2/3,123.11111111;‘ /etc/passwd   
0.667 123.111

 

OFMT默认输出格式是:%.6g 保留六位小数,这里修改OFMT会修改默认数据输出格式。

 

10、按宽度指定分隔符(FIELDWIDTHS使用)

[chengmo@localhost ~]$ echo 20100117054932 | awk ‘BEGINFIELDWIDTHS="4 2 2 2 2 3"print $1"-"$2"-"$3,$4":"$5":"$6‘
2010-01-17 05:49:32

 

FIELDWIDTHS其格式为空格分隔的一串数字,用以对记录进行域的分隔,FIELDWIDTHS="4 2 2 2 2 2"就表示$1宽度是4,$2是2,$3是2  .... 。这个时候会忽略:FS分隔符。

 

11、RSTART RLENGTH使用

[chengmo@localhost ~]$ awk ‘BEGINstart=match("this is a test",/[a-z]+$/); print start, RSTART, RLENGTH ‘
11 11 4
[chengmo@localhost ~]$ awk ‘BEGINstart=match("this is a test",/^[a-z]+$/); print start, RSTART, RLENGTH ‘
0 0 –1

 

RSTART 被匹配正则表达式首位置,RLENGTH 匹配字符长度,没有找到为-1.

 

以上是关于AWK的主要内容,如果未能解决你的问题,请参考以下文章

AWK

AWK用法详解

linux awk

Linux-AWK

新awk整理

awk编程