awk

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了awk相关的知识,希望对你有一定的参考价值。

1.awk

1.1执行流程

技术图片

1.2print

print item1,item2,…
要点:
   (1)逗号分隔符
   (2)输出的item可以是字符串,也可以是数值,当前记录的字段,变量或awk的表达式
   (3)如省略item,相当于print $0

1.3变量

内建变量
FS:input field seperator,输入间隔符,默认为空白字符
OFS:output field separator,输出间隔符,默认为空白字符
RS:input record separator,输入时的换行符
ORS:output record separator,输出时的换行符

NF:number of field,字段数量,print NF 输出字段的数量print $NF输出最后一列
NR:number of record,行数
FNR:各文件分别计数,行数
FILENAME:当前文件名
ARGC:命令行参数个数
ARGV:数组,保存的是命令行所给定的各个参数
自定义变量
方式一:
-v var=value 变量名区分字符大小写
方式二:
在program中直接定义

下面这两个最重要:
NF:number of field,字段数量,print NF 输出字段的数量print $NF输出最后一列
NR:number of record,行数
[root@m01 oldboy]# awk -v FS=":" ‘print $1‘ /etc/passwd
root
bin
daemon
adm
lp
syn

分隔符为一个或多个:,打印第一列,第三列内容
默认输出分隔符为空格
[root@m01 oldboy]# awk -F ‘[:]+‘ ‘print $1,$3‘ /etc/passwd
root 0
bin 1
daemon 2
adm 3
lp 4
sync 5
shutdown 6

设置输出分隔符
[root@m01 oldboy]# awk -F ‘[:]‘ -v OFS=‘:‘ ‘print $1,$3‘ /etc/passwd
root:0
bin:1
daemon:2
adm:3

打印每行的列数
[root@m01 oldboy]# awk -F ‘[:]‘ ‘print NF‘ /etc/passwd
7
7
7
7

技术图片
技术图片
技术图片
技术图片
技术图片
技术图片

1.4printf命令

格式化输出:printf FORMAT,item1,item2,…
(1)FORMAT必须给出
(2)不会自动换行,需要显示给出换行控制符,\n
(3)FORMAT中需要分别为后面的每个Item指定一个格式化符号
格式符:
   %c:显示字符的ASCII码
   %d,%i:显示十进制整数
   %e,%E:科学技术法数值显示
   %f:显示为浮点数
   %g,%G以科学技术法祸福点形式显示数值
   %s:显示字符串
   %u:无符号整数
   %%:显示%本身
修饰符:
   #[.#]:第一个数字控制显示的宽度;第二个#表示小数点后的精度
   %3.1f
   -:左对齐
   +:显示数值的符号
实践操作
[root@m01 oldboy]# awk -F "[:]" ‘printf "Username:%s,UID:%d\n",$1,$3‘ /etc/passwd
Username:root,UID:0
Username:bin,UID:1
Username:daemon,UID:2

右对齐,%15s意思是占据15个字符长度,右对齐
[root@m01 oldboy]# awk -F "[:]" ‘printf "Username:%15s,UID:%d\n",$1,$3‘ /etc/passwd
Username:           root,UID:0
Username:            bin,UID:1
Username:         daemon,UID:2
Username:            adm,UID:3

左对齐
[root@m01 oldboy]# awk -F "[:]" ‘printf "Username:%-15s,UID:%d\n",$1,$3‘ /etc/passwd
Username:root           ,UID:0
Username:bin            ,UID:1
Username:daemon         ,UID:2
Username:adm            ,UID:3

[root@m01 oldboy]# awk -F: ‘$3>1000?usertype="Common user":usertype="Sysadmin user";printf "%15s:%s\n",$1,usertype‘ /etc/passwd
           root:Sysadmin user
            bin:Sysadmin user
         daemon:Sysadmin user
            adm:Sysadmin user
             lp:Sysadmin user

-F设置多个分隔符
[root@m01 oldboy]# cat /etc/fstab|grep -Ev ‘^#‘|awk -F ‘[: ]+‘ ‘print $0‘

UUID=b3a88d2b-b491-46ff-96a1-a9eff1a5c3a5 /                       ext4    defaults        1 1
UUID=8848e519-989b-4a1f-9fdb-803f0b56db57 /boot                   ext4    defaults        1 2
UUID=b6a11888-75c1-4a5f-98fa-32c323404e4e swap                    swap    defaults        0 0
tmpfs                   /dev/shm                tmpfs   defaults        0 0
devpts                  /dev/pts                devpts  gid=5,mode=620  0 0
sysfs                   /sys                    sysfs   defaults        0 0
proc                    /proc                   proc    defaults        0 0
[root@m01 oldboy]# cat /etc/fstab|grep -Ev ‘^#‘|awk -F ‘[: ]+‘ ‘print $2‘

/
/boot
swap
/dev/shm
/dev/pts
/sys
/proc
[root@m01 oldboy]# 

1.5操作符

算数操作符:
   x+y, x-y, x*y, x/y, x^y, x%y
   -x
   +x:转换为数值
字符串操作符:没有符号的操作符,字符串连接
赋值操作符:
   =, +=, -=, *=, /=, %=, ^=, ++, --
比较操作符:
   >,>=, <, <=, !=, ==
格式匹配符:
   ~:是否匹配
   !~:是否不匹配
逻辑操作符:
   &&, ||, !
函数调用:
   function_name(argu1,argu2,…)
条件表达式:
   selector?if-true-express:if-false-express
实践操作:
[root@m01 oldboy]# awk ‘/^UUID/print $1‘ /etc/fstab 
UUID=b3a88d2b-b491-46ff-96a1-a9eff1a5c3a5
UUID=8848e519-989b-4a1f-9fdb-803f0b56db57
UUID=b6a11888-75c1-4a5f-98fa-32c323404e4e

!取反
[root@m01 oldboy]# awk ‘!/^UUID/print $1‘ /etc/fstab 

#
#
#
#
#
#
#
tmpfs
devpts
sysfs
proc
[root@m01 oldboy]# 

[root@m01 oldboy]# awk -F: -v OFS=":" ‘$NF=="/bin/bash"print $1,$NF‘ /etc/passwd
root:/bin/bash
oldboy:/bin/bash
stu01:/bin/bash
stu02:/bin/bash

~模式匹配
[root@m01 oldboy]# awk -F: ‘$NF~/bash$/print $1,$NF‘ /etc/passwd 
root /bin/bash
oldboy /bin/bash
stu01 /bin/bash

1.6PATTERN

(1)empty:空模式,匹配每一行
(2)/regular express/:仅处理能够被此处模式匹配的行
(3)relational express:关系表达式:结果有“真”有”假”,结果为” 真”才会被处理
(4)line ranges:行范围,startline,endline: /pat1/,/pat2/
   注意:不支持直接给出数字的格式
(5)BEGIN/END模式
  BEGIN:仅在开始处理文件中的文本之前执行一次;
  END:仅在文本处理完成之后执行一次
实践操作
[root@m01 oldboy]# awk ‘if (NR>2&&NR<5) print $0‘ /etc/passwd
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin

关系表达式
[root@m01 oldboy]# awk ‘(NR>2&&NR<5) print $0‘ /etc/passwd
awk: (NR>2&&NR<5) print $0
awk:               ^ syntax error
[root@m01 oldboy]# awk ‘(NR>2&&NR<5)print $0‘ /etc/passwd
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin

[root@m01 oldboy]# df -h|awk -F ‘[%]‘ ‘/^\/dev/print $1‘
/dev/sda3       8.8G  7.0G  1.4G  84
/dev/sda1       190M   40M  141M  22
/dev/sdb1        20G  1.2G   18G   7

[root@m01 oldboy]# df -h|awk -F ‘[%]‘ ‘/^\/dev/print $0‘|awk ‘if (NR>1) print $0‘
/dev/sda1       190M   40M  141M  22% /boot
/dev/sdb1        20G  1.2G   18G   7% /project

起始行和结束行
[root@m01 oldboy]# awk -F: ‘/^root/,/^test/print $1‘ /etc/passwd
root
bin
daemon
adm
lp
test

BEGIN,END只打印一次,中间的内容,是匹配多少行就打印多少次
[root@m01 oldboy]# awk -F: ‘BEGINprint "user-----------"if (NR>2&&NR<5) print $0ENDprint "end----------"‘ /etc/passwd
user-----------
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
end----------

1.7常用的action

(1)Expressions 
(2)Control statements:if while等
(3)Command statements:组合语句
(4)input statements
(5)output statements

1.8控制语句

if(condition) statements
if(condition) statements else statements
while(condition) statements
do statements while(condition)
for(expr1;expr2;expr3) statements
break
continue
delete array[index]
delete array
exit
statements
if-else
语法:if(condition) statements else statements
使用场景:对awk取得的整行或某个字段做条件判断

common user:           vita
[root@m01 oldboy]# awk -F: ‘if($3>1000)printf "common user:%15s\n",$1elseprintf "sysadmin user:%15s\n",$1‘ /etc/passwd
common user:       oldboy16
common user:       oldboy17
common user:            www
sysadmin user:          redis
sysadmin user:       rabbitmq

[root@m01 oldboy]# awk ‘if(NR==3)print $0‘ /etc/passwd
daemon:x:2:2:daemon:/sbin:/sbin/nologin
[root@m01 oldboy]# awk ‘if($NF=="/bin/bash")print $0‘ /etc/passwd
[root@m01 oldboy]# awk -F: ‘if($NF=="/bin/bash")print $0‘ /etc/passwd
root:x:0:0:root:/root:/bin/bash
oldboy:x:1000:1000::/home/oldboy:/bin/bash
stu01:x:1013:1013::/home/stu01:/bin/bash
while循环
语法:while(condition) statements
条件“真”,进入循环,条件“假”,退出循环
使用场景:对一行内的多个字段逐一类似处理时使用:对数组中的各元素逐一处理时使用

[root@m01 oldboy]# awk ‘/^UUID/i=1;while (i<NF)print $i;i++‘ /etc/fstab 
UUID=b3a88d2b-b491-46ff-96a1-a9eff1a5c3a5
/
ext4
defaults
1
UUID=8848e519-989b-4a1f-9fdb-803f0b56db57
/boot
ext4
defaults
1
UUID=b6a11888-75c1-4a5f-98fa-32c323404e4e
swap
swap
defaults
0
do-while循环
语法:do statements while(condition) 意义:至少执行一次循环体
for循环
语法:for(expr1;expr2;expr3) statements
特殊用法:能够遍历数组中的元素
    语法:for(var in array) statements

[root@m01 oldboy]# awk ‘/^UUID/for (i=1;i<NF;i++)print $i‘ /etc/fstab 
UUID=b3a88d2b-b491-46ff-96a1-a9eff1a5c3a5
/
ext4
defaults
1
UUID=8848e519-989b-4a1f-9fdb-803f0b56db57
/boot
ext4
defaults
1
UUID=b6a11888-75c1-4a5f-98fa-32c323404e4e
swap
swap
defaults
0
[root@m01 oldboy]
switch语句
语法:switch(expression) case VALUE1 or /REGEXP/:statement; case VALUE2 or /REGEXP2/:statement;…;default:statement

break和continue
break [n] continue

next
提前结束对本行的处理而直接进入下一行

技术图片

1.9array数组(shell脚本中有案例)

通过awk同时分析出secure文件中每个用户被每个ip破解的次数通过awk同时分析access.log文件每个ip的重复数和每个ip使用的流量

[root@oldboyedu-01 ~]# cat /oldboy/access.log |awk ‘array[$1]++;sum[$1]=sum[$1]+$10ENDfor (ip in array) print ip,array[ip],sum[ip]‘
180.97.106.162 2 336
180.97.106.37 4 672

通过awk同时分析出secure文件中每个用户被每个ip破解的次数
[root@oldboyedu-01 ~]# cat /oldboy/secure.txt |grep ‘Failed‘|awk ‘array[$9,$11]++ENDfor (i in array) print i,array[i]‘
oldboy10.0.0.1 2
oldboy10.0.0.3 1
root10.0.0.1 5
root10.0.0.2 3

1.10函数

函数
内置函数
数值处理:
rand():返回0和1之间一个随机数
字符串处理:
length([s]):返回指定字符串的长度
sub(r,s,[t]):以r表示的模式来查找t所表示的字符中的匹配的内容,并将其第一次出现替换为s所表示的内容
gsub:以r表示的模式来查找t所表示的字符中的匹配的内容,并将其所有出现替换为s所表示的内容
split(s,a[],r):以r为分隔符切割字符s,并将其切割后的结果保存至a所表示的数组中
自定义函数

以上是关于awk的主要内容,如果未能解决你的问题,请参考以下文章

AWK

AWK用法详解

linux awk

Linux-AWK

新awk整理

awk编程