使用 awk 解析 nm 命令的输出 - Linux Bash

Posted 2023-02-22

技术标签:

【中文标题】使用 awk 解析 nm 命令的输出 - Linux Bash【英文标题】：parsing output from nm command with awk - Linux Bash 【发布时间】：2016-08-02 16:11:25 【问题描述】：

我正在进行一些代码优化，我会检查我的函数的大小，而不是读取巨大的反汇编文件。在 Debug 上编译后，我使用 nm 命令读取 .o。我们得到了这个：

nm --size-sort $OBJFILEPATH.o

000000000000000b r __PRETTY_FUNCTION__.6473
0000000000000017 t extract_h
0000000000000036 t L_mult
000000000000003a t sature32
0000000000000042 t L_mac
0000000000000048 t L_add
000000000000005c t Mac16x11
0000000000000077 t L_shl
0000000000000083 t L_shr
00000000000000df T G729Convolve
0000000000000114 T G729Residu
00000000000001bc T G729Syn_filt_L_H
00000000000001bc T G729Syn_filt_L_SUBFR

现在，在 bash 脚本中，我只想解析第一列，每行代表 bash 中的单个数组元素。

我的命令是：

read FUNCSIZE <<< $(nm --size-sort $OBJFILEPATH.o | awk 'print $1')

为了确保一切正常，我检查了 FUNCSIZE 数组的大小。

SIZE=$#FUNCSIZE[@]
echo size is $SIZE
for s in $FUNCSIZE
do
    echo $s
done

我得到了这个作为输出：

size is 1
000000000000000b
0000000000000017
0000000000000036
000000000000003a
0000000000000042
0000000000000048
000000000000005c
0000000000000077
0000000000000083
00000000000000df
0000000000000114
00000000000001bc
00000000000001bc

为什么 size 是 '1' 以及为什么我能够像在数组中一样打印每个元素。似乎输出在行尾仍然有一个“空格”“”。是否有任何带有 awk 的 RegEx 可以避免将分隔符字段包含到数组中？

感谢您的帮助！！

回答后编辑

read -a FUNCSIZE <<< $(nm --size-sort $OBJFILEPATH.o | awk 'print $1')
SIZE=$#FUNCSIZE[*]
for((i=0; i<SIZE; i++))
do
    echo $FUNCSIZE[$i]
done

【问题讨论】：

您正在读入一个标量，而不是一个数组。也许您打算使用read -a。但无论如何，创建一个 bash 数组可能是您接下来要做的任何事情的错误起点 - 如果您通过一个简洁、可测试的示例告诉我们这一点，我们可以为您提供帮助。我们想制作一个工具来比较两个不同的 .o 文件，并比较是否有任何功能被及时更改。将大小解析为变量，脚本将能够检查特定函数是否比以前更大。那将是一个 awk 脚本，因此从 2 个 shell 数组开始不会有用。 shell 只是一个环境，可以使用一种语言来调用工具以对这些调用进行排序，而用于操作文本的标准通用 UNIX 工具是 awk。这段代码实际上代表了一个shell脚本中的函数，但你是对的。我将使用 awk 代替。谢谢！ 【参考方案1】：

按照你写的方式，FUNCSIZE 不是一个数组，而是一个常规变量。

为read 添加-a 标志：

read -a FUNCSIZE <<< $(nm --size-sort $OBJFILEPATH.o | awk 'print $1')

请注意，不建议对用户定义的变量使用全大写名称，avoid conflicts (and confusion) with environmental variables and special shell variables。

（感谢 @mklement0 的提示和链接！）

【讨论】：

谢谢 janos 和 Ed Morton。 -a 标志是我正在寻找的答案！我建议要么根本不显示 FUNCSIZE=( $(...) ) 替代方案，要么将其称为反模式，因为它使命令替换的输出受到（通常不需要的）通配符（尝试 a=( $(echo '*') ) . 还值得推荐不要使用全大写的变量名，并定期将-r 选项添加到read。【参考方案2】：

从您的评论看来，这可能是您真正想要的：

$ cat tst.awk

    size = strtonum("0x"$1)
    sub(/^([^[:space:]]+[[:space:]]+)2/,"")
    name = $0

NR==FNR  oldSize[name] = size; next 

    newSize[name] = size
    if ( name in oldSize ) 
        if ( oldSize[name] < newSize[name] ) 
            bigger[name]
        
        else if ( oldSize[name] > newSize[name] ) 
            smaller[name]
        
    
    else 
        added[name]
    

END 
   print "Got bigger:"
   for (name in bigger) print "\t" name, oldSize[name], "->", newSize[name]

   print "Got smaller:"
   for (name in smaller) print "\t" name, oldSize[name], "->", newSize[name]

   print "Added:"
   for (name in added) print "\t" name

   print "Deleted:"
   for (name in oldSize) if ( !(name in newSize) ) print "\t" name

$ gawk -f tst.awk <(cat file1) <(cat file2)
Got bigger:
    Mac16x11 92 -> 93
Got smaller:
    L_mac 66 -> 65
Added:
    extract_h
Deleted:
    G729Residu

上面的 strtonum() 使用 GNU awk 并在这两个输入文件上运行：

$ cat file1
000000000000000b r __PRETTY_FUNCTION__.6473
0000000000000036 t L_mult
000000000000003a t sature32
0000000000000042 t L_mac
0000000000000048 t L_add
000000000000005c t Mac16x11
0000000000000077 t L_shl
0000000000000083 t L_shr
00000000000000df T G729Convolve
0000000000000114 T G729Residu
00000000000001bc T G729Syn_filt_L_H
00000000000001bc T G729Syn_filt_L_SUBFR

$ cat file2
000000000000000b r __PRETTY_FUNCTION__.6473
0000000000000017 t extract_h
0000000000000036 t L_mult
000000000000003a t sature32
0000000000000041 t L_mac
0000000000000048 t L_add
000000000000005d t Mac16x11
0000000000000077 t L_shl
0000000000000083 t L_shr
00000000000000df T G729Convolve
00000000000001bc T G729Syn_filt_L_H
00000000000001bc T G729Syn_filt_L_SUBFR

只需将每个cat file 替换为对应的nm ...。

【讨论】：

真棒埃德莫顿！！

以上是关于使用 awk 解析 nm 命令的输出 - Linux Bash的主要内容，如果未能解决你的问题，请参考以下文章