从汇编逆向工程优化的 c 代码

Posted

技术标签:

【中文标题】从汇编逆向工程优化的 c 代码【英文标题】:Reverse engineer optimized c code from assembly 【发布时间】:2015-04-21 02:12:29 【问题描述】:

这个问题的重点是对运行编译器进行二级优化后生成的 c 代码进行逆向工程。原c代码如下(计算最大公约数):

int gcd(int a, int b)
    int returnValue = 0;
    if (a != 0 &&  b != 0)
        int r;
        int flag = 0;
        while (flag == 0)
            r = a % b;
            if (r ==0)
                flag = 1;
             else 
                a = b;
                b = r;
            
        
        returnValue = b;
    
    return(returnValue);

当我运行优化编译时,我从命令行运行:

gcc -O2 -S Problem04b.c

获取此优化代码的汇编文件

.gcd:
    .LFB12:
        .cfi_startproc
        testl   %esi, %esi
        je  .L2
        testl   %edi, %edi
        je  .L2
    .L7:
        movl    %edi, %edx
        movl    %edi, %eax
        movl    %esi, %edi
        sarl    $31, %edx
        idivl   %esi
        testl   %edx, %edx
        jne .L9
        movl    %esi, %eax
        ret
        .p2align 4,,10
        .p2align 3
    .L2:
        xorl    %esi, %esi
        movl    %esi, %eax
        ret
        .p2align 4,,10
        .p2align 3
    .L9:
        movl    %edx, %esi
        jmp .L7
        .cfi_endproc

我需要将此汇编代码转换回 c 代码,这是我现在所处的位置:

int gcd(int a int b)
    /*
       testl %esi %esi
       sets zero flag if a is 0 (ZF) but doesn't store anything
       */
    if (a == 0)
        /*
           xorl %esi %esi
           sets the value of a variable to 0. More compact than movl
           */
        int returnValue = 0;
        /*
           movl %esi %eax
           ret

           return the value just assigned
           */
        return(returnValue);
    
    /*
       testl %edi %edi
       sets zero flag if b is 0 (ZF) but doesn't store anything
       */
    if (b == 0)
        /*
           xorl %esi %esi
           sets the value of a variable to 0. More compact than movl
           */
        int returnValue = 0;
        /*
           movl %esi %eax
           ret

           return the value just assigned
           */
        return(returnValue);
    

    do
        int r = b;
        int returnValue = b;

    while();



谁能帮我把它写回c代码?我几乎迷路了。

【问题讨论】:

你应该迷路了,有一个道理,为什么直到现在还没有有用的逆向工程自动化工具。尽管如此,我仍然对这个和任何答案感到好奇。 通过查看与 C 代码混合的生成程序集,您可能会受益(也许只有一点点)。在gdb 中,您可以使用disas /m gcd,或者另一种方式是objdump-S 标志。 您应该使用gcc -fverbose-asm -O2 -S Problem04b.c 进行编译,并且您可能会使用-fdump-tree-all 来获取大量中间转储文件,这些文件代表编译各个阶段的内部表示。 HexRays 反编译器在这种情况下非常有用 【参考方案1】:

首先,您的代码中混合了这些值。 %esi 以值 b 开头,%edi 以值 a 开头。

您可以从testl %edx, %edx 行推断出%edx 被用作以.L7 开头的循环的条件变量(如果%edx 与0 不同,则控制将转移到.L9 块,并且然后返回.L7)。我们将在逆向工程代码中将%edx 称为remainder


让我们开始对主循环进行逆向工程:

movl    %edi, %edx

由于%edi存储a,这相当于用a初始化remainder的值:int remainder = a;

movl    %edi, %eax

商店int temp = a;

movl    %esi, %edi

执行int a = b;(记住%edia%esib)。

sarl $31, %edx

这个算术移位指令将我们的 remainder 变量向右移动 31 位,同时保持数字的 符号。通过移动 31 位,您将 remainder 设置为 0,如果它是正数(或零),如果它是负数,则设置为 -1。所以相当于remainder = (remainder < 0) ? -1 : 0

idivl %esi

%edx:%eax 除以%esi,或者在我们的例子中,将remainder * temp 除以b(变量)。 余数 将存储在%edx 或我们的代码remainder 中。将此与上一条指令结合使用时:如果remainder < 0 则为remainder = -1 * temp % b,否则为remainder = temp % b

testl   %edx, %edx
jne .L9

检查remainder 是否等于0 - 如果不是,请跳转到.L9。那里的代码只是在返回.L7 之前设置b = remainder;。为了在 C 中实现这一点,我们将保留一个 count 变量,该变量将存储循环迭代的次数。我们将在循环开始时执行b = remainder,但仅在第一次迭代之后执行,这意味着当count != 0

我们现在已经准备好构建完整的 C 循环了:

int count = 0;
do 
    if (count != 0)
        b = remainder;
    remainder = a;
    temp = a;
    a = b;
    if (remainder < 0)
        remainder = -1 * temp % b;
     else 
        remainder = temp % b;
    

    count++;
 while (remainder != 0)

而循环结束后,

movl    %esi, %eax
ret

将返回程序计算的 GCD(在我们的代码中,它将存储在 b 变量中)。

【讨论】:

我现在看到了。感谢您的帮助! 我将您的代码插入到 c 文件中,但我认为它运行不正确。我得到一个浮点异常 @scottybobby 抱歉,我写答案时变量名都搞混了。现在已经修好了。

以上是关于从汇编逆向工程优化的 c 代码的主要内容,如果未能解决你的问题,请参考以下文章

将汇编代码逆向工程为 c 代码

逆向课程第三讲逆向中的优化方式,以及加减乘

36.从汇编到C(bl1到bl2)

iOS逆向之OC反汇编(上)

逆向课程第五讲逆向中的优化方式,除法原理,以及除法优化下

逆向-除法优化上