从汇编逆向工程优化的 c 代码
Posted
技术标签:
【中文标题】从汇编逆向工程优化的 c 代码【英文标题】:Reverse engineer optimized c code from assembly 【发布时间】:2015-04-21 02:12:29 【问题描述】:这个问题的重点是对运行编译器进行二级优化后生成的 c 代码进行逆向工程。原c代码如下(计算最大公约数):
int gcd(int a, int b)
int returnValue = 0;
if (a != 0 && b != 0)
int r;
int flag = 0;
while (flag == 0)
r = a % b;
if (r ==0)
flag = 1;
else
a = b;
b = r;
returnValue = b;
return(returnValue);
当我运行优化编译时,我从命令行运行:
gcc -O2 -S Problem04b.c
获取此优化代码的汇编文件
.gcd:
.LFB12:
.cfi_startproc
testl %esi, %esi
je .L2
testl %edi, %edi
je .L2
.L7:
movl %edi, %edx
movl %edi, %eax
movl %esi, %edi
sarl $31, %edx
idivl %esi
testl %edx, %edx
jne .L9
movl %esi, %eax
ret
.p2align 4,,10
.p2align 3
.L2:
xorl %esi, %esi
movl %esi, %eax
ret
.p2align 4,,10
.p2align 3
.L9:
movl %edx, %esi
jmp .L7
.cfi_endproc
我需要将此汇编代码转换回 c 代码,这是我现在所处的位置:
int gcd(int a int b)
/*
testl %esi %esi
sets zero flag if a is 0 (ZF) but doesn't store anything
*/
if (a == 0)
/*
xorl %esi %esi
sets the value of a variable to 0. More compact than movl
*/
int returnValue = 0;
/*
movl %esi %eax
ret
return the value just assigned
*/
return(returnValue);
/*
testl %edi %edi
sets zero flag if b is 0 (ZF) but doesn't store anything
*/
if (b == 0)
/*
xorl %esi %esi
sets the value of a variable to 0. More compact than movl
*/
int returnValue = 0;
/*
movl %esi %eax
ret
return the value just assigned
*/
return(returnValue);
do
int r = b;
int returnValue = b;
while();
谁能帮我把它写回c代码?我几乎迷路了。
【问题讨论】:
你应该迷路了,有一个道理,为什么直到现在还没有有用的逆向工程自动化工具。尽管如此,我仍然对这个和任何答案感到好奇。 通过查看与 C 代码混合的生成程序集,您可能会受益(也许只有一点点)。在gdb
中,您可以使用disas /m gcd
,或者另一种方式是objdump
与-S
标志。
您应该使用gcc -fverbose-asm -O2 -S Problem04b.c
进行编译,并且您可能会使用-fdump-tree-all
来获取大量中间转储文件,这些文件代表编译各个阶段的内部表示。
HexRays 反编译器在这种情况下非常有用
【参考方案1】:
首先,您的代码中混合了这些值。 %esi
以值 b
开头,%edi
以值 a
开头。
您可以从testl %edx, %edx
行推断出%edx
被用作以.L7
开头的循环的条件变量(如果%edx
与0 不同,则控制将转移到.L9
块,并且然后返回.L7
)。我们将在逆向工程代码中将%edx
称为remainder
。
让我们开始对主循环进行逆向工程:
movl %edi, %edx
由于%edi
存储a
,这相当于用a
初始化remainder
的值:int remainder = a;
。
movl %edi, %eax
商店int temp = a;
movl %esi, %edi
执行int a = b;
(记住%edi
是a
而%esi
是b
)。
sarl $31, %edx
这个算术移位指令将我们的 remainder
变量向右移动 31 位,同时保持数字的 符号。通过移动 31 位,您将 remainder
设置为 0,如果它是正数(或零),如果它是负数,则设置为 -1。所以相当于remainder = (remainder < 0) ? -1 : 0
。
idivl %esi
将%edx:%eax
除以%esi
,或者在我们的例子中,将remainder * temp
除以b
(变量)。 余数 将存储在%edx
或我们的代码remainder
中。将此与上一条指令结合使用时:如果remainder < 0
则为remainder = -1 * temp % b
,否则为remainder = temp % b
。
testl %edx, %edx
jne .L9
检查remainder
是否等于0 - 如果不是,请跳转到.L9
。那里的代码只是在返回.L7
之前设置b = remainder;
。为了在 C 中实现这一点,我们将保留一个 count
变量,该变量将存储循环迭代的次数。我们将在循环开始时执行b = remainder
,但仅在第一次迭代之后执行,这意味着当count != 0
。
我们现在已经准备好构建完整的 C 循环了:
int count = 0;
do
if (count != 0)
b = remainder;
remainder = a;
temp = a;
a = b;
if (remainder < 0)
remainder = -1 * temp % b;
else
remainder = temp % b;
count++;
while (remainder != 0)
而循环结束后,
movl %esi, %eax
ret
将返回程序计算的 GCD(在我们的代码中,它将存储在 b
变量中)。
【讨论】:
我现在看到了。感谢您的帮助! 我将您的代码插入到 c 文件中,但我认为它运行不正确。我得到一个浮点异常 @scottybobby 抱歉,我写答案时变量名都搞混了。现在已经修好了。以上是关于从汇编逆向工程优化的 c 代码的主要内容,如果未能解决你的问题,请参考以下文章