非保姆级二进制炸弹破解分析

Posted 2022-11-23 Hellsegamosken

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了非保姆级二进制炸弹破解分析相关的知识，希望对你有一定的参考价值。

本文采用静态分析的方法，即通过阅读反汇编代码理清程序运行逻辑，通过写脚本得到密码。与之相对地也可以采用动态调试，即在 ida 里面设断点，通过修改寄存器信息等绕过一些爆炸点，类似直接在内存里看答案。我不会把整个破解过程分析一遍，只重点分析一些宏观的思路以及容易卡住的点，最后分析了下彩蛋的不同解法。保姆级教程见 Blu3m00n’s Blog

如果没有接触过 IDA PRO，建议逆二进制炸弹之前先写个 a+b 和 hellow world 拉进去看一下，了解一下高级语言反汇编出来是什么样、转成的伪代码又是什么样。

从本人为数不多的逆向和 pwn 的经历中总结的入门经验，仅供参考：

读伪代码先快速过一遍，连蒙带猜先猜一些关键变量的作用，同时判断哪些变量是没有用的，做好标记。
细读代码的时候也得猜，猜主要逻辑，能加快速度。很多复杂代码的逻辑很清楚，干的事很简单。
F5 出来的伪代码不是百分百可靠的，尤其是很多跳转会出问题。遇到疑问一定要回去看汇编！
生成的伪代码很喜欢用指针，刚开始各种转换反应不过来也问题不大，分辨好数据类型领会精神即可。

重点分析

一个细节，关键函数 GenerateNumber 里面的 HIDWORD 应该是 ida 自己定义的宏，通过百度之类的手段不难猜出其含义。

phase_1 不说了，phase_2 里面看伪代码发现只有当 rand_div == 0 的时候才不会炸，会进入 phase_2_0，里面没有再调用别的函数了：

但观察左栏函数名发现还有一系列的 phase_2_n。于是回去看汇编：

发现前面把 rand_div 放到 eax 中，然后后面实际上是 jmp [eax*4 + 0x40D470]，也就是根据 rand_div 的不同取值进入不同函数。发现这一点之后就根据你的 rand_div 值破解对应函数即可。

phase_3 里面，以我的 rand_div=12 为例，进入 phase_3_12，得到正确的 v4（第一个参数），之后我进入 case 36，这里面只对 v3（第三个参数）的值进行了检查，得到了 v1 但似乎没有检查就直接返回了，也就是我们得不到确定的第二个参数。发现如果第二个参数随便设置并不能够通关，于是尝试将其设置为 v1，竟然过了。

究其原因，再回去看汇编：

这两行对应检查 v3 是否等于 rand_div，如果等于会跳转到 0x403002：

原来还藏着一个可能引爆炸弹的判断。不过这里的 var_1 让人摸不着头脑，但猜想应该是 phase_3_12 里面的 v5（第二个参数）。查看栈空间，或者右键重命名以后这俩名字就一样了。

phase_4 也没什么好说的。

第五关难度突然变得不是一个水平的了。进入 phase_impossible，首先把 tohex 读完，发现是把合法的字符串（仅由 “0123456789abcdefABCDEF” 组成）转化为十六进制存在 v2 中。之后经由 check_buf_valid 检查是否合法，再往后面…咋没有出口？感觉最后肯定会进入某个 goto_buf_n，而进入后发现传的参数非常难以理解。遇到困难回去看汇编：

发现这三个 goto_buf_n 都是把 eip 设置到 eax 处往后执行：

往前看一点，这时候的 eax 里都是 v2 的地址，也就是说程序会跳到我们写入栈中的一段机器码的首地址开始执行，因此我们要像怎么在这段代码上做手脚。

通过 Shift+F12 查找字符串找到第五关通关的位置：

那么过关思路就清晰了：我们要向栈中写入一段机器码，作用是这段代码执行完后让 eip 跳到这个位置，输出过关信息。

可能会想到直接用 jmp 指令，因为代码段的加载不是随机的。但这样会带来一系列问题，因为这段代码运行完以后可能会导致栈不平衡，进而出现程序异常退出等情况。

注意到我们想要调到的位置恰好是调用 phase_impossible 后面，也就是我们写入的代码只要能够实现退出 phase_impossible 即可。所以我们要写入的代码长这样：

mov esp, ebp
pop ebp		; 先把栈恢复到之前的状态
ret

然后绕过 check_buf_valid 就可以得到密码了。

此外，发现函数栏还有一个叫做 phase_secret 的函数，这是一个独立的只有输出的函数，可见我们的目标就是修改第五关写入的信息，使得这个函数被调用：

这题解法不止一种。总体思路是我们要把栈打造成我们想要的样子，即在合适的位置放上合适的数据（返回地址等），使得通过程序中自带的 ret 或我们写入的 jmp, ret 等指令的执行来实现跳转。

具体来说，我们想先跳到输出第五关通关信息的那段代码的地址（0x401240），执行到 0x40125e 的时候栈顶应该存放 phase_secret 的地址（0x4014f0），执行到 0x4014fb 的时候栈顶应该存放 0x40125b。所以要写入的代码长这样：

mov esp, ebp
pop ebp
push 0x40125B
push 0x4014F0
push ebp
mov ebp, esp
push 1
push 2
push 3
push 0x401240
ret

不明白的话照着这部分汇编手玩一下就很清楚了，注意观察栈中数据以及 esp、ebp 的变化。蓝月亮在前面多 pop 了两个元素为了让 ebp、esp 位置和原来一样，实际上在这道题里面我认为是没有必要的。

在上面这种方法中，eip 从栈里跳出去之后就再也回不来了，因为我们并不知道栈地址是什么，即控制流程是：stack -> code1 -> code2 -> code3 -> …。如果我们得到了栈地址，就可以在栈里 push 相应的地址使得 ret 的时候多次返回栈里。经测试，本程序没开启栈地址随机，可以通过动态调试直接读出 v2 的地址。

当然也可以利用 call 指令直接把 eip 暂存，同样达到返回栈里执行的效果。而 call 后面接的是偏移地址（我没找到接绝对地址的指令），同样需要动态调试得到 v2 的地址，进而计算其与目标代码段的偏移量。

如果开启了栈地址随机，下面两种方法都是不可取的，第一种方法仍然可取。但如果可以 call 绝对地址的话那么自然也可以用第三种方法。

实际上开启了栈地址随机也是可以泄露栈地址的。这个程序没开 NX 保护，而且直接允许写入长达 256 字节的代码，我们的自主性其实是很大的。完全可以通过写入 call; pop 得到栈地址，然后 push 进栈里供后面 ret，或者直接调用 printf 函数把栈地址输出出来，之后再跳到第五关读密码那里再执行一遍，这次输入就可以利用刚才泄露出来的栈地址了。

最后泄露栈地址这段知识理论上的分析，没有经过尝试，等忙完这一阵再来补吧。

以上是关于非保姆级二进制炸弹破解分析的主要内容，如果未能解决你的问题，请参考以下文章