IDA反汇编学习
Posted C# java C++ 开源通信
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了IDA反汇编学习相关的知识,希望对你有一定的参考价值。
1 转自:http://www.cnblogs.com/vento/archive/2013/02/09/2909579.html
IDA Pro是一款强大的反汇编软件,特有的IDA视图和交叉引用,可以方便理解程序逻辑和快速定位代码片断,以方便修改。
IDA视图
示例程序
下面会通过修改示例程序的输出字符串,来讲解如何使用IDA Pro。
#include main() { int n; scanf ("%d",&n); if (n > 0) printf("a > 0"); //后面会用IDA Pro把\'a\'改成\'n\' else printf("n < 0"); }
编译后的程序下载:demo
运行IDA Pro
运行IDA Pro,并使用PE文件的方式打开示例的test.exe文件。IDA Pro会新建一个工程,并开始反汇编程序。反汇编完成后,在[IDA-View]窗口中,可以看到程序逻辑的树形图,如下:
树形图把条件分支清晰地显示出来了,绿色线连着的表示条件为true时执行的逻辑,而红色线表示条件为false时执行的逻辑。右下角有IDA视图的缩略图,在上面点击可以快速定位到视图的指定位置。 IDA的工具栏有几个按钮对定位代码很重要,如下图所示:
从左到右分别是: Open exports window:打开导出窗口 Open import window:打开导入窗口 *Open names window:函数和参数的命名列表 *Open functions window:程序调用的所有函数窗口 *Open strings window: 打开字符串显示窗口,会列出程序中的所有字符串,该窗口有助于你通过程序的运行输出逆向找出对应的代码片断。
定位代码片断
假设我们现在接到个任务,需修正程序,把输出“a > 0”修正为“n > 0”。示例程序比较简单,直接看IDA视图我们就能找到需修改的代码片断,但实际处理时,可能程序有几m大,通过一个个看IDA视图已没法有效找到相关的执行代码片断,这时怎么办? 使用字符串窗口和IDA强大的交叉引用! 点击工具栏的[Open strings windows]按钮,可以看到如下的程序字符串:
程序的字符串较少,可以很快地看到我们需要的字符串“a > 0”在数据段00403003位置。假如字符串多到已不能肉眼定位查找,因为字符串窗口是没有查找功能的,这时需要借助其他的文本编辑器,如notepad,editplus等。在字符串窗口内右键,选择菜单[copy]命令,会把字符串窗口的所有内容复制到剪贴板,再粘贴到记事本中查找就可以了。 双击字符串窗口的该行字符串,会跳转到IDA视图的00403003位置,如下图所示:
该位置的字符串后面会注释有DATA XREF的字样,这是程序中引用到该字符串的代码片断的地址!在该行上右键,选择[Jump to cross reference...]项,会立即跳转到引用该字符串的代码片断位置!
最后定位的代码片断 上图显示的汇编指令即是我们要找的代码片断,这时点击[Hex View-A]窗口,会切换到二进制浏览模式,并高亮了汇编代码的二进制格式指令,如下图所示:
已找到需修改的代码片断,剩下的只需把a改成n。
修改程序文件
在IDA中,可以在[Hex View-A]窗口右键选择[Edit]来修改二进制指令。修改后通过右键选择[Commit Change]可以看到修改后的IDA视图。但需要注意的是,这种方式的修改并不会更新原始程序文件,实际只是修改了IDA的项目文件!IDA中只适合做一些验证性的修改,确保正确后再使用其他工具修改原始程序文件。 在IDA中验证修改正确后,可以使用UltraEdit或Hex Workshop来修改原始程序文件。下面会以UltraEdit为例来说明如何修改。
用UltraEdit直接打开程序文件,UltraEdit会以16进制模式显示程序文件。UltraEdit显示的地址和IDA显示的地址是不同的,为了找到对应代码片断在UltraEdit中的实际地址,需要使用到UltraEdit的查找功能。在IDA中复制需修改的16进制模式显示的指令,在UltraEdit中打开查找,粘贴并查找该16进制字符串,UltrEdit会很快定位到该指令处,如下图所示:
在IDA中使得右键来复制
在UltraEdit打开查找功能
找到了UltraEdit的对应位置 现在我们要把“a > 0”改成“n > 0”,a对应的ASCII码是61,而n对应的ASCII码是6E,只需把61改成6E就可以了,修改后保存。
再次运行,可以看到结果已改变!
示例只是修改了字符串,只需更改数据段内容就可以了,不用更改指令。假如需要更改指令,需要参考< a href="http://courses.engr.illinois.edu/ece390/resources/opcodes.html#Main">8086指令操作表写出对应指今的16进制形式,再修改。
参考资料:
http://blog.csdn.net/liquanhai/article/details/5479141
http://www.youtube.com/watch?v=Gl2S0YPRb9s
http://www.woodmann.com/crackz/Tutorials/Flores1.htm
http://courses.engr.illinois.edu/ece390/resources/opcodes.html
http://faydoc.tripod.com/cpu/conventions.htm
http://hi.baidu.com/onepc/blog/item/bb217259aa539a212834f0f1.html 源码
GE:000105D0 AllIrpComplete proc near ; DATA XREF: DriverEntry+2E o |
PAGE:00010503 ; Attributes: bp-based frame
PAGE:00010503
PAGE:00010503 ConExeToSys proc near ; DATA XREF: DriverEntry+3B o
PAGE:00010503
PAGE:00010503 var_28 = dword ptr -28h ;8
PAGE:00010503 var_24 = dword ptr -24h ;7
PAGE:00010503 SourceString = dword ptr -20h ;6
PAGE:00010503 var_1C = dword ptr -1Ch ;5
PAGE:00010503 UnicodeString = UNICODE_STRING ptr -18h ;变量4=>这里可以看出占8字节变量
PAGE:00010503 DestinationString= STRING ptr -10h ;变量3=>同上
PAGE:00010503 var_8 = dword ptr -8 ;变量2
PAGE:00010503 var_4 = dword ptr -4 ;变量1
PAGE:00010503 arg_4 = dword ptr 0Ch ;参数
PAGE:00010503
这个是主要的分发例程,看变量有N个。
PAGE:00010503 push ebp
PAGE:00010504 mov ebp, esp
PAGE:00010506 sub esp, 28h ;变量所需的空间
PAGE:00010509 mov [ebp+var_24], 0 ;这个是NTSTATUS变量
PAGE:00010510 mov eax, [ebp+arg_4] ;IRP地址
PAGE:00010513 mov ecx, [eax+60h] ;
+0x040 Tail : __unnamed
+0x000 Overlay : __unnamed
+0x000 DeviceQueueEntry : _KDEVICE_QUEUE_ENTRY
+0x000 DriverContext : [4] Ptr32 Void
+0x010 Thread : Ptr32 _ETHREAD
+0x014 AuxiliaryBuffer : Ptr32 Char
+0x018 ListEntry : _LIST_ENTRY
+0x020 CurrentStackLocation : Ptr32 _IO_STACK_LOCATION
上面是dt _IRP -r得出的信息 60h偏移处是 _IO_STACK_LOCATION结构的地址
PAGE:00010516 mov [ebp+var_8], ecx
var_8这个变量就是pIoStackLocation=IoGetCurrentIrpStackLocation(pIrp);
PAGE:00010519 mov edx, [ebp+var_8] ;IO栈的地址传给edx
PAGE:0001051C mov eax, [edx+0Ch]
这个结构太难看了,windbg及ddk定义的结构,太多共用体之类的了。
共用体的最大存储字节是其中的元素最大的那个为准。
PAGE:0001051F mov [ebp+var_1C], eax
var_1C =>uControlCode
PAGE:00010522 mov ecx, [ebp+var_8]
PAGE:00010525 mov edx, [ecx+8]
PAGE:00010528 mov [ebp+var_4], edx
ebp+var_4=>uInBufferLength;
PAGE:0001052B mov eax, [ebp+var_1C]
var_1C =>uControlCode
PAGE:0001052E mov [ebp+var_28], eax
控制码传给var_28变量
PAGE:00010531 cmp [ebp+var_28], 222000h
用这个变量与222000h比较 [这个即是应用层传来的控制码]
PAGE:00010538 jz short loc_1053C
相等跳到
PAGE:0001053A jmp short loc_10594 不相等跳
PAGE:0001053C ; ---------------------------------------------------------------------------
PAGE:0001053C 相等跳到这里
PAGE:0001053C loc_1053C: ; CODE XREF: ConExeToSys+35 j
PAGE:0001053C mov ecx, [ebp+arg_4] ;IRP地址
PAGE:0001053F mov edx, [ecx+0Ch];
+0x00c AssociatedIrp : __unnamed
PAGE:00010542 mov [ebp+SourceString], edx
+0x00c AssociatedIrp : __unnamed
+0x000 MasterIrp : Ptr32 _IRP
+0x000 IrpCount : Int4B
+0x000 SystemBuffer : Ptr32 Void
传给sourcestring
pIrp->AssociatedIrp.SystemBuffer;
PAGE:00010545 mov eax, [ebp+SourceString]
PAGE:00010548 push eax ; SourceString
PAGE:00010549 lea ecx, [ebp+DestinationString]
PAGE:0001054C push ecx ; DestinationString
PAGE:0001054D call ds:__imp__RtlInitAnsiString@8 ; RtlInitAnsiString(x,x)
PAGE:00010553 push 1 ; AllocateDestinationString
PAGE:00010555 lea edx, [ebp+DestinationString]
PAGE:00010558 push edx ; SourceString
PAGE:00010559 lea eax, [ebp+UnicodeString]
PAGE:0001055C push eax ; DestinationString
PAGE:0001055D call ds:__imp__RtlAnsiStringToUnicodeString@12 ; RtlAnsiStringToUnicodeString(x,x,x)
RtlAnsiStringToUnicodeString转换状态在eax中
PAGE:00010563 mov [ebp+var_24], eax
PAGE:00010566 cmp [ebp+var_24], 0
PAGE:0001056A jge short loc_1057B ;若大于等于则跳 =>成功
PAGE:0001056C push offset aConverUnsucces ; "conver unsuccess!\\n"
PAGE:00010571 call _DbgPrint
PAGE:00010576 add esp, 4
PAGE:00010579 jmp short loc_1059B ;这里退出 break
PAGE:0001057B ; ---------------------------------------------------------------------------
PAGE:0001057B
PAGE:0001057B loc_1057B: ; CODE XREF: ConExeToSys+67 j
PAGE:0001057B mov ecx, [ebp+UnicodeString.Buffer]
PAGE:0001057E push ecx
PAGE:0001057F mov edx, dword ptr [ebp+UnicodeString.Length]
PAGE:00010582 push edx
PAGE:00010583 call SetReg
PAGE:00010588 lea eax, [ebp+UnicodeString]
PAGE:0001058B push eax ; UnicodeString
PAGE:0001058C call ds:__imp__RtlFreeUnicodeString@4 ; RtlFreeUnicodeString(x)
PAGE:00010592 jmp short loc_1059B ==>break
PAGE:00010594 ; ---------------------------------------------------------------------------
PAGE:00010594 不相等跳到这里
PAGE:00010594 loc_10594: ; CODE XREF: ConExeToSys+37 j
PAGE:00010594 mov [ebp+var_24], 0C0000232h
#define STATUS_INVALID_VARIANT ((NTSTATUS)0xC0000232L)
PAGE:0001059B 这里是流程语句结束。[这个各种流程若是没优化编译的话都是有一定的特征的]
PAGE:0001059B loc_1059B: ; CODE XREF: ConExeToSys+76 j
PAGE:0001059B ; ConExeToSys+8F j
PAGE:0001059B mov ecx, [ebp+arg_4]
PAGE:0001059E mov edx, [ebp+var_24]
PAGE:000105A1 mov [ecx+18h], edx
PAGE:000105A4 mov eax, [ebp+arg_4]
PAGE:000105A7 mov dword ptr [eax+1Ch], 0
PAGE:000105AE xor dl, dl
PAGE:000105B0 mov ecx, [ebp+arg_4]
PAGE:000105B3 call ds:__imp_@IofCompleteRequest@8 ; IofCompleteRequest(x,x)
PAGE:000105B9 mov eax, [ebp+var_24]
PAGE:000105BC mov esp, ebp
PAGE:000105BE pop ebp
PAGE:000105BF retn 8
PAGE:000105BF ConExeToSys endp
PAGE:000105BF
总结:反汇编的主要是一些变量分配及堆栈平衡及一些结构成员的赋值。多看应会慢慢熟悉。还有各种流程控制语句要多练。
PAGE:0001057B mov ecx, [ebp+UnicodeString.Buffer]
PAGE:0001057E push ecx
PAGE:0001057F mov edx, dword ptr [ebp+UnicodeString.Length]
PAGE:00010582 push edx
PAGE:00010583 call SetReg ;这里设SetReg有一个UnicodeString参数
这里可以看到,当压入一个UnicodeString字符时,会把缓冲区及长度分别压入,所以这种字符串不用以0为标志作为结尾。
SetReg proc near ; CODE XREF: ConExeToSys+80 p
INIT:00010938
INIT:00010938 var_54 = dword ptr -54h
INIT:00010938 var_50 = dword ptr -50h
INIT:00010938 var_4C = dword ptr -4Ch
INIT:00010938 var_48 = dword ptr -48h
INIT:00010938 var_44 = dword ptr -44h
INIT:00010938 var_40 = dword ptr -40h
INIT:00010938 var_3C = dword ptr -3Ch
INIT:00010938 DestinationString= UNICODE_STRING ptr -38h
INIT:00010938 KeyHandle = dword ptr -30h
INIT:00010938 ObjectAttributes= OBJECT_ATTRIBUTES ptr -2Ch
INIT:00010938 ValueName = UNICODE_STRING ptr -14h
INIT:00010938 Handle = dword ptr -0Ch
INIT:00010938 Disposition = dword ptr -8
INIT:00010938 Data = dword ptr -4
INIT:00010938 arg_0 = byte ptr 8
INIT:00010938
INIT:00010938 push ebp
INIT:00010939 mov ebp, esp
INIT:0001093B sub esp, 54h
INIT:0001093E push offset aRegistryMachin ; "\\\\Registry\\\\Machine\\\\SOFTWARE\\\\Microsoft\\\\Wi"...
INIT:00010943 lea eax, [ebp+DestinationString]
INIT:00010946 push eax ; DestinationString
INIT:00010947 call ds:__imp__RtlInitUnicodeString@8 ; RtlInitUnicodeString(x,x)
INIT:0001094D mov [ebp+ObjectAttributes.Length], 18h
INIT:00010954 mov [ebp+ObjectAttributes.RootDirectory], 0
INIT:0001095B mov [ebp+ObjectAttributes.Attributes], 40h
INIT:00010962 lea ecx, [ebp+DestinationString]
INIT:00010965 mov [ebp+ObjectAttributes.ObjectName], ecx
INIT:00010968 mov [ebp+ObjectAttributes.SecurityDescriptor], 0
INIT:0001096F mov [ebp+ObjectAttributes.SecurityQualityOfService], 0
INIT:00010976 lea edx, [ebp+ObjectAttributes]
INIT:00010979 push edx ; ObjectAttributes
INIT:0001097A push 0F003Fh ; DesiredAccess
INIT:0001097F lea eax, [ebp+KeyHandle]
INIT:00010982 push eax ; KeyHandle
INIT:00010983 call ds:__imp__ZwOpenKey@12 ; ZwOpenKey(x,x,x)
INIT:00010989 mov [ebp+var_3C], eax
INIT:0001098C cmp [ebp+var_3C], 0
INIT:00010990 jge short loc_109A4
INIT:00010992 push offset aOpenNotSuccess ; "Open Not Success\\n"
INIT:00010997 call _DbgPrint
INIT:0001099C add esp, 4
INIT:0001099F jmp loc_10A6C
INIT:000109A4 ; ---------------------------------------------------------------------------
INIT:000109A4
INIT:000109A4 loc_109A4: ; CODE XREF: SetReg+58 j
INIT:000109A4 mov [ebp+var_54], 18h
INIT:000109AB mov ecx, [ebp+KeyHandle]
INIT:000109AE mov [ebp+var_50], ecx
INIT:000109B1 mov [ebp+var_48], 40h
INIT:000109B8 lea edx, [ebp+arg_0]
INIT:000109BB mov [ebp+var_4C], edx
INIT:000109BE mov [ebp+var_44], 0
INIT:000109C5 mov [ebp+var_40], 0
INIT:000109CC lea eax, [ebp+Disposition]
INIT:000109CF push eax ; Disposition
INIT:000109D0 push 0 ; CreateOptions
INIT:000109D2 push 0 ; Class
INIT:000109D4 push 0 ; TitleIndex
INIT:000109D6 lea ecx, [ebp+var_54]
INIT:000109D9 push ecx ; ObjectAttributes
INIT:000109DA push 0F003Fh ; DesiredAccess
INIT:000109DF lea edx, [ebp+Handle]
INIT:000109E2 push edx ; KeyHandle
INIT:000109E3 call ds:__imp__ZwCreateKey@28 ; ZwCreateKey(x,x,x,x,x,x,x)
INIT:000109E9 mov [ebp+var_3C], eax
INIT:000109EC cmp [ebp+var_3C], 0
INIT:000109F0 jl short loc_10A1A
INIT:000109F2 cmp [ebp+Disposition], 1
INIT:000109F6 jnz short loc_10A07
INIT:000109F8 push offset aCreate ; "create\\n"
INIT:000109FD call _DbgPrint
INIT:00010A02 add esp, 4
INIT:00010A05 jmp short loc_10A1A
INIT:00010A07 ; ---------------------------------------------------------------------------
INIT:00010A07
INIT:00010A07 loc_10A07: ; CODE XREF: SetReg+BE j
INIT:00010A07 cmp [ebp+Disposition], 2
INIT:00010A0B jnz short loc_10A1A
INIT:00010A0D push offset aOpen ; "Open\\n"
INIT:00010A12 call _DbgPrint
INIT:00010A17 add esp, 4
INIT:00010A1A
INIT:00010A1A loc_10A1A: ; CODE XREF: SetReg+B8 j
INIT:00010A1A ; SetReg+CD j ...
INIT:00010A1A push offset aDebugger ; "Debugger"
INIT:00010A1F lea eax, [ebp+ValueName]
INIT:00010A22 push eax ; DestinationString
INIT:00010A23 call ds:__imp__RtlInitUnicodeString@8 ; RtlInitUnicodeString(x,x)
INIT:00010A29 mov [ebp+Data], offset aCWindowsNtll_e ; "C:\\\\WINDOWS\\\\ntll.exe"
INIT:00010A30 mov ecx, [ebp+Data]
INIT:00010A33 push ecx ; wchar_t *
INIT:00010A34 call ds:__imp__wcslen
INIT:00010A3A add esp, 4
INIT:00010A3D lea edx, [eax+eax+2]
INIT:00010A41 push edx ; DataSize
INIT:00010A42 mov eax, [ebp+Data]
INIT:00010A45 push eax ; Data
INIT:00010A46 push 1 ; Type
INIT:00010A48 push 0 ; TitleIndex
INIT:00010A4A lea ecx, [ebp+ValueName]
INIT:00010A4D push ecx ; ValueName
INIT:00010A4E mov edx, [ebp+Handle]
INIT:00010A51 push edx ; KeyHandle
INIT:00010A52 call ds:__imp__ZwSetValueKey@24 ; ZwSetValueKey(x,x,x,x,x,x)
INIT:00010A58 mov eax, [ebp+Handle]
INIT:00010A5B push eax ; Handle
INIT:00010A5C call ds:__imp__ZwClose@4 ; ZwClose(x)
INIT:00010A62 mov ecx, [ebp+KeyHandle]
INIT:00010A65 push ecx ; Handle
INIT:00010A66 &nbs
以上是关于IDA反汇编学习的主要内容,如果未能解决你的问题,请参考以下文章
学汇编的时候可以拿IDA之类的反汇编工具辅助学习,再用gdb或者IDA动态调试,跟踪每条指令的 执行结果。都不难