WIN32 汇编直接CALL 与间接CALL ?

Posted 2023-05-01

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了WIN32 汇编直接CALL 与间接CALL ?相关的知识，希望对你有一定的参考价值。

WIN32 汇编谁熟悉？直接调用（E8 ....）与间接调用（FF 15 AC A2 42 00 ,这种需要导入表）了解吗？什么叫直接CALL 什么叫间接CALLL ？谁能给我讲讲两者的不同？多谢！

参考技术A E8 xx xx xx xx：被调用代码的EIP=当前EIP+xxxxxxxx
FF 15 AC A2 42 00：被调用代码的EIP=ds:[0042A2AC]。0042A2AC相当于C代码中的函数的指针追问

我想在EXE文件中直接嵌入另一个程序，运行.EXE时，通过直接编程这EXE文件的二进制代码，加入一些字节（机器代码），先执行一段自己加的MessageBox()的代码，让它先弹一个窗口出来，再接着执行原来EXE文件的代码，就是给原EXE文件加一个壳。
请问，在上述前提下，您能否再给讲讲这个直接CALL 和间接CALL的含义？

追答

在这里说不清楚，建议找一些关于inline hook的资料看看把

本回答被提问者采纳

[汇编]《汇编语言》第10章 CALL和RET指令

王爽《汇编语言》第四版超级笔记

王爽《汇编语言》第四版超级笔记
- 第10章 CALL和RET指令

第10章 CALL和RET指令

call和ret指令都是转移指令，它们都修改IP，或同时修改CS和IP。

它们经常被共同用来实现子程序的设计。这一章，我们讲解call和ret指令的原理。

10.1 ret和retf、call指令

ret指令用栈中的数据，修改IP的内容，从而实现近转移；

retf指令用栈中的数据，修改CS和IP的内容，从而实现远转移。

CPU执行ret指令时，进行下面两步操作：

(IP)=((ss)x16+(sp))
(sp)=(sp)+2

CPU执行retf指令时，进行下面4步操作：

(IP)=((ss)x16+(sp))
(sp)=(sp)+2
(CS)=((ss)x16+(sp))
(sp)=(sp)+2

可以看出，如果我们用汇编语法来解释ret和retf指令，则：

CPU执行ret指令时，相当于进行：

pop IP

CPU执行retf指令时，相当于进行：

pop IP
pop CS

下面的程序中，ret指令执行后，(IP)=0，CS:IP指向代码段的第一条指令。

assume cs:code

stack segment
    db 15 dup (0)
stack ends

code segment

        mov ax,4c00h
        int 21h

start:  mov ax,stack
        mov ss,ax
        mov sp,16
        mov ax,0
        push ax
        mov bx,0
        ret

code ends

end start

下面的程序中，retf指令执行后，CS:IP指向代码段的第一条指令。

assume cs:code

stack segment
    db 16 dup (0)
stack ends

code segment

        mov ax,4c00h
        inc 21h

start:  mov ax,stack
        mov ss,ax
        mov sp,16
        mov ax,0
        push cs
        push ax
        mov bx,0
        retf

code ends

end start

CPU执行call指令时，进行两步操作：

（1）将当前的IP或CS和IP压入栈中；

（2）转移。

call指令不能实现短转移，除此之外，call指令实现转移的方法和jmp指令的原理相同，下面的几个小节中，我们以给出转移目的地址的不同方法为主线，讲解call指令的主要应用格式。

10.2 call指令应用场景

依据位移进行转移的call指令

call 标号(将当前的IP压栈后，转到标号处执行指令)

CPU执行此种格式的call指令时，进行如下的操作：

(1) (sp)=(sp)-2
((ss)x16+(sp))=(IP)

(2) (IP)=(IP)+16位位移。

16位位移=标号处的地址-call指令后的第一个字节的地址；
16位位移的范围为-32768～32767，用补码表示；
16位位移由编译程序在编译时算岀。

从上面的描述中，可以看出，如果我们用汇编语法来解释此种格式的call指令，则：

CPU执行“call 标号”时，相当于进行：

push IP
jmp near ptr 标号

转移的目的地址在指令中的call指令

"call far ptr 标号”实现的是段间转移。

CPU执行此种格式的call指令时，进行如下的操作。

(1 )(sp)=(sp)-2
((ss)x16+(sp))=(CS)
(sp)=(sp)-2
((ss)x16+(sp))=(IP)

(2) (CS)=标号所在段的段地址
(IP)=标号在段中的偏移地址

从上面的描述中可以看出，如果我们用汇编语法来解释此种格式的call指令，则：

CPU执行"call far ptr 标号”时，相当于进行：

push CS
push IP
jmp far ptr 标号

转移地址在寄存器中的call指令

指令格式：call 16位 reg

功能：

(sp)=(sp)-2
((ss)x16+(sp))=(IP)
(IP)=(16位reg)

用汇编语法来解释此种格式的call指令，CPU执行“call 16位 reg”时，相当于进行：

push IP
jmp 16位 reg

转移地址在内存中的call指令

转移地址在内存中的call指令有两种格式。

（1）call word ptr 内存单元地址

用汇编语法来解释此种格式的call指令，则：

CPU执行“call word ptr 内存单元地址”时，相当于进行：

push IP
jmp word ptr 内存单元地址

比如，下面的指令：

mov sp,10h
mov ax,0123h
mov ds:[0],ax
call word ptr ds:[0]

执行后，(IP)=0123H，(sp)=0EH。

（2）call dword ptr 内存单元地址

用汇编语法来解释此种格式的call指令，则：

CPU执行“call dword ptr 内存单元地址”时，相当于进行：

push CS
push IP
jmp dword ptr 内存单元地址

比如，下面的指令：

mov sp,10h
mov ax,0123h
mov ds:[0],ax
mov word ptr ds:[2],0
call dword ptr ds:[0]

执行后，(CS)=0, (IP)=0123H，(sp)=0CH。

10.3 call和ret的配合使用、mul指令

我们己经分别学习了ret和call指令的原理。

现在来看一下，如何将它们配合使用来实现子程序的机制。

问题10.1

下面程序返回前，bx中的值是多少？

assume cs:code

code segment

start:  mov ax,1
        mov ex,3
        call s
        mov bx,ax       ;(bx)=?
        mov ax,4c00h
        int 21h

    s:  add ax,ax
        loop s
        ret

code ends

end start

思考后看分析。

分析：

我们来看一下CPU执行这个程序的主要过程。

（1）CPU将call s指令的机器码读入，IP指向了call s后的指令mov bx,ax，然后CPU执行call s指令，将当前的IP值(指令mov bx,ax的偏移地址)压栈，并将IP的值改变为标号s处的偏移地址；
（2）CPU从标号s处开始执行指令，loop循环完毕后，(ax)=8；
（3）CPU将ret指令的机器码读入，IP指向了ret指令后的内存单元，然后CPU执行ret指令，从栈中弹出一个值(即call s先前压入的mov bx,ax指令的偏移地址)送入IP中。则CS:IP指向指令mov bx,ax；
（4）CPU从mov bx,ax开始执行指令，直至完成。

程序返回前，(bx)=8。可以看出，从标号s到ret的程序段的作用是计算2的N次方，计算前，N的值由cx提供。

我们再来看下面的程序：

看一下程序的主要执行过程。

(1) 前3条指令执行后，栈的情况如下：

(2) call指令读入后，(IP)=000EH，CPU指令缓冲器中的代码为：E8 05 00；

CPU执行E8 05 00，首先，栈中的情况变为：

然后，(IP)=(IP)+0005=0013H。

(3) CPU从cs:0013H处(即标号s处)开始执行。

(4) ret指令读入后：

(IP)=0016H，CPU指令缓冲器中的代码为：C3

CPU执行C3，相当于进行pop IP，执行后，栈中的情况为：

(5) CPU回到cs:000EH处(即call指令后面的指令处)继续执行。

从上面的讨论中我们发现，可以写一个具有一定功能的程序段，我们称其为子程序，在需要的时候，用call指令转去执行。

可是执行完子程序后，如何让CPU接着call指令向下执行？

call指令转去执行子程序之前，call指令后面的指令的地址将存储在栈中，所以可在子程序的后面使用ret指令，用栈中的数据设置IP的值，从而转到call指令后面的代码处继续执行。

这样，我们可以利用call和ret来实现子程序的机制。子程序的框架如下。

标号：
指令
ret

具有子程序的源程序的框架如下。

assume cs:code

code segment

main:
        ...
        ...
        ...
        call sub1       ;调用子程序sub1
        ...
        ...
        ...
        mov ax,4c00h
        int 21h

sub1:                   ;子程序sub1开始
        ...
        ...
        ...
        call sub2       ;调用子程序sub2
        ...
        ...
        ...
        ret             ;子程序返回

sub2:                   ;子程序sub2开始
        ...
        ...
        ...
        ret             ;子程序返回

code ends

end main

现在，可以从子程序的角度，回过头来再看一下本节中的两个程序。

这里介绍一下mul指令，mul是乘法指令，使用mul做乘法的时候，注意以下两点。

（1）两个相乘的数：两个相乘的数，要么都是8位，要么都是16位。如果是8位，一个默认放在AL中，另一个放在8位reg或内存字节单元中；如果是16位，一个默认在AX中，另一个放在16位reg或内存字单元中。

（2）结果：如果是8位乘法，结果默认放在AX中；如果是16位乘法，结果高位默认在DX中存放，低位在AX中放。

格式如下：

mul reg
mul 内存单元

内存单元可以用不同的寻址方式给出，比如：

mul byte ptr ds:[0]

含义：(ax)=(al)x((ds)x16+0)；

mul word ptr [bx+si+8]

含义：(ax)=(ax)x((ds)x16+(bx)+(si)+8)结果的低16位。
(dx)=(ax)x((ds)x16+(bx)+(si)+8)结果的高16 位。

例：

(1) 计算100x10

100和10小于255，可以做8位乘法，程序如下。

mov al,100
mov bl,10
mul bl

结果：(ax)=1000(03E8H)

(2) 计算100x10000

100小于255，可10000大于255，所以必须做16位乘法，程序如下。

mov ax,100
mov bx,10000
mul bx

结果：(ax)=4240H，(dx)=000FH
(F4240H=1000000)

10.4 参数和结果传递的问题、批量数据的传递

call与ret指令共同支持了汇编语言编程中的模块化设计。

在实际编程中，程序的模块化是必不可少的。因为现实的问题比较复杂，对现实问题进行分析时，把它转化成为相互联系、不同层次的子问题，是必须的解决方法。

而call与ret指令对这种分析方法提供了程序实现上的支持。利用call和ret指令，我们可以用简捷的方法，实现多个相互联系、功能独立的子程序来解决一个复杂的问题。

下面的内容中，我们来看一下子程序设计中的相关问题和解决方法。

子程序一般都要根据提供的参数处理一定的事务，处理后，将结果(返回值)提供给调用者。

其实，我们讨论参数和返回值传递的问题，实际上就是在探讨，应该如何存储子程序需要的参数和产生的返回值。

比如，设计一个子程序，可以根据提供的N，来计算N的3次方。

这里面就有两个问题：

（1）将参数N存储在什么地方？
（2）计算得到的数值，存储在什么地方？

很显然，可以用寄存器来存储，可以将参数放到bx中；因为子程序中要计算NxNxN，可以使用多个mul指令，为了方便，可将结果放到dx和ax中。子程序如下。

;说明：计算N的3次方
;参数：(bx)=N
;结果：(dx:ax)=N^3

cube:mov ax,bx
     mul bx
     mul bx
     ret

注意，我们在编程的时候要注意形成良好的风格，对于程序应有详细的注释。

用寄存器来存储参数和结果是最常使用的方法。对于存放参数的寄存器和存放结果的寄存器，调用者和子程序的读写操作恰恰相反：调用者将参数送入参数寄存器，从结果寄存器中取到返回值；子程序从参数寄存器中取到参数，将返回值送入结果寄存器。

编程，计算data段中第一组数据的3次方，结果保存在后面一组dword单元中。

assume cs:code

data segment
	dw 1,2,3,4,5,6,7,8
	dd 0,0,0,0,0,0,0,0
data ends

我们可以用到己经写好的子程序，程序如下：

code segment

start:  mov ax,data
        mov ds,ax
        mov si,0      ;ds:si指向第一组word单元
        mov di,16     ;ds:di指向第二组dword单元

        mov cx,8

     s: mov bx,[si]
        call cube
        mov [di],ax
        mov [di].2,dx
        add si,2       ;ds:si指向下一个word单元
        add di,4       ;ds:di指向下一个dword单元
        loop s

        mov ax,4c00h
        int 21h

  cube: mov ax,bx
        mul bx
        mul bx
        ret

code ends

end start

前面的例程中，子程序cube只有一个参数，放在bx中。如果有两个参数，那么可以用两个寄存器来放，可是如果需要传递的数据有3个、4个或更多直至N个，该怎样存放呢？

寄存器的数量终究有限，我们不可能简单地用寄存器来存放多个需要传递的数据。对于返回值，也有同样的问题。

在这种时候，我们将批量数据放到内存中，然后将它们所在内存空间的首地址放在寄存器中，传递给需要的子程序。对于具有批量数据的返回结果，也可用同样的方法。

下面看一个例子，设计一个子程序，功能：将一个全是字母的字符串转化为大写。

这个子程序需要知道两件事，字符串的内容和字符串的长度。因为字符串中的字母可能很多，所以不便将整个字符串中的所有字母都直接传递给子程序。

但是，可以将字符串在内存中的首地址放在寄存器中传递给子程序。因为子程序中要用到循环，我们可以用loop指令，而循环的次数恰恰就是字符串的长度。出于方便的考虑，可以将字符串的长度放到cx中。

capital:and byte ptr [si],11011111b     ;将ds:si所指单元中的字母转化为大写
        inc si      ;ds:si指向下一个单元
        loop capital
        ret

编程，将data段中的字符串转化为大写。

assume cs:code

data segment
    db \'conversation\'
data ends

code segment

start:  mov ax,data
        mov ds,ax
        mov si,0      ;ds:si指向字符串（批量数据）所在空间的首地址
        mov cx,12     ;cx存放字符串的长度
        call capital
        mov ax,4c00h
        int 21h

capital:and byte ptr [si],11011111b
        inc si
        loop capital
        ret

code ends

end start

注意，除了用寄存器传递参数外，还有一种通用的方法是用栈来传递参数。

10.5 寄存器冲突的问题

设计一个子程序，功能：将一个全是字母，以0结尾的字符串，转化为大写。

程序要处理的字符串以0作为结尾符，这个字符串可以如下定义：

db \'conversation\',0

应用这个子程序，字符串的内容后面一定要有一个0，标记字符串的结束。子程序可以依次读取每个字符进行检测，如果不是0，就进行大写的转化；如果是0，就结束处理。

由于可通过检测0而知道是否己经处理完整个字符串，所以子程序可以不需要字符串的长度作为参数。可以用jcxz来检测0。

;说明：将一个全是字母，以0结尾的字符串，转化为大写
;参数：ds:si指向字符串的首地址
;结果：没有返回值

capital:mov cl,[si]
        mov ch,0
        jcxz ok     ;如果(cx)=0,结束；如果不是0,处理
        and byte ptr [si],11011111b     ;将ds:si所指单元中的字母转化为大写 
        inc si      ;ds:si指向下一个单元
        jmp short capital
     ok:ret

来看一下这个子程序的应用。

（1）将data段中字符串转化为大写。

assume cs:code
data segment
    db \'conversation\',0
data ends

代码段中的相关程序段如下。

mov ax,data
mov ds,ax
mov si,0
call capital

（2）将data段中的字符串全部转化为大写。

assume cs:code
data segment
    db \'word\',0
    db \'unix\',0
    db \'wind\',0
    db \'good\',0
data ends

可以看到，所有字符串的长度都是5(算上结尾符0)，使用循环，重复调用子程序capital，完成对4个字符串的处理。完整的程序如下。

code segment

start:  mov ax,data
        mov ds,ax
        mov bx,0

        mov cx,4

    s:  mov si,bx
        call capital
        add bx,5
        loop s

        mov ax,4c00h
        int 21h

capital:mov cl,[si]
        mov ch,0
        jcxz ok
        and byte ptr [si],11011111b
        inc si
        jmp short capital
     ok:ret

code ends

end start

问题10.2

这个程序在思想上完全正确，但在细节上却有些错误，把错误找出来。

思考后看分析。

分析：

问题在于cx的使用，主程序要使用cx记录循环次数，可是子程序中也使用了cx，在执行子程序的时候，cx中保存的循环计数值被改变，使得主程序的循环出错。

从上面的问题中，实际上引出了一个一般化的问题：子程序中使用的寄存器，很可能在主程序中也要使用，造成了寄存器使用上的冲突。

那么如何来避免这种冲突呢？粗略地看，可以有以下两个方案。

（1）在编写调用子程序的程序时，注意看看子程序中有没有用到会产生冲突的寄存器，如果有，调用者使用别的寄存器；

（2）在编写子程序的时候，不要使用会产生冲突的寄存器。

我们来分析一下上面两个方案的可行性：

（1）这将给调用子程序的程序的编写造成很大的麻烦，因为必须要小心检查所调用的子程序中是否有将产生冲突的寄存器。

比如说，在上面的例子中，我们在编写主程序的循环的时候就得检查子程序中是否用到了bx和cx，因为如果子程序中用到了这两个寄存器就会出现问题。如果釆用这种方案来解决冲突的话，那么在主程序的循环中，就不能使用cx寄存器，因为子程序中己经用到。

（2）这个方案是不可能实现的，因为编写子程序的时候无法知道将来的调用情况。

可见，我们上面所设想的两个方案都不可行。我们希望：

（1）编写调用子程序的程序的时候不必关心子程序到底使用了哪些寄存器；

（2）编写子程序的时候不必关心调用者使用了哪些寄存器；

（3）不会发生寄存器冲突。

解决这个问题的简捷方法是，在子程序的开始将子程序中所有用到的寄存器中的内容都保存起来，在子程序返回前再恢复。可以用栈来保存寄存器中的内容。

以后，我们编写子程序的标准框架如下：

子程序开始：子程序中使用的寄存器入栈
           子程序内容
           子程序中使用的寄存器出栈
           返回(ret、retf)

我们改进一下子程序capital的设计:

capital:push cx
        push si

change:mov cl,[si]
       mov ch,0
       jcxz ok
       and byte ptr [si],11011111b
       inc si
       jmp short change

    ok:pop si
       pop cx
       ret

要注意寄存器入栈和出栈的顺序。

以上是关于WIN32 汇编直接CALL 与间接CALL ?的主要内容，如果未能解决你的问题，请参考以下文章