汇编语言访问寄存器和内存篇---02

Posted 大忽悠爱忽悠

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了汇编语言访问寄存器和内存篇---02相关的知识,希望对你有一定的参考价值。

汇编语言访问寄存器和内存篇---02


本系列文章参考汇编语言第四版和汇编语言程序设计 贺利坚主讲整理而成


CPU的组成

  • 运算器进行信息处理;
  • 寄存器进行信息存储;
  • 控制器协调各种器件进行工作;
  • 内部总线实现CPU内 各个器件之间的联系


寄存器是CPU内部的信息存储单元


8086CPU有14个寄存器:

  • 通用寄存器:AX、BX、CX、DX
  • 变址寄存器:SI、DI
  • 指针寄存器:SP、BP
  • 指令指针寄存器: IP
  • 段寄存器:CS、SS、DS、ES
  • 标志寄存器:PSW

共性; 8086CPU所有的寄存器都是16位的, 可以存放两个字节。


通用寄存器——以AX为例

一个16位寄存器存储一个16位的数据, 最大值?

  • 2的16次方-1

例:在AX中存储18D

  • 18D — 12H — 10010B

再例:在AX中存储20000D

  • 20000D — 4E20H — 0100111000100000B

横看成岭侧成峰

问题: 8086上一代CPU中的寄存器都是8位 的,如何保证程序的兼容性?


方案: 通用寄存器均可以分为两个独立的 8位寄存器使用


细化:

  • AX可以分为AH和AL
  • BX可以分为BH和BL
  • CX可以分为CH和CL
  • DX可以分为DH和DL

“字”在寄存器中的存储

8086是16位CPU

  • 8086的字长(word size)为16bit

一个字(word)可以存在一个16位寄存器中

  • 这个字的高位字节存在这个寄存器的高8位寄存器
  • 这个字的低位字节存在这个寄存器的低8位寄存器

mov和add指令

注:汇编指令不区分大小写


确定物理地址的方法

物理地址

  • CPU访问内存单元时要给出内存单元的地址。
  • 所有的内存单元构成的存储空间是一个一维的线性空间。
  • 每一个内存单元在这个空间中都有唯一的地址,这个唯 一的地址称为物理地址。

事实

  • 8086有20位地址总线,可传送20位地址,寻址能力 为1M。
  • 8086是16位结构的CPU运算器一次最多可以处理16位的数据,寄存器 的最大宽度为16位。
  • 在8086内部处理的、传输、暂存的地址也是16位,寻址能力也只有64KB!

问题:8086如何处理在寻址空间上的这个矛盾?!


8086CPU给出物理地址的方法

8086CPU的解决方法

  • 用两个16位地址(段地址、偏移地址) 合成一个20位的物理地址。

地址加法器合成物理地址的方法 : 物理地址=段地址×16+偏移地址

段地址 * 16=基地址左移4个二进制位

演示:物理地址=段地址×16+偏移地址


注意: 并不是一个物理地址就可以决定一个段地址,而是当我们给出一个段地址后,通过适当调整,即加上一个偏移地址,就可以得到一个物理地址,看下面的例子:


“段地址×16+偏移地址=物理地址”的本质含义

要解决的问题 : 用两个16位的地址(段地址、偏移地址), 相加得到一个20位的物理地址

本质含义 : CPU在访问内存时,用一个基础地址(段 地址×16)和一个相对于基础地址的偏移 地址相加,给出内存单元的物理地址。


内存的分段表示法

用分段的方式管理内存

8086CPU用“(段地址×16)+偏移地址=物理地址”的方 式给出内存单元的物理地址。

内存并没有分段,段的划分来自于CPU!!!


同一段内存,多种分段方案


(1)段地址×16 必然是 16的倍数,所以一个段的起始地址也一定是16的倍数

(2)偏移地址为16位,16 位地址的寻址能力为 64K,所以一个段的长度最大为64K


用不同的段地址和偏移地址形成同一个物理地址


Debug

Debug是DOS系统中的著名的调试程序,也可以运行在windows系统实模式下。 :

使用Debug程序,可以查看CPU各种寄存器中的内容、内存的情况,并且在机器指令级跟踪程 序的运行!


启动Debug

在DOS提示符下输入命令:debug

用R命令查看、改变CPU寄存器的内容

  • R - 查看寄存器内容
  • R 寄存器名 - 改变指定寄存器内容


用D命令查看内存中的内容

  • D - 列出预设地址内存处的 128个字节的内容

段地址*16 + 偏移地址得到的是物理地址

  • D 段地址:偏移地址 - 列出内 存中指定地址处的内容

我们可以手动选择查看某一个段地址和对应的偏移地址,默认显示的是预设的段地址

  • D段地址:偏移地址 结尾偏移 地址 - 列出内存中指定地址范 围内的内容

2000是指定的段地址,0000是偏移地址,而f是显示多少个字节,默认显示128个,这里我们要求显示16个字节,2f就是48个字节,这里使用和显示的数值都是十六进制形式的


用E命令改变内存中的内容

  • E 段地址:偏移地址 数据1 数据2 …

  • E 段地址:偏移地址
  • 逐个询问式修改
  • 空格 - 接受,继续
  • 回车 -结束

如果采用询问式方式修改,那么每按一次空格,他都会给出下一个字节的内容,例如: 12. 然后我们需要在.后面给出需要替换掉当前字节的内容


用U命令将内存中的机器指令翻译成汇编指令

有汇编指令

  • mov ax, 0123H
  • mov bx 0003H
  • mov ax, bx
  • add ax, bx

对应的机器码为

  • B8 23 01
  • BB 03 00
  • 89 D8
  • 01 D8

e 地址 数据 - 写入

d 地址 - 查看

u 地址 - 查看代码


用A命令以汇编指令的格式在内存中写入机器指令

有汇编指令

  • mov ax, 0123H
  • mov bx, 0003H
  • mov ax, bx
  • add ax, bx

对应的机器码为

  • B8 23 01
  • BB 03 00
  • 89 D8
  • 01 D8

a 地址 - 写入汇编指令


向2000:100处写入上面汇编指令

d 地址 - 查看数据

u 地址 - 查看代码


用T命令执行机器指令

t - 执行CS:IP处的指令

  • mov ax, 0123H
  • mov bx, 0003H
  • mov ax, bx
  • add ax, bx

先调整cs和ip寄存器初始值

  • 指令指针寄存器: IP
  • 段寄存器:CS



用Q命令退出Debug

q - 退出Debug


CS、IP与代码段

两个关键的寄存器

  • CS:代码段寄存器
  • IP: 指令指针寄存器
  • CS:IP:CPU将内存中CS:IP 指向的内容当作指令执行。

  • CS提供段地址,16位
  • IP可以理解为PC寄存器,提供的是偏移地址,也是16位
  • 位址加法器对两个16位地址进行相加,然后得到一个20位地址
  • 通过BUS地址总线,发送给MAR
  • MAR从内存中取出该地址对应的指令,然后放入MDR
  • MDR中的数据通过数据总线转交给CPU处理
  • 因为,这里取出的指令是3个字节,因此这里IP自动加3

例示:在CS和IP指示下代码的执行

  • 8086CPU当前状态:CS中内容为2000H,IP中内容为0000H
  • 内存20000H~20009H处存放着可执行的机器代码


8086PC读取和执行指令演示

8086PC工作过程的简要描述:

(1)从CS:IP指向内存单元读取 指令,读取的指令进入指 令缓冲器;

(2)IP = IP + 所读取指令的长 度,从而指向下一条指令;

(3)执行指令。 转到步骤

(1),重复这个过程。


指令读取和执行的实证演示-Debug

用debug程序执行下面的代码

  • mov ax, 0123H
  • mov bx, 0003H
  • mov ax, bx
  • add ax, bx

a 地址 - 写入汇编指令

u 地址 - 查看代码

t - 执行CS:IP处代码




问:内存中有数据 B8 23 01 BB 03 00 89 D8 01 D8, 究竟用作一般数据,还是用作指令?

答:CPU将CS:IP指向的内存单元中的内容看作指令!


jmp指令

修改CS、IP的指令:

事实:执行何处的指令,取决于CS:IP

应用:可以通过改变CS、IP中的内容,来控制CPU要执行的目标指令

问题:如何改变CS、IP的值?

方法1:Debug 中的 R 命令可以改变寄存器的值——r cs, r ip

Debug是调试手段,并非程序方式!

方法2:用指令修改


方法3:转移指令 jmp


转移指令 jmp :

  • 同时修改CS、IP的内容

jmp 段地址:偏移地址

jmp 2AE3:3  

jmp 3:0B16 

功能:用指令中给出的段地址修改CS,偏移地址修改IP。

  • 仅修改IP的内容 jmp

某一合法寄存器

jmp ax (类似于 mov IP, ax) 
jmp bx

功能:用寄存器中的值修改IP。


问题分析


从20000H开始,执行的序列是:

(1)mov ax,6622
(2)jmp 1000:3
(3)mov ax,0000
(4)mov bx,ax
(5)jmp bx
(6)mov ax,0123H
(7)转到第(3)步执行


内存中字的存储

事实:对8086CPU,16位作为一个字

问题: 16位的字存储在一个16位的寄存器中,如何存储?

回答:

  • 高8位放高字节,低8位放低字节

问题: 16位的字在内存中需要2个连续字节存储,怎么存放?

回答:

  • 低位字节存在低地址单元,高位字节存在高地址单元

例:20000D(4E20H)存放0、1两个单元,18D (0012H)存放在2、3两个单元


字单元

字单元:由两个地址连续的内存单元组成,存放一个字型数据(16位)

原理:在一个字单元中,低地址单元存放低位字节,高地址单元存放高位字节

  • 在起始地址为0的单元中,存放的是4E20H
  • 在起始地址为2的单元中,存放的是0012H

    问题:

(1)0地址单元中存放的字节型数据是( 20H)

(2)0地址字单元中存放的字型数据是( 4E20H)

(3)2地址单元中存放的字节型数据是( 12H )

(4)2地址字单元中存放的字型数据是( 0012H )

机器字长、存储字长、指令字长


用DS和[address]实现字的传送

要解决的问题:CPU从内存单元中要读取数据

要求: CPU要读取一个内存单元的时候,必须先给出这个内存单元的地址

原理: 在8086PC中,内存地址由段地址和偏移地址组成(段地址:偏移地址)

解决方案:DS和[address]配合 ,用 DS寄存器存放要访问的数据的段地址 ,偏移地址用[…]形式直接给出

给出偏移地址后,会默认去DS寄存器获取段地址


字的传送

8086CPU可以一次性传送一个字(16位的数据)

  • mov bx, 1000H
  • mov ds, bx
  • mov ax, [0] —> 1000:0处的字型数据送入ax
  • mov [0],cx —> cx中的16位数据送到1000:0处

案例

  • 先将1000:0处内存的前四个字节设置为上面给出的值

  • 在默认的起始地址处,输入指令



后面同理,DS和[address]配合,可以让我们通过从内存中快速读取一个字到指定寄存器中


DS与数据段

对内存单元中数据的访问

对于8086PC机,可以根据需要将一组内存单元定义为一个段。

  • 物理地址=段地址×16+偏移地址
  • 将一组长度为N(N≤64K)、地址连续、起始地址为16的倍数的内存单元当作专门存储数 据的内存空间,从而定义了一个数据段。

例:用123B0H~123B9H的空间来存放数据

  • 段地址:123BH 起始偏移地址:0000H 长度:10字节
  • 段地址:1230H 起始偏移地址:00B0H 长度:10字节

处理方法:(DS): ( [address])

  • 用DS存放数据段的段地址
  • 用相关指令访问数据段中的具体单元,单元地址由[address]指出
mov、add、sub...

将哪段内存当作数据段,段地址如何定,在编程时安排


将123B0H~123BAH的内存单元定义为数据段

AL是AX的低字节位


用mov指令操作数据


加法add和减法sub指令


用DS和[address]形式访问内存中数据段方法小结


(1)字在内存中存储时 ,要用两个地址连续的内存单元来存放,字的 低位字节存放在低地址单元中,高位字节存放再高地址单元中。

(2)用 mov 指令要访问内存单元,可以在mov指令中只给出单元的偏 移地址,此时,段地址默认在DS寄存器中。

(3)[address]表示一个偏移地址为address的内存单元。

(4)在内存和寄存器之间传送字型数据时,高地址单元和高8位寄存器、 低地址单元和低8位寄存器相对应。

(5)mov、add、sub是具有两个操作对象的指令,访问内存中的数据段 (对照:jmp是具有一个操作对象的指令,对应内存中的代码段)。

(6)可以根据自己的推测,在Debug中实验指令的新格式。


栈及栈操作的实现

栈结构

栈是一种只能在一端进行插入或删除操作的数据结构。

栈有两个基本的操作:入栈和出栈。

  • 入栈:将一个新的元素放到栈顶
  • 出栈:从栈顶取出一个元素。

栈顶的元素总是最后入栈,需要出栈时,又最先被从栈 中取出。

栈的操作规则:LIFO(Last In First Out,后进先出)

CPU提供的栈机制:

现今的CPU中都有栈的设计。

8086CPU提供相关的指令,支持用栈的方式访问内存空间。

基于8086CPU的编程,可以将一段内存当作栈来使用。

PUSH(入栈)POP(出栈)指令 

push ax:将ax中的数据送入栈中 

pop ax:从栈顶取出数据送入ax 

(以字为单位对栈进行操作)

例:设将10000H~1000FH内存当作栈来使用……

入站:

mov ax,0123H 
push ax 
mov bx,2266H 
push bx 
mov cx,1122H 
push cx 

出栈:

pop ax 
pop bx 
pop cx


问题:

1、CPU如何知道一段内存空间被当作栈使用?

2、执行push和pop的时候,如何知道哪个单元是栈顶单元?

回答:

8086CPU中,有两个与栈相关的寄存器:

  • 栈段寄存器SS - 存放栈顶的段地址
  • 栈顶指针寄存器SP - 存放栈顶的偏移地址

任意时刻,SS:SP指向栈顶元素。


栈的操作


push 指令和pop指令的执行过程

push ax

  • (1)SP=SP–2;
  • (2)将ax中的内容送入SS:SP指向的内存单 元处,SS:SP此时指向新栈顶

pop ax

  • (1)将SS:SP指向的内存单元处的数据送 入ax中;
  • (2)SP = SP+2,SS:SP指向当前栈顶下面的单元,以当前栈顶下面的单元为新的 栈顶。

栈顶超界问题:

如何能够保证在入栈、出栈时,栈顶不 会超出栈空间?


执行入栈(push)时,栈顶超出栈空间


执行出栈(pop)时,栈顶超出栈空间


栈顶超界问题的解决


栈的小结

push、pop 实质上就是一种内存传送指令,可以在寄存器和内存 之间传送数据,与mov指令不同的是,push和pop指令访问的内 存单元的地址不是在指令中给出的,而是由SS:SP指出的。

执行push和pop指令时,SP 中的内容自动改变。

8086CPU提供的栈操作机制:

  • 在SS,SP中存放栈顶的段地址和偏移地址,入栈和出栈指 令根据SS:SP指示的地址,按照栈的方式访问内存单元。
  • push指令的执行步骤:
1)SP=SP-2
2)向SS:SP指向的字单元中送入数据。
  • pop指令的执行步骤:
1)从SS:SP指向的字单元中读取数据
2)SP=SP-2

关于“段”的总结

基础: 物理地址=段地址×16+偏移地址

做法:

  • 编程时,可以根据需要将一组内存单 元定义为一个段。
  • 可以将起始地址为16的倍数,长度为 N(N ≤64K )的一组地址连续的内存 单元,定义为一个段。
  • 将一段内存定义为一个段,用一个段 地址指示段,用偏移地址访问段内的 单元——在程序中可以完全由程序员 安排。

三种段

  • 数据段: 将段地址放在 DS中,用mov、add、sub等访问内存单元的指令 时,CPU将我们定义的数据段中的内容当作数据段来访问
  • 代码段: 将段地址放在 CS中,将段中第一条指令的 偏移地址放在IP中 ,CPU将执行我们定义的代码段中的指令
  • 栈段: 将段地址放在SS中,将栈顶单元的偏移地 置放在 SP 中 , CPU在需要进行栈操作(push、pop)时,就 将我们定义的栈段当作栈空间来用。

综合示例:按要求设置段并执行代码

综合示例:三个段地址可以一样滴!

以上是关于汇编语言访问寄存器和内存篇---02的主要内容,如果未能解决你的问题,请参考以下文章

第三章 寄存器(内存访问)

汇编语言——寄存器(内存访问 ds数据段寄存器,ss栈段寄存器)

汇编语言课堂总结3——内存访问

汇编语言第三章总结

汇编语言 第三章 寄存器

汇编语言学习分享