汇编语言访问寄存器和内存篇---02

Posted 2022-06-20 大忽悠爱忽悠

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了汇编语言访问寄存器和内存篇---02相关的知识，希望对你有一定的参考价值。

汇编语言访问寄存器和内存篇---02

CPU的组成
- 寄存器是CPU内部的信息存储单元
- 通用寄存器——以AX为例
- 横看成岭侧成峰
- “字”在寄存器中的存储
mov和add指令
确定物理地址的方法
- 物理地址
- 8086CPU给出物理地址的方法
- “段地址×16+偏移地址=物理地址”的本质含义
内存的分段表示法
- 用分段的方式管理内存
- 同一段内存，多种分段方案
- 用不同的段地址和偏移地址形成同一个物理地址
Debug
- 启动Debug
- 用R命令查看、改变CPU寄存器的内容
- 用D命令查看内存中的内容
- 用E命令改变内存中的内容
- 用U命令将内存中的机器指令翻译成汇编指令
- 用A命令以汇编指令的格式在内存中写入机器指令
- 用T命令执行机器指令
- 用Q命令退出Debug
CS、IP与代码段
- 两个关键的寄存器
jmp指令
内存中字的存储
- 字单元
用DS和[address]实现字的传送
- 字的传送
- 案例
DS与数据段
- 对内存单元中数据的访问
- 将123B0H~123BAH的内存单元定义为数据段
- 用mov指令操作数据
- 加法add和减法sub指令
- 用DS和[address]形式访问内存中数据段方法小结
栈及栈操作的实现
- 栈结构
- 例：设将10000H~1000FH内存当作栈来使用……
- 栈的操作
- push 指令和pop指令的执行过程
- 执行入栈(push)时，栈顶超出栈空间
- 执行出栈(pop)时，栈顶超出栈空间
- 栈顶超界问题的解决
- 栈的小结
关于“段”的总结
- 综合示例：按要求设置段并执行代码
- 综合示例：三个段地址可以一样滴！

本系列文章参考汇编语言第四版和汇编语言程序设计贺利坚主讲整理而成

CPU的组成

运算器进行信息处理；
寄存器进行信息存储；
控制器协调各种器件进行工作；
内部总线实现CPU内各个器件之间的联系

寄存器是CPU内部的信息存储单元

8086CPU有14个寄存器：

通用寄存器：AX、BX、CX、DX
变址寄存器：SI、DI
指针寄存器：SP、BP
指令指针寄存器： IP
段寄存器：CS、SS、DS、ES
标志寄存器：PSW

共性; 8086CPU所有的寄存器都是16位的，可以存放两个字节。

通用寄存器——以AX为例

一个16位寄存器存储一个16位的数据, 最大值？

2的16次方-1

例：在AX中存储18D

18D — 12H — 10010B

再例：在AX中存储20000D

20000D — 4E20H — 0100111000100000B

横看成岭侧成峰

问题： 8086上一代CPU中的寄存器都是8位的，如何保证程序的兼容性？

方案: 通用寄存器均可以分为两个独立的 8位寄存器使用

细化：

AX可以分为AH和AL
BX可以分为BH和BL
CX可以分为CH和CL
DX可以分为DH和DL

“字”在寄存器中的存储

8086是16位CPU

8086的字长(word size)为16bit

一个字(word)可以存在一个16位寄存器中

这个字的高位字节存在这个寄存器的高8位寄存器
这个字的低位字节存在这个寄存器的低8位寄存器

mov和add指令

注：汇编指令不区分大小写

确定物理地址的方法

物理地址

CPU访问内存单元时要给出内存单元的地址。
所有的内存单元构成的存储空间是一个一维的线性空间。
每一个内存单元在这个空间中都有唯一的地址，这个唯一的地址称为物理地址。

事实

8086有20位地址总线，可传送20位地址，寻址能力为1M。
8086是16位结构的CPU运算器一次最多可以处理16位的数据，寄存器的最大宽度为16位。
在8086内部处理的、传输、暂存的地址也是16位，寻址能力也只有64KB！

问题：8086如何处理在寻址空间上的这个矛盾？！

8086CPU给出物理地址的方法

8086CPU的解决方法

用两个16位地址(段地址、偏移地址) 合成一个20位的物理地址。

地址加法器合成物理地址的方法： 物理地址=段地址×16+偏移地址

段地址 * 16=基地址左移4个二进制位

演示：物理地址=段地址×16+偏移地址

注意: 并不是一个物理地址就可以决定一个段地址，而是当我们给出一个段地址后，通过适当调整，即加上一个偏移地址，就可以得到一个物理地址，看下面的例子:

“段地址×16+偏移地址=物理地址”的本质含义

要解决的问题：用两个16位的地址（段地址、偏移地址），相加得到一个20位的物理地址

本质含义 : CPU在访问内存时，用一个基础地址（段地址×16）和一个相对于基础地址的偏移地址相加，给出内存单元的物理地址。

内存的分段表示法

用分段的方式管理内存

8086CPU用“（段地址×16）+偏移地址=物理地址”的方式给出内存单元的物理地址。

内存并没有分段，段的划分来自于CPU！！！

同一段内存，多种分段方案

（1）段地址×16 必然是 16的倍数，所以一个段的起始地址也一定是16的倍数

（2）偏移地址为16位，16 位地址的寻址能力为 64K，所以一个段的长度最大为64K

用不同的段地址和偏移地址形成同一个物理地址

Debug

Debug是DOS系统中的著名的调试程序，也可以运行在windows系统实模式下。 :

使用Debug程序，可以查看CPU各种寄存器中的内容、内存的情况，并且在机器指令级跟踪程序的运行！

启动Debug

在DOS提示符下输入命令：debug

用R命令查看、改变CPU寄存器的内容

R - 查看寄存器内容
R 寄存器名 - 改变指定寄存器内容

用D命令查看内存中的内容

D - 列出预设地址内存处的 128个字节的内容

段地址*16 + 偏移地址得到的是物理地址

D 段地址:偏移地址 - 列出内存中指定地址处的内容

我们可以手动选择查看某一个段地址和对应的偏移地址，默认显示的是预设的段地址

D段地址:偏移地址结尾偏移地址 - 列出内存中指定地址范围内的内容

2000是指定的段地址,0000是偏移地址，而f是显示多少个字节，默认显示128个，这里我们要求显示16个字节,2f就是48个字节，这里使用和显示的数值都是十六进制形式的

用E命令改变内存中的内容

E 段地址:偏移地址数据1 数据2 …

E 段地址:偏移地址
逐个询问式修改
空格 - 接受，继续
回车 -结束

如果采用询问式方式修改，那么每按一次空格，他都会给出下一个字节的内容，例如: 12. 然后我们需要在.后面给出需要替换掉当前字节的内容

用U命令将内存中的机器指令翻译成汇编指令

有汇编指令

mov ax, 0123H
mov bx 0003H
mov ax, bx
add ax, bx

对应的机器码为

B8 23 01
BB 03 00
89 D8
01 D8

e 地址数据 - 写入

d 地址 - 查看

u 地址 - 查看代码

用A命令以汇编指令的格式在内存中写入机器指令

有汇编指令

mov ax, 0123H
mov bx, 0003H
mov ax, bx
add ax, bx

对应的机器码为

B8 23 01
BB 03 00
89 D8
01 D8

a 地址 - 写入汇编指令

向2000:100处写入上面汇编指令

d 地址 - 查看数据

u 地址 - 查看代码

用T命令执行机器指令

t - 执行CS:IP处的指令

mov ax, 0123H
mov bx, 0003H
mov ax, bx
add ax, bx

先调整cs和ip寄存器初始值

指令指针寄存器： IP
段寄存器：CS

用Q命令退出Debug

q - 退出Debug

CS、IP与代码段

两个关键的寄存器

CS：代码段寄存器
IP：指令指针寄存器
CS:IP：CPU将内存中CS:IP 指向的内容当作指令执行。

CS提供段地址，16位
IP可以理解为PC寄存器，提供的是偏移地址，也是16位
位址加法器对两个16位地址进行相加，然后得到一个20位地址
通过BUS地址总线，发送给MAR
MAR从内存中取出该地址对应的指令，然后放入MDR
MDR中的数据通过数据总线转交给CPU处理
因为，这里取出的指令是3个字节，因此这里IP自动加3

例示：在CS和IP指示下代码的执行

8086CPU当前状态：CS中内容为2000H，IP中内容为0000H
内存20000H~20009H处存放着可执行的机器代码

8086PC读取和执行指令演示

8086PC工作过程的简要描述：

（1）从CS:IP指向内存单元读取指令，读取的指令进入指令缓冲器；

（2）IP = IP + 所读取指令的长度，从而指向下一条指令；

（3）执行指令。转到步骤

（1），重复这个过程。

指令读取和执行的实证演示-Debug

用debug程序执行下面的代码

mov ax, 0123H
mov bx, 0003H
mov ax, bx
add ax, bx

a 地址 - 写入汇编指令

u 地址 - 查看代码

t - 执行CS:IP处代码

问：内存中有数据 B8 23 01 BB 03 00 89 D8 01 D8，究竟用作一般数据，还是用作指令？

答：CPU将CS:IP指向的内存单元中的内容看作指令！

jmp指令

修改CS、IP的指令：

事实：执行何处的指令，取决于CS:IP

应用：可以通过改变CS、IP中的内容，来控制CPU要执行的目标指令

问题：如何改变CS、IP的值？

方法1：Debug 中的 R 命令可以改变寄存器的值——r cs, r ip

Debug是调试手段，并非程序方式！

方法2：用指令修改

方法3：转移指令 jmp

转移指令 jmp :

同时修改CS、IP的内容

jmp 段地址：偏移地址

jmp 2AE3:3  

jmp 3:0B16

功能：用指令中给出的段地址修改CS，偏移地址修改IP。

仅修改IP的内容 jmp

某一合法寄存器

jmp ax （类似于 mov IP, ax）

jmp bx

功能：用寄存器中的值修改IP。

问题分析

从20000H开始，执行的序列是：

（1）mov ax,6622
（2）jmp 1000:3
（3）mov ax,0000
（4）mov bx,ax
（5）jmp bx
（6）mov ax,0123H
（7）转到第（3）步执行

内存中字的存储

事实：对8086CPU，16位作为一个字

问题： 16位的字存储在一个16位的寄存器中，如何存储？

回答:

高8位放高字节，低8位放低字节

问题: 16位的字在内存中需要2个连续字节存储，怎么存放？

回答:

低位字节存在低地址单元，高位字节存在高地址单元

例：20000D（4E20H）存放0、1两个单元，18D (0012H）存放在2、3两个单元

字单元

字单元：由两个地址连续的内存单元组成，存放一个字型数据（16位）

原理：在一个字单元中，低地址单元存放低位字节，高地址单元存放高位字节

在起始地址为0的单元中，存放的是4E20H
在起始地址为2的单元中，存放的是0012H

问题：

（1）0地址单元中存放的字节型数据是（ 20H）

（2）0地址字单元中存放的字型数据是（ 4E20H）

（3）2地址单元中存放的字节型数据是（ 12H ）

（4）2地址字单元中存放的字型数据是（ 0012H ）

机器字长、存储字长、指令字长

用DS和[address]实现字的传送

要解决的问题：CPU从内存单元中要读取数据

要求： CPU要读取一个内存单元的时候，必须先给出这个内存单元的地址

原理：在8086PC中，内存地址由段地址和偏移地址组成（段地址:偏移地址）

解决方案：DS和[address]配合，用 DS寄存器存放要访问的数据的段地址，偏移地址用[…]形式直接给出

给出偏移地址后，会默认去DS寄存器获取段地址

字的传送

8086CPU可以一次性传送一个字(16位的数据)

例

mov bx, 1000H
mov ds, bx
mov ax, [0] —> 1000:0处的字型数据送入ax
mov [0],cx —> cx中的16位数据送到1000:0处

案例

先将1000:0处内存的前四个字节设置为上面给出的值

在默认的起始地址处,输入指令

后面同理,DS和[address]配合，可以让我们通过从内存中快速读取一个字到指定寄存器中

DS与数据段

对内存单元中数据的访问

对于8086PC机，可以根据需要将一组内存单元定义为一个段。

物理地址=段地址×16+偏移地址
将一组长度为N（N≤64K）、地址连续、起始地址为16的倍数的内存单元当作专门存储数据的内存空间，从而定义了一个数据段。

例：用123B0H~123B9H的空间来存放数据

段地址：123BH 起始偏移地址：0000H 长度：10字节
段地址：1230H 起始偏移地址：00B0H 长度：10字节
…

处理方法：(DS): ( [address])

用DS存放数据段的段地址
用相关指令访问数据段中的具体单元，单元地址由[address]指出

mov、add、sub...

将哪段内存当作数据段，段地址如何定，在编程时安排

将123B0H~123BAH的内存单元定义为数据段

AL是AX的低字节位

用mov指令操作数据

加法add和减法sub指令

用DS和[address]形式访问内存中数据段方法小结

（1）字在内存中存储时，要用两个地址连续的内存单元来存放，字的低位字节存放在低地址单元中，高位字节存放再高地址单元中。

（2）用 mov 指令要访问内存单元，可以在mov指令中只给出单元的偏移地址，此时，段地址默认在DS寄存器中。

（3）[address]表示一个偏移地址为address的内存单元。

（4）在内存和寄存器之间传送字型数据时，高地址单元和高8位寄存器、低地址单元和低8位寄存器相对应。

（5）mov、add、sub是具有两个操作对象的指令，访问内存中的数据段（对照：jmp是具有一个操作对象的指令，对应内存中的代码段）。

（6）可以根据自己的推测，在Debug中实验指令的新格式。

栈及栈操作的实现

栈结构

栈是一种只能在一端进行插入或删除操作的数据结构。

栈有两个基本的操作：入栈和出栈。

入栈：将一个新的元素放到栈顶
出栈：从栈顶取出一个元素。

栈顶的元素总是最后入栈，需要出栈时，又最先被从栈中取出。

栈的操作规则：LIFO（Last In First Out，后进先出）

CPU提供的栈机制:

现今的CPU中都有栈的设计。

8086CPU提供相关的指令，支持用栈的方式访问内存空间。

基于8086CPU的编程，可以将一段内存当作栈来使用。

PUSH(入栈)和 POP(出栈)指令 

push ax：将ax中的数据送入栈中 

pop ax：从栈顶取出数据送入ax 

（以字为单位对栈进行操作）

例：设将10000H~1000FH内存当作栈来使用……

入站:

mov ax,0123H 
push ax 
mov bx,2266H 
push bx 
mov cx,1122H 
push cx

出栈:

pop ax 
pop bx 
pop cx

问题：

1、CPU如何知道一段内存空间被当作栈使用？

2、执行push和pop的时候，如何知道哪个单元是栈顶单元？

回答：

8086CPU中，有两个与栈相关的寄存器：

栈段寄存器SS - 存放栈顶的段地址
栈顶指针寄存器SP - 存放栈顶的偏移地址

任意时刻，SS:SP指向栈顶元素。

栈的操作

push 指令和pop指令的执行过程

push ax

（1）SP=SP–2；
（2）将ax中的内容送入SS:SP指向的内存单元处，SS:SP此时指向新栈顶

pop ax

（1）将SS:SP指向的内存单元处的数据送入ax中；
（2）SP = SP+2，SS:SP指向当前栈顶下面的单元，以当前栈顶下面的单元为新的栈顶。

栈顶超界问题:

如何能够保证在入栈、出栈时，栈顶不会超出栈空间？

执行入栈(push)时，栈顶超出栈空间

执行出栈(pop)时，栈顶超出栈空间

栈顶超界问题的解决

栈的小结

push、pop 实质上就是一种内存传送指令，可以在寄存器和内存之间传送数据，与mov指令不同的是，push和pop指令访问的内存单元的地址不是在指令中给出的，而是由SS:SP指出的。

执行push和pop指令时，SP 中的内容自动改变。

8086CPU提供的栈操作机制：

在SS，SP中存放栈顶的段地址和偏移地址，入栈和出栈指令根据SS:SP指示的地址，按照栈的方式访问内存单元。
push指令的执行步骤：

1）SP=SP-2
2）向SS:SP指向的字单元中送入数据。

pop指令的执行步骤：

1）从SS:SP指向的字单元中读取数据
2）SP=SP-2。

关于“段”的总结

基础: 物理地址=段地址×16+偏移地址

做法:

编程时，可以根据需要将一组内存单元定义为一个段。
可以将起始地址为16的倍数，长度为 N（N ≤64K ）的一组地址连续的内存单元，定义为一个段。
将一段内存定义为一个段，用一个段地址指示段，用偏移地址访问段内的单元——在程序中可以完全由程序员 安排。

三种段

数据段：将段地址放在 DS中，用mov、add、sub等访问内存单元的指令时，CPU将我们定义的数据段中的内容当作数据段来访问
代码段: 将段地址放在 CS中，将段中第一条指令的偏移地址放在IP中 ,CPU将执行我们定义的代码段中的指令
栈段: 将段地址放在SS中，将栈顶单元的偏移地置放在 SP 中 , CPU在需要进行栈操作(push、pop)时，就将我们定义的栈段当作栈空间来用。

综合示例：按要求设置段并执行代码

综合示例：三个段地址可以一样滴！

以上是关于汇编语言访问寄存器和内存篇---02的主要内容，如果未能解决你的问题，请参考以下文章

第三章寄存器（内存访问）

汇编语言——寄存器（内存访问 ds数据段寄存器，ss栈段寄存器）