x86架构初探之8086

Posted 2023-04-02 CS生

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了x86架构初探之8086相关的知识，希望对你有一定的参考价值。

x8086

计算机的组成
X86架构
CPU的实模式与保护模式

计算机的组成

下图是组成计算机的硬件们的抽象图。

CPU：计算机的最核心的硬件，负责执行（计算）程序。所有硬件设备都围绕它工作。
总线：主板上密密麻麻的集成电路，负责CPU和其它设备的高速通信。
内存：辅助计算机完成计算任务。因为复杂的任务需要复杂的计算步骤，复杂的计算步骤产生的计算结果的量是CPU寄存器无法容下的，内存负责帮助CPU存储超出CPU寄存器容量的那些中间结果。
其它设备：总线上还有一些其他设备，例如显卡会连接显示器、磁盘控制器会连接硬盘、USB 控制器会连接键盘和鼠标等等。

CPU的组成

CPU 其实也不是单纯的一块，它包括三个部分，运算单元、数据单元和控制单元。

运算单元：负责运算，例如做加法、做位移等。但是，它不知道应该算哪些数据，运算结果应该放在哪里。运算单元计算的数据如果每次都要经过总线，到内存里面现拿，这样就太慢了，所以就有了
数据单元：负责暂时存放数据和运算结果。数据单元包括 CPU 内部的缓存和寄存器组，空间很小，但是速度飞快。
控制单元：负责到底做什么运算。是一个统一的指挥中心，它的寄存器可以获得下一条指令，然后执行这条指令。这个指令会指导运算单元取出数据单元中的某几个数据，计算出个结果，然后放在数据单元的某个地方。

CPU和内存的配合

首先，要明确的是，

每个进程都会对应一个程序，程序是以二进制的形式存放咋硬盘上的。
进程一旦运行，就会有自己的独立的内存空间。例如：图中的进程A和B的内存空间就是互相隔离且不连续。
进程的内存空间会分为代码段和数据段，这是相对抽象的划分方法，实际上要更复杂。
指令分为两部分。前面一部分是操作数，代表做什么运算；后面一部分是操作的数据。
指令指针寄存器：为于CPU控制单元，它里面存放的是下一条指令在内存中的地址。

之后，我们看一下CPU和内存的交互过程，

首先，位于CPU控制单元的指令指针寄存器会指引控制单元持续不断地从代码段中读取指令，并把指令存放到位于控制单元中的指令寄存器。
之后，指令的第一部分交给运算单元，第二部分交给数据单元。
在之后，数据单元根据数据地址将数据段中的数据读到数据单元的数据寄存器中，此时数据就可以参与运算单元的运算了。
运算完成后，产生的结果会暂存在数据单元的数据寄存器中。
最终，会有指令将数据写回内存中的数据段。

CPU如何区分要执行的进程

上述的过程是针对一个进程而言的，那多进程时候CPU又是如何区分的呢？
CPU控制单元中有两个寄存器是专门区分当前应该执行那个进程的，它们分别是指令起始地址寄存器和数据起始地址寄存器。

指令起始地址寄存器：用来指向代码段的起始地址。
数据起始地址寄存器：用来指向数据段的起始地址。

当两个寄存器的指向都属于同一进程的内存空间，那么当前执行的就是这一进程的指令。

总线——CPU与内存交互的通道

CPU与内存的交互主要就两类数据，一类是地址，也就是我想拿内存中哪个位置的数据；一类是数据，真正的数据。它们通过不同类型的总线进行传输，分别是地址总线与数据总线。

地址总线：位数决定了能访问的地址范围到底有多广。例如只有两位，那 CPU 就只能认 00，01，10，11 四个位置，超过四个位置，就区分不出来了。位数越多，能够访问的位置就越多，能管理的内存的范围也就越广。
数据总线：位数决定了一次能拿多少个数据进来。例如只有两位，那 CPU 一次只能从内存拿两位数。要想拿八位，就要拿四次。位数越多，一次拿的数据就越多，访问速度也就越快。

X86架构

16位模型——8086处理器

控制单元

先看一下控制单元的寄存器们：

IP寄存器：指令指针寄存器。指向代码段中下一条指令的位置上。CPU 会根据它来不断地将指令从内存的代码段中，加载到 CPU 的指令队列中，然后交给运算单元去执行。
CS寄存器：代码段寄存器，就是前一个图中的指令起始地址寄存器。
DS寄存器：数据段寄存器，就是前一个图中的数据起始地址寄存器。
SS寄存器：堆栈段寄存器，存放堆栈段的起始地址。
ES寄存器
其它寄存器

数据单元

先看一下控制单元的寄存器们：

通用寄存器：8个16位，位数取决于机器字长。分别是 AX、BX、CX、DX、SP、BP、SI、DI。这些寄存器主要用于在计算过程中暂存数据。
AX、BX、CX、DX 可以分成两个 8 位的寄存器来使用，分别是 AH、AL、BH、BL、CH、CL、DH、DL，其中 H 就是 High（高位），L 就是 Low（低位）的意思。

CPU如何从内存中取数据

数据总线只有16位，即地址也是16位。而地址总线有20位，所以如何寻址呢？CS、DS对应的是起始位置，起始位置只能标定开头，想要确定段中的具体位置还需要段内位置，此之称为偏移量。计算公式为：
段内具体的位置 = 起始位置 << 4 + 偏移量。
代码段的偏移量在IP寄存器中，数据段的偏移量在通用寄存器中。另外，加法并不会导致数据位数溢出，因为，偏移量的范围是根据段的起始地址和段的结束地址而定的，并不是像多大就能多大。比如：段起始地址是FFFF0，段结束地址最大为FFFFF，偏移量的范围是0000~000F，偏移量根本不可能是FFFF。
这是一种直接的方法，从段寄存器这届拿取段起始地址。

32位模型

x86架构是一个兼容结构，32位的设计也要兼顾16位架构的设计。

数据单元

通用寄存器：将原先的16位寄存器扩展到32位，但是依然保留8位和16位的组成。

控制单元

IP寄存器：16位扩展到32位。

控制单元和原来16位设计不兼容的地方

因为原来的模式（16位的设计）其实有点不伦不类，因为它没有使用 16 位的数据作为一个段的起始地址，也没有按 8 位或者 16 位扩展的形式，而是根据当时的硬件，弄了一个不上不下的 20 位的地址。这样每次都要左移四位，也就意味着段的起始地址不能是任何一个地方，只是能整除 16 的地方。

如何解决呢？另起炉灶！

段描述符缓存器：真正的段起始地址。
某种表格：由段描述符组成，表格每一项是段描述符。
CS、DS、SS、ES寄存器：仍然是16位，存表格中的某一项。
段选择子寄存器：CS、DS、SS、ES寄存器组成。

CPU如何从内存中取数据

段选择自寄存器先从表格中选取一项，再从这项中拿到段起始地址。段起始地址最开始是在内存中，CPU为了更快的获得地址，会把段起始地址放入CPU的缓存中。
这是一种间接的方法。

CPU的实模式与保护模式

CPU模式	区分方式	所处时间	备注
实模式	从段寄存器中直接拿取段起始地址	系统刚启动时	此时是兼容16位的
保护模式	间接地先从段寄存器找到表格中的一项，再从表格中的一项中拿到段起始地址	需要更多内存时时	遵循一定的规则，进行一系列的操作地切换