存储系统

Posted 2022-12-08 生命是有光的

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了存储系统相关的知识，希望对你有一定的参考价值。

本笔记结合《2023王道计算机组成原理考研复习指导》食用🔥

王道考研计算机组成原理第三章存储系统

本笔记结合《2023王道计算机组成原理考研复习指导》食用🔥
1、存储系统
1.1、存储器的层次化结构
1.2、存储器的分类
1.2.1、按层次分类
1.2.2、按存储介质分类
1.2.3、按存取方式
1.2.4、按信息的可更改性
1.2.5、按信息的可保存性

1.3、存储器的性能指标
1.4、小结

2、主存储器的基本组成
2.1、基本的半导体元件及原理
2.2、存储器芯片的基本原理
2.3、寻址
2.4、小结

3、SRAM和DRAM
3.1、DRAM芯片
3.1.1、栅极电容和双稳态触发器
3.1.2、高频考点🔥
3.1.3、DRAM的刷新🔥
3.1.4、小结

4、只读存储器ROM芯片(22大纲已删)
4.1、了解各种ROM
4.2、计算机内的重要ROM
4.3、小结

5、主存储器与CPU的连接
5.1、单块存储芯片与CPU的连接
5.2、存储芯片的输入输出信号
5.3、增加主存的存储字长-位扩展
5.4、增加主存的存储字数-字扩展🔥
5.4.1、线选法
5.4.2、译码器片选法
5.4.3、小结

5.5、主存容量扩展-字位同时扩展
5.6、小结
5.7、译码器补充知识

6、提升主存速度
6.1、双端口RAM
6.2、多体并行存储器
6.3、单体多字存储器
6.4、小结

7、外部存储器
7.1、磁盘存储器
7.1.1、磁盘设备的组成
7.1.2、磁盘的性能指标
7.1.3、磁盘地址
7.1.4、磁盘的工作过程
7.1.5、磁盘阵列
7.1.6、小结

7.2、固态硬盘SSD

8、Cache(重点)
8.1、局部性原理
8.2、性能分析
8.3、界定周围
8.4、小结

9、Cache-主存映射方式
9.1、全相联映射(随意放)
9.2、直接映射方式(只能放固定位置)
9.3、组相联映射(可放到特定分组)
9.4、小结

10、Cache替换算法
10.1、随机算法(RAND)
10.2、先进先出算法(FIFO)
10.3、近期最少使用算法(LRU)
10.4、最不经常使用算法(LFU)
10.5、小结

11、Cache写策略
11.1、写命中
11.2、写不命中
11.3、多级Cache

1、存储系统

1.1、存储器的层次化结构

在上述金字塔中，越上层的速度越快、容量越小、价格越高。
当我们用手机打开微信，出现微信的地球页面加载时，其实就是把微信从辅存放入主存中，然后CPU就会开始运行微信相关的代码。辅存中的数据要调入主存后才能被CPU访问
主存之上还有Cache高速缓存存储器，上述箭头表示 读/写数据，之所以要在CPU和主存之间加Cache，是因为虽然主存的读写速度已经很快了，但是还是远远跟不上CPU的处理速度。
主存和辅存之间的交换是由硬件+操作系统来实现的，操作系统需要实现页面置换算法来决定把哪些数据从主存换出到辅存。主存和Cache由硬件自动完成。

1.2、存储器的分类

1.2.1、按层次分类

第一种分类的方式就是按照层次结构来分类，我们需要重点关注的是中间三层高速缓存、主存、辅存。高速缓存和主存可以直接被CPU读写，而辅存里的数据只有调入到主存之后才可以被CPU访问。

1.2.2、按存储介质分类

无论是什么存储器，终归都是用来存储二进制数据的。根据存储二进制位的存储介质不同，我们分为：

半导体存储器
- 以半导体器件存储二进制数据，主存、Cache一般都是用半导体实现的存储器。
磁表面存储器
- 磁带、磁盘(机械硬盘)，以磁性材料存储二进制数据
光存储器
- 以光介质存储信息，光盘、DVD等

1.2.3、按存取方式

随机存取存储器(RAM Random Access Memory)
- 读写任何一个存储单元所需时间都相同，与存储单元所在的物理位置无关。例如内存条。
- 我们知道存储器都是分为一个个的存储单元，每个存储单元都有各自的地址编号，随机存取存储器就是指我们读写任何一个地址的存储单元，所需要的时间都是相同的。读写速度并不会因为存储单元的物理位置而改变。
顺序存取存储器(SAM Sequential Access Memory)
- 读写一个存储单元所需时间取决于存储单元所在的物理位置。例如磁带，我们要等磁带一直转转转。
直接存取存储器(DAM Direct Access Memory)
- 既有随机存取特性，也有顺序存取特性。先直接选取信息所在区域，然后按顺序方式存取。例如机械硬盘
- 读写速度：随机存取存储器 > 直接存取存储器 > 顺序存取存储器

我们将顺序存取存储器和直接存取存储器也称为串行访问存储器

串行访问存储器：读写某个存储单元所需时间与存储单元的物理位置有关

上述三种存储器都是指定数据的存储地址，然后直接去那个地址当中进行读写。而下面的相联存储器是指明数据内容，根据数据内容来查找位置。前者是根据地址访问，后者是根据内容访问。

相联存储器
- 即可以按内容访问的存储器。可以按照内容检索到存储位置进行读写，"快表"就是一种相联存储器

1.2.4、按信息的可更改性

读写存储器(Read/Write Memory)——即可读、也可写（如：磁盘、内存、Cache）
只读存储器(ROM Read Only Memory)——只能读，不能写（如：实体音乐专辑通常采用CD-ROM，实体电影采用蓝光光碟，Bios通常写在ROM中，都是用来存储不太能被更改的数据)

1.2.5、按信息的可保存性

断电后，存储信息消失的存储器——易失性存储器（主存、Cache）
- 电脑正在play game呢，突然断电了，就 game over了。因为游戏在主存存着呢，重启也才开始把操作系统向主存调入运行呢，然后重启游戏。
断电后，存储信息依然保持的存储器——非易失性存储器（磁盘、光盘）
信息读出后，原存储信息被破坏——破坏性读出（如DRAM芯片，读出数据后要进行重写）
- 我们读出DRAM芯片里面的二进制信息，里面存储的信息会被破坏掉，我们需要对数据进行重写。
信息读出后，原存储信息不被破坏——非破坏性读出（如SRAM芯片、磁盘、光盘）
- 我们读出DRAM芯片里面的二进制信息，里面存储的信息不会被破坏掉。

1.3、存储器的性能指标

存储器的数据寄存器MDR位数反映了存储器存储字长是多少，MAR位数反映了存储器存储字数为多少，存储字长×存储字数 = 存储容量。
单位成本：每一个比特位需要付出的金钱成本。
- 例如一个8G内存条，共256块大洋。256/8GB=256/64Gbit，就是单位成本。
存储速度：也称为 数据传输率=数据的宽度(存储字长)/存储周期。
- 每一个存储周期我们可以读或者写一个存储字的数据。存储周期又分为存取时间和恢复时间两部分。
- 每一次读写我们都需要存储时间，然后需要恢复一段时间才能进行下一次读写。所以虽然理论上我们一次读写只需要Ta时间，但是我们若要进行连续的多次读写，多次读写之间至少需要Tm时间间隔。所以存取时间并不等于存储周期。
主存带宽就是我们的数据传输率。

1.4、小结

2、主存储器的基本组成

这一节主要学习半导体元件存储二进制数据的原理，通过半导体元件的组合构成存储芯片，由于存储芯片里面存储了很多个字的数据，因此存储芯片必须提供一个寻址的功能。

2.1、基本的半导体元件及原理

一个存储器可以分为存储体、MAR、MDR三大部分。MAR是地址寄存器，MDR是数据寄存器，这三部分会在时序控制逻辑电路的控制下工作。存储体是用来存储二进制数据0和1的，而存储体又是由一个个存储单元构成，存储单元又是由一个个存储元构成，用一个存储元就可以存储一位二进制0或1。一个存储元又包含两个半导体元件，分别为电容和MOS管。

我们可以将MOS管看成是用电控制的开关，当电压足够时MOS就可以连通导电，若不加电压或者电压不足，那么就断开不导电。这就是叫做半导体的原因，既不是导体也不是绝缘体，在一定条件下既可以转换为导体，也可以转换为绝缘体。

电容由两个金属板和中间的绝缘体构成，如图下方的金属板接地，所以下方金属板的电压是0V，如果我们给上方金属板加一个大于0V的电压，由于两块金属板产生了电压差，因此电容里面的电荷会移动，也就是所谓的给电容充电，这个电容里面就可以保存一定的电荷。若给上方金属板加的是0V或者1V的电压，两块金属板不产生电压差或者产生的电压差很小，也就不会给电容充电，也就不会保存电荷。所以我们可以根据电容是否保存了电荷来对应二进制的0和1。

我们来看如何读出一个二进制：

如上图，假设此时电容保存了电荷，规定保存了电荷表示二进制1，不保存电荷表示二进制0
我们只需要给MOS管加高电压，也可以理解为输入一个二进制的1，则MOS接通可以导电，则电容保存的电荷可以通过MOS管向外流，当在右端监测到有电流通过，则说明存储元输出的是1
若电容没有保存电荷，相当于表示二进制的0，当MOS管接通时我们在右端并不能检测到有电荷的流出，因此说明存储元输出的是0

我们来看如何写入一个二进制：

假设我们想让电容保存电荷，我们可以在右端加高电压，同时给MOS管也加高电压，这样MOS管可以接通，接通之后电容的上方金属板就有高电压，而下方金属板接地所以是0V，则产生电压差，电容充电会产生电荷，并且我们让MOS管断开，电荷就跑不出去了。

我们把多个存储元进行科学合理的连接，那么我们就可以一次性读出或者写入多个二进制数据，图中红线代表连接了每一个MOS管，我们只需给红线通电，那么所有的MOS管都可以连通，电容存储的电荷就可以顺着绿色的线流出，我们只需要看每条绿色的线有没有电流，就可以读出二进制是0还是1。

这样的一整行存储元就是我们的一个存储单元，也就是一个存储字，而多个存储单元则构成了存储体，也称为 存储矩阵，上图中存储体只包含了两个存储单元。我们一次可以读出一行的二进制就是存储字，如上图例子当中的存储字长为8bit，因为一行共有8个存储元。这样我们就理解了为什么每次存储器每一次读或者每一次写都是一个存储字。

1个字节B一定等于8比特bit，而一个存储字等于多少比特是看存储单元中一行是几个存储元。

2.2、存储器芯片的基本原理

如何根据地址来决定读写哪个存储字呢？这就涉及到译码器的使用，译码器的作用：n位二进制地址会对应2ⁿ个存储单元，所以译码器会根据地址寄存器MAR里面的地址，把它转变为某一条选通线的高电平信号。

例如图中CPU给MAR送来的地址是3个0，对应十进制的0，所以译码器会把第0根字选线给一个高电平的输出，这样第一个存储字所对应的存储元都会被选通，每个地址会对应译码器的一条输出线，总共有2³=8个地址，因此译码器的输出端总共会有8条线。所以经过译码器的处理，一个地址信号会被转换为译码器的某一条输出线的高电平信号。

当图中第0条字选线被接通之后，我们就可以通过图中数据线(绿色的线)把每一位二进制信息传送到MDR当中，CPU会通过数据总线从MDR当中取走这一整个字的数据。数据总线的宽度=存储字长。

例子中的总容量 = 存储单元个数×存储字长，存储单元个数=2³(即多少行)，因为只有3位的地址。存储字长是8bit，所以总容量为2³×8bit=8B

我们继续完善存储器芯片的构成，我们需要增加一个控制电路，用于控制译码器MDR和MAR，当CPU通过地址总线把地址送到MAR当中，但是由于我们使用的是电信号来传送这些二进制数据，而电信号难免会有不稳定的情况，因此在MAR里面的电信号稳定之前，这个地址信息是不能送到译码器当中的。这就是控制电路的作用，只有MAR稳定之后控制电路才会打开译码器的开关，让译码器来翻译这个地址，然后给出相应的输出信号。同样，在数据线输出时，只有当电信号稳定，电路才会认为此时的输出是正确的，所以控制电路也会控制MDR在稳定后给数据总线送出数据。

同时存储器芯片还需要向外提供片选线，通常表示为CS或者CE(上方加一条横线)来表示片选线的电信号，头上划线表示该信号低电平有效。CS表示Chip-select芯片选择信号，如果给出的芯片选择信号是一个低电平则说明这个芯片的总开关是被接通的。有些书也会命名为CE表示Chip-enable芯片使能信号。

另外，控制电路还要提供读控制线和写控制线。若分成两条线，WE表示允许写，上方划横线表示当写控制线的信号是低电平的时候表示此时这个芯片正在进行写操作，也就是把MDR里面的数据输入到各个存储元当中。OE表示允许读，上方划横线表示当读控制线的信号是低电平的时候表示此时这个芯片正在进行读操作，也就是读出存储元里面的数据。若分成一条线，则低电平表示芯片正在执行写操作，高电平表示芯片正在执行读操作。采用两种方案芯片对外暴露的金属引脚是不一样的。

整体来看，我们的存储芯片由存储矩阵(存储元)，译码驱动包含译码器和驱动器，通常会在译码器后面接上一个驱动器，这个驱动器的作用保证译码器输出的电信号是稳定可靠的，驱动器其实就是将电信号进行放大的一个部件，读写电路包括控制电路和字选线等。另外一块存储芯片需要接收来自外界的地址信息，地址信息通常是由CPU通过地址总线传过来的，另外还需要数据线进行数据的传输。除此之外，还需要通过片选线的电信号来确定这块存储芯片此时是否可用，另外还需要提供读/写控制线，可能有两条，也可能有一条。

一个内存条可能包含多块存储芯片，每一块存储芯片都是1GB，8块就能存储8GB的数据。若我们要读取的数据是其中的某一块存储芯片，那么我们提供了读写地址之后，我们只能让这块存储芯片工作，其他存储芯片不能工作。这就是片选线的作用，若我们只想读取这块芯片指定地址的数据，那么我们就需要让这块地址的片选线信号有效，也就是给CS(上方划线)信号一个低电平，而其他芯片的CS信号都给高电平。

每一个存储芯片都会向外暴露一个个金属引脚，这些引脚是用来接收地址信号、片选信号、数据信号、读写信号用的，所以通常题目会给芯片的参数信息，让你判断这块芯片引脚的数目至少是多少，其实就是**判断地址线有多少根、数据线有多少根，片选线1根，读/写控制线1根或2根，然后加和就是对应的引脚。**另外，还会有供电引脚、接地引脚。

若一块存储芯片有n位地址，那意味着地址线需要有n条，这n位地址又会对应2ⁿ个存储单元。知道了存储单元的数量，就可以乘以存储字长来得到总容量。

还会碰到 8×8位的存储芯片：

第一个8表示8个存储单元，第二个8表示8位存储字长。
第一个表示存储单元的数量，第二个表示存储单元的字长。
存储单元的数量对应地址线的根数，存储字长对应数据线的根数。
- 2ⁿ个存储单元对应n条地址线，MDR的位数对应数据线的根数

2.3、寻址

在上图中一个小方格表示1B，也就是8bit。一整行表示的是一个存储字(存储单元)，也就是这块存储体的存储字长是4B，假设总容量是1KB，也就是256个存储字，也就是共256行。现代计算机都是按字节编址的，也就是说每个字节会对应一个地址，这个存储体当中共有1K个字节，就会对应1K个地址。我们的地址线就应该有10根，因为2¹⁰=1K，整个地址信号是从10个全0到10个全1，0~1023。

我们按字寻址，由于一个字占4个字节，因此会将4个连续的字节地址合并，看成一整个字。当我们指明了要读的是第几个字的时候，我们只需要把字地址进行算术左移两位(相当于×4)，这样就可以把字地址转换成与之对应的字节地址。

2.4、小结

3、SRAM和DRAM

DRAM：动态RAM，Dynamic Random Access Memory
SRAM：静态RAM，Static Random Access Memory

动态RAM用于主存，SRAM用于Cache。高频考点是DRAM和SRAM的对比。

3.1、DRAM芯片

我们在上方介绍的其实就是DRAM芯片，DRAM芯片被用于主存。

DRAM芯片：使用栅极电容存储信息
SRAM芯片：使用双稳态触发器存储信息
核心区别：存储元不一样

3.1.1、栅极电容和双稳态触发器

如上图，我们之前说过，我们给字选择线加高电压，就会使得MOS管接通，若同时我们给数据线也加高电压，那么电容的上金属板就会是高电压，而下金属板由于接地所以是0V电压，这样会产生电压差，电容会存储电荷，这样我们就完成了二进制1的写入。若我们给数据线一个低电压，那么电容两块金属板没有电压差，电容不会存储电荷，这样就完成了二进制0的写入。因此电容内存储了电荷表示二进制1，电容内未存储电荷表示二进制0。

如上图，左边是栅极电容，右边是双稳态触发器，双稳态触发器中包含6个MOS管，分别用M1、M2、M3、M4、M5、M6标注，因为这个触发器可以呈现出两种稳定的状态

第一种状态：A点是高电平、B点是低电平，我们规定这种状态对应二进制的1
第二种状态：A点是低电平、B点是高电平，我们规定这种状态对应二进制的0

对于栅极电容组成的存储元，数据线只有一根，而双稳态触发器需要两根数据线来读出0或者1。对于双稳态触发器来说，如果它里面存储的是二进制的1，那么我们给字选择线高电压，右边数据线BLX会输出一个低电平信号，而若里面存储的是二进制的0，那么左边数据线BL会输出一个低电平信号。所以我们根据左右两边哪条线输出了低电平信号，我们就可以判断这个触发器里面存储的是0还是1了。这就是读出触发器里面数据的原理。

若我们要写入触发器数据0，我们给左边数据线BL低电平、给右边数据线BLX高电平，这样就可以使得触发器A点低B点高，这个状态对应的就是二进制的0。

那么栅极电容和双稳态触发器有什么区别呢？

读写数据
1. 栅极电容在读出数据的时候，电荷会通过MOS管使得数据线上产生电流，也就是电容放电，电容放电了之后就会使得电容由1变为0，因此当我们读出栅极电容的信息之后，这个电容里面的信息被我们破坏掉了，是破坏性读出。若要解决这个问题，我们读出后应该有重写操作，也称为再生。也就是需要给电容重新充电，让其又变为1
2. 双稳态触发器在读出数据的时候，触发器的状态保持稳定。是 非破坏性读出，无需重写
成本
1. 栅极电容需要1个MOS管，双稳态触发器需要6个MOS管。栅极电容每个存储元制造成本更低，双稳态触发器每个存储元制造成本更高。
2. 若存储芯片大小是固定的，那么栅极电容存储元由于体积小所以集成度高(更密集的集成在芯片上)，而双稳态触发器存储元由于体积大所以集成度低
3. 栅极电容存储元电路简单，功耗低。双稳态触发器存储元电路复杂，功耗高

因为栅极电容需要重写，所以读写速度更慢；而双稳态触发器不需要重写，所以读写速度更快。

3.1.2、高频考点🔥

3.1.3、DRAM的刷新🔥

电容里面虽然可以存储电荷，但是这个电荷会慢慢流失，电容电荷只能维持2ms，2ms后即使不断电电容里面的电荷也会消失。所以我们2ms之内必须刷新一次，也就是给电容充电。

双稳态触发器只要不断电，触发器的状态就不会改变。要不怎么叫双稳态呢？就问你服不服？

多久需要刷新一次？刷新周期：一般都是2ms
每次刷新多少存储单元？以行为单位，每次刷新一行存储单元，存储单元又是由一个个存储元组成的
为什么刷新要用行列地址？减少选通线的数量

如上图，我们先看左边存储器简单模型，当我们给了一位地址给译码器之后，译码器会将其转换成其中某一条选通线的高电平信号，若我们有n位地址给译码器，那么就意味着译码器会有2ⁿ根选通线。若有20位地址，那么选通线就有2²⁰，这么多线根本难以实现。

所以看右边，我们将存储单元从一维列排列改成二维行列排列，这样n位地址会被拆分成行地址和列地址，行地址译码器处理一半2¹⁰根选通线，列地址译码器处理一半2¹⁰根选通线，这才1024根线，好实现！

若我们给的地址是 00000000，8位的0。若按照左边的简单模型，8位地址译码器会有2⁸根选通线，8位0转换为十进制0，那么译码器就选通0号线，也就是选中0号存储单元。若按照右边的模型，8位0会被分割为前4位0和后4位0，转换为十进制是0和0，也就是0行0列，行译码器有2⁴根选通线，列译码器有2⁴根选通线，这样就选中了(0，0)存储单元。

如何刷新？有硬件支持，读出一行的信息后重新写入，占用1个读/写周期(相当于进行一次写操作呗)
在什么时刻刷新？

假设DRAM内部有128行×128列的存储单元，并且每个读写周期是0.5us，那么电容可以坚持的最长的时间是 2ms/0.5us=4000个读写周期，读写周期也称为存取周期

思路一：每次读写完都刷新一行【分散刷新】
- 我们有128行，每刷新一行都需要0.5us，若每次读写完都刷新一行，则系统的存取周期就会变成1us，前0.5us时间用于正常读写，后0.5us时间用于刷新某行。也就是2ms的时间内总共会有2000次刷新操作。这2000次刷新操作足够在2ms内给128行的存储单元每一行都刷新很多次。
思路二：2ms内集中安排时间全部刷新【集中刷新】
- 我们可以在2ms快到的时候给全部的128行存储单元进行刷新，2ms可以分为4000个读写周期，如果采用这种策略，我们会采用前面的3872个周期进行正常的读写，最后会留下128个读写周期来刷新这128行。
- 此时系统的存取周期还是0.5us，因为连续的读或者写中间只需要间隔0.5us即可
- 最后一段时间是专门用于刷新的，这短时间CPU无法对存储器进行读写操作，所以集中刷新的时间也称为 死区(死时间)
思路三：2ms内每行刷新1次即可【异步刷新】
- 2ms内需要产生128次刷新请求，所以每隔 2ms/128 = 15.6us 一次，则每隔15.6us我们进行一次刷新刷新一行，每15.6us内有0.5us的 (死区)死时间
- 在实际过程中，我们可以利用CPU不需要访问存储器的时间进行刷新，比如CPU取得一条指令，在对这条指令译码的阶段内刷新

3.1.4、小结

这里看一下最后一行送行列地址：

同时送的意思是行地址和列地址会同时丢给行地址译码器和列地址译码器，如果采用这种策略，我们地址有多少位我们就需要设置多少根的地址线。

SRAM因为集成度低存储量更小，所以对应的行列地址的地址位数更少，所以我们可以同时送行列地址
DRAM存储量更大，所以对应的行列地址的地址位数更多，假设我们有n位地址线来同时传送行和列地址，如果采用地址线复用技术，我们可以把行地址和列地址通过前后两次分别进行传输，也就是只需要 n/2 条地址线就可以实现地址传输。第一次传输把行地址送到行地址缓冲器里面，第二次传输把列地址送到列地址缓冲器里面，接下来在控制电路的控制之下再分别传送给行地址译码器和列地址译码器。

行、列地址分两次送，可使地址线更少，从而芯片引脚也更少。原本需要n个引脚来接收n个地址，现在只需要n/2个引脚就可以接收n个地址，先接收行地址，再接收列地址。

4、只读存储器ROM芯片(22大纲已删)

4.1、了解各种ROM

MROM(Mask Read-Only Memory)——掩模式只读存储器
- 厂家按照客户需求，在芯片生产过程中直接写入信息，之后任何人不可重写(只能读出数据，不能写入数据)
- 可靠性高、灵活性差、生产周期长、只适合批量定制
PROM(Programmable Read-Only Memory)——可编程只读存储器
- 用户可用专门的PROM写入器写入信息，写一次之后就不可更改
EPROM(Erasable Programmable Read-Only Memory)——可擦除可编程只读存储器
- 允许用户写入信息，之后用某种方法擦除数据，可进行多次重写
- UVEPROM(ultraviolet rays)——用紫外线照射8~20分钟，擦除所有信息
- EEPROM(也常记为E²PROM，第一个E是Electrically)——可用电擦除的方式，擦除特定的字
Flash Memory ——闪速存储器（注：U盘、SD卡就是闪存）
- 在EEPROM基础上发展而来，断电后也能保存信息，且可进行多次快速擦除重写
- 闪速存储器的每个存储元只需单个MOS管，每个存储元的体积比RAM的体积要更小，所以闪存位密度比RAM高(因为对于体积都相同的芯片来说，闪存芯片上存储元的数量更多，也就是可以保存更多的二进制比特位)
- 注意：由于闪存需要在写入数据的时候需要先把数据电擦除然后在写入，而在读数据的时候直接读就可以，因此闪存的写速度要比读速度更慢
SSD(Solid State Drives)——固态硬盘
- 由控制单元+存储单元(Flash芯片)构成，与闪速存储器的核心区别在于控制单元不一样，但存储介质都类似，可进行多次快速擦除重写。SSD速度快、功耗低、价格高。
- 拓：手机辅存也使用Flash芯片，但相比SSD使用的芯片集成度更高、功耗更低、价格更贵。

4.2、计算机内的重要ROM

计算机的主存是用来存放一系列的指令和数据的，CPU要做的事就是从主存中取一条条指令并执行指令，然而RAM是易失性的芯片，断电后RAM内数据全部丢失，也就是关机后主存的数据全部没了。当开机后，就需要将辅存内的操作系统重新调入到主存，但是由于此时的主存是空的，并没有指令，所以CPU会去主板上的ROM芯片来读取开机的指令，这个ROM芯片就是BIOS芯片，其中BIOS芯片存储了 自举装入程序，负责引导装入操作系统(开机)。ROM是非易失性的，即使计算机没有供电，ROM芯片里面的指令也不会丢失。

注意：虽然这块ROM芯片是集成在主板上，但是在逻辑上，我们将其看成是主存的一部分。逻辑上，主存由RAM+ROM组成，且二者常统一编址。也就是在计组这门课，我们说的主存，除了内存条外，还应该加上BIOS芯片。

4.3、小结

RAM支持随机存取，很多ROM也支持随机存取，我们给一个地址，访问速度并不会因为地址而改变。

5、主存储器与CPU的连接

5.1、单块存储芯片与CPU的连接

单块存储芯片需要对外暴露这样的接口：

右上方绿色的线用于传送数据，通常会通过数据总线和CPU进行连接
左下角红色的线用于传送地址，通常会通过地址总线和CPU进行连接
还需要暴露左上方的片选线接口、读写控制线接口，CPU通过控制总线来发送控制信号
上图是8×8位的存储芯片，因为共有8个存储单元(字)，每个字的字长是8位。
上图我们把MAR和MDR都划在了存储芯片里面，但是现在的计算机MAR、MDR通常集成在CPU内部，所以现在生活中存储芯片内的寄存器并不是MAR和MDR，只是一个普通的寄存器(暂存输入、输出数据)

思考：

我们只使用了单块存储芯片来存储数据，并且只能存储8B数据，若想要扩展主存字数怎么办？【字扩展】，我们可以连接多块芯片来扩展主存的字数
上图中存储芯片字长只有8位，CPU一次只能存或者取8bit数据，如今的CPU大多可以存或者取64bit，也就是数据总线的宽度有64bit。数据总线宽度>存储芯片字长，怎么办？【位扩展】通过多块存储芯片的合理连接，我们可以让整个主存的存储字长扩展为和数据总线宽度一致。

现在的计算机CPU里面集成了MAR和MDR，MDR里面存储的数据也就是要读或者要写的数据是通过数据总线和主存进行交换，MAR里面存储的地址数据是通过地址总线送给主存。CPU通过控制总线向主存发送读写控制信息。现在的主存一般会包含很多块的存储芯片。如下图，用红框圈出来的黑黑的部分就是存储芯片，各有4块。

5.2、存储芯片的输入输出信号

多块存储芯片如何与CPU进行交互呢？为了方便，我们给存储器芯片的输入信号和输出信号进行命名

我们有可能要输入多位的地址，地址通常用A(Address)来表示，A₀表示地址的低位，A₇表示地址的高位。
输出的数据我们用D(Data)来表示，D₀表示数据的低位，D₇表示地址的高位。
片选信号使用CS或者CE来表示，若上面划横线，表示这个信号低电平有效。若上面没划横线，表示这个信号高电平有效。
读写信号我们使用WE(Write)或者WR(Read)来表示，上面划横线，表示当这个信号是低电平时是在进行写操作，在高电平时是读操作。
- 也有可能分为写为WE和OE，上面划横线表示低电平有效。写操作用WE表示，读操作用OE表示。

上面有横线说明低电平有效，没有横线说明高电平有效。

5.3、增加主存的存储字长-位扩展

如果我们有8K×1位的存储芯片，这个单块存储芯片如何和我们的CPU进行连接呢？首先8K也就是有8K=2¹³的存储单元，所以我们需要用13根地址线来表示这8K个地址，因此这块芯片对外暴露的地址应该是A₀ -> A₁₂共13条地址线，CPU会把它想访问的地址通过地址总线(红色)送过来，这样就完成了地址线的连接。

WE信号表示Write Enable写使能信号，头上未划线表示高电平有效，也就是当信号是高电平信号时，CPU要向存储器里面写数据，而当信号是低电平信号时，表示CPU要从中读数据。CPU也会有一个引脚来发送读写控制信号，这个信号通过控制总线(褐色)传给芯片。

CPU可以通过数据总线(绿色)来读或者写8bit数据，然而由于存储芯片存储字长的限制，我们每次只能通过数据总线来传送一个bit，数据总线的利用率很不充分。

存储芯片还有一个CS片选信号，由于只有这一块芯片工作，所以我们可以简单粗暴的接上高电平信号。因为CS头上没有划横线，意味着片选信号高电平有效。

此时整个主存只有一个存储芯片，每次只能读或者写一位数据，因为主存的存储字长是1bit。

我们可以给主存再加上一块相同信号的存储芯片，CPU将想要访问的地址信息传给这个芯片，两个芯片都有8K的存储单元，所以如果把13位的地址信息同时送给这两个芯片，这个地址信息可以选中两个芯片相同位置的存储单元。当然我们也可以把CPU发送的读写控制信号WE同时送给两个芯片，使得两个芯片要么同时读，要么同时写。右边芯片读出的数据我们可以作为CPU读入的D₁这一位的数据。接下来只需要个CS片选信号加一个高电平。这样这两块芯片就可以同时工作。

进行了这个改造之后，我们整个主存储器总共有两个存储芯片，存储字长扩展成了2位，现在我们就可以同时读或者同时写两位的信息。

同理继续增加芯片，每个芯片都有8K个存储单元，CPU发出的A₀到A₁₂这13位的地址信息会同时送给8片存储芯片。

我们把8片8K×1位的存储芯片通过位扩展扩展成1个8K×8位的存储器，总容量为8KB

5.4、增加主存的存储字数-字扩展🔥

5.4.1、线选法

我们有一片8K×8位的存储芯片，CPU可以同时读或者写8位的信息，由于我们的存储芯片存储字长已经有8位了，CPU的处理数据的宽度和存储字长是可以对应的，对于这样的场景，我们不需要进行位扩展，因为数据总线的利用率已经达到100%。

8K也就是有8K=2¹³的存储单元，所以我们需要用13根地址线来表示这8K个地址，因此这块芯片对外暴露的地址应该是A₀ -> A₁₂共13条地址线，CPU会把它想访问的地址通过地址总线(红色)送过来，这样就完成了地址线的连接。

注意：CPU还有三个地址A₁₃->A₁₅没有被用到，也就是CPU的MAR有16位，我们现在只利用了13位，我们如何解决这个问题呢？

我们会买一个同型号的芯片，按照位扩展，将低位的13根地址线(红线)也连接在第二块芯片上，同时8位数据通过地址总线(绿线)传给CPU，读写控制线(褐线)也连接。当CPU给出一个全0的地址之后，地址会通过地址总线同时传给左右两个芯片，两个芯片的8位数据都会通过数据总线传给CPU，这样就会发生数据冲突。

所以我们进行改造，我们将A₁₃地址信息连到左边芯片，将A₁₄地址信息连到右边芯片，由于片选信号高位有效，因此当A₁₃和A₁₄分别为0的时候，意味着左边芯片片选信号有效开始工作，而右边芯片片选信号无效不工作。这样虽然不会发生数据冲突，然而当A₁₃和A₁₄都为1时，还是会发生数据冲突。

上述连线方法称为线选法：我们会用专门的地址线作为片选信号来选中其中的某一块芯片，如果CPU有n条地址线，采用这种方法我们就只能有n个片选信号。

5.4.2、译码器片选法

如上图，我们对线选法进行改进，将地址A₁₃连接的地址总线分成两条线接出去，上方线接了非门取反电路，当A₁₃地址线的信号是1，那么下方线直接连接到左边芯片，左边芯片进行工作。而上方线经过非门取反的改造信号就会变成0，这样右边芯片不会工作。

非门取反电路我们可称为 1-2译码器：输入一位的地址信息，可能呈现2¹=2中不同的状态，这两种状态会被译码器翻译为高电平、低电平。

译码器片选法：我们可以译码器来处理CPU的高位地址部分，如果CPU给出n位高位地址，也就是n条线，那么会有2ⁿ个片选信号。

如上图，我们给3位地址线，经过译码器翻译会产生2³共8个片选信号，所以也称为3-8译码器。

地址为000，对应十进制的0，那么译码器的0号片选线就会被选通。0号线会发出高电平信号，其余线会发出低电平信号。
地址为001，对应十进制的1，那么译码器的1号片选线就会被选通。1号线会发出高电平信号，其余线会发出低电平信号。
地址为010，对应十进制的2，那么译码器的2号片选线就会被选通。2号线会发出高电平信号，其余线会发出低电平信号。
注：我们给译码器输出线既可以由上至下编号，也可以逆过来由下至上编号。

有了译码器之后，我们再来看如何更好的进行 字扩展

如上图，2-4译码器，输入两个信号输出四个信号。4个芯片，每个芯片都是接收由CPU发送的低地址13位的地址信息(为了画图好看，不要理解为第二块芯片的地址信息是由第一块传来的)，图中片选线CS上方加了横线，表示低电平有效，我们通过表示低电平有效时会在译码器输出线末尾画一个小圆，同时译码器的输出端也会画一个小圆圈(非门的图示最重要的就是小圆圈)，译码器输出端小圆圈我们可以理解为进行了一次取反

当A₁₃=0，A₁₄=0，那么0号片选线会被选中，只有第一个芯片工作
- 若第一块芯片要工作，那么A₁₄A₁₃两个高位地址必须为00，第一个芯片的存储地址范围是00....0 -> 001....1 也就是00后面跟上13位，总共8K个地址
当A₁₃=1，A₁₄=0，那么1号片选线会被选中，只有第二个芯片工作
- 若第二块芯片要工作，那么A₁₄A₁₃两个高位地址必须为01，第一个芯片的存储地址范围是01....0 -> 011....1 也就是01后面跟上13位，总共8K个地址

考试为了折磨人，可能会给A₁₃和A₁₅作为译码器的输入信号，这样无论A₁₄是取0还是1都影响不到选片操作。

当A₁₃=0，A₁₅=0，那么0号片选线会被选中，只有第一个芯片工作，中间A₁₄无所谓
- 当A₁₄为0，就会有8K个地址
- 当A₁₄为1，还会有8K个地址
- 实际设计是不可能这么采用的，也就考试中遇到了。。

5.4.3、小结

线选法：将n条多余的地址线将它们作为n个片选信号，电路简单，地址空间不连续

译码器片选法：将n条多余的地址线将它们作为2ⁿ个片选信号，电路复杂，地址空间连续

位扩展可以使存储器的字长变得更长，从而更好发挥数据总线的数据传输能力。
字扩展可以增加存储器的存储字数，可以更好利用CPU的寻址能力。

5.5、主存容量扩展-字位同时扩展

8块芯片，其中每两块芯片为一组，实现了位扩展，因为每块芯片是16K×4位，而CPU可以同时读写8位数据，所以我们可以让两块芯片为一组。每块芯片的字数是16K=2¹⁴，所以将CPU的A₀到A₁₃这14位的地址信息作为片内地址，而高位地址A₁₄和A₁₅我们可以接上2-4译码器。总共有4个片选信号，所以我们我们可以接上4组，而每一组的存储芯片总共有16K个存储单元，每个存储单元可以存8位的数据。4组结合我们就得到64K×8位的存储器。

5.6、小结

5.7、译码器补充知识

如上图，3-8译码器，输入3个地址信号，会输出8个片选信号，其中只有一条输出高电平，其余均输出低电平。这个译码器就可以和高电平有效的存储芯片配合使用，

译码器输出端画了小圆圈，表示输出的有效信号是0，其他的无效信号都是1，这个译码器就可以和低电平有效的存储芯片配合使用。

译码器还可能有使能(使译码器能够工作)接口，没有画小圆意味着这个译码器高电平有效，也就是译码器在高电平就可以工作。

还有可能有多个使能接口，下方两个使能接口画了小圆，表示下方两个使能信号必须是低电平，上方的使能信号必须是高电平，只有这样译码器才能开始工作。

如上图左边译码器可以工作，地址信号101转换成十进制是5，那么编号为5的输出端会输出0，其余输出端会输出1。右边译码器若使能信号是000，那么译码器无效，此时所有输出端都会输出1。同样若使能信号是非法状态，那么译码器均无效，输出端都输出1。利用这个特性：CPU可以使用译码器的使能端控制片选信号的生效时间。

CPU中还会有一个MREQ主存储器请求的一个信号，当CPU想要访问主存的时候，就会使得MREQ有效。当CPU没有发出主存请求信号的时候，这个G_2B输出的就是一个1，也就是译码器不工作，所有的译码器输出端都输出1。只有译码器接收到0信号之后，译码器开始工作，才会将地址信号映射为选通信号。

CPU首先通过地址线送出地址信号，包括低地址13位A₀-A₁₂，还有高地址3位A₁₃-A₁₅。等信号发出稳定后，CPU再发出主存请求信号，也就是让译码器某一个选通线有效，这样就可以保证当一块存储芯片被选通时，这块存储芯片所接收到的地址信号一定是稳定的。这就是译码器使能端的作用。

6、提升主存速度

回顾一下存取周期：从主存中可以连续读/写的最短时间间隔，我们之前说过，DRAM芯片的恢复时间比较长，有可能是存取时间的几倍，SRAM的恢复时间比较短，即使存取时间很快， CPU又必须等这么一段恢复时间才可以读/写下一个存储字。

这tm的就引出来了好多问题：我们通常都是双核、四核CPU，是不是意味着第一个CPU经历存取时间，第二个CPU必须等待恢复时间才可以进行下一次读写？即使你的电脑太拉是单核CPU，要知道CPU的读写速度可是比主存快很多，主存要是恢复时间太长咋办？提升主存速度呗！

6.1、双端口RAM

双端口RAM作用：优化多核CPU访问一根内存条的速度

例如上图，双核CPU，只有一根内存条(中间)，内存条采用双端口RAM技术，这样两个CPU就可以通过两个端口对内存条进行并行的访问，若要支持双端口RAM技术：需要有两组完全独立的数据线、地址线、控制线。CPU、RAM中也要有更复杂的控制电路。

两个端口对同一主存操作有以下4种情况：

两个端口同时对不同的地址单元存取数据 (😊)
两个端口同时对同一地址单元读出数据 (😊)
两个端口同时对同一地址单元写入数据 (不支持，写入错误)
两个端口同时对同一地址单元，一个写入数据，另一个读出数据 (不支持，读出错误)

解决办法：置"忙"信号为0，由判断逻辑决定暂时关闭一个端口(即被延时)，例如让CPU2连接的端口关闭，未被关闭的端口正常访问，被关闭的端口延长一个很短的时间段后再访问。

6.2、多体并行存储器

多体并行存储器可以解决单核CPU等待主存恢复时间过长的问题。

高位交叉编址的多体存储器
低位交叉编址的多体存储器🔥

CPU在对内存进行访问时会提供内存地址，采用高位交叉编址的意思是我们会采用内存地址更高的比特位来区分我们想要访问的是哪一个存储体(下图可以理解为内存条)，采用高位交叉编址的意思是我们会采用内存地址更低的比特位来区分我们想要访问的是哪一个存储体。

如上图，每个存储体有8个存储单元，左图共有 4×8 = 32 = 2⁵ 个存储单元，我们可以用 5bit 来作为我们想要访问的主存地址，如果我们采用高位交叉编址的话，第一个存储体的第一个存储单元我们给的地址是00，高位的两个00表示这是M₀这个存储体，后面的三个0表示在这个存储体内部的第几个存储单元。我们将高位两个0称为体号，后面的三个0称为 体内地址。下一个地址是00001，依次类推。低位交叉编址也类似，对于同一个存储体的存储单元来说体号都是相同的，只是体内地址不同。我们将地址信息翻译成十进制，对于高位交叉编址如上图分别是0、1、2、3、4…竖向递增，而对于低位交叉编址是横向递增。

我们假设每个存储体的存取周期为T，存取时间为r，假设T=4r，也就是存取时间为r，恢复时间为3r。

对于高位交叉编址我们若要连续访问内存地址(如上图)，访问M0存储体需要T(存取时间r+恢复时间3r)，因为接下来的地址同属于M0存储体，所以必须等恢复时间3r后才可以继续访问下一个地址。由于连续访问的地址都属于M0存储体，所以每次访问时间都是T。连续取n个存储字，耗时nT
对于低位交叉编址我们若要连续访问内存地址(如上图)，访问M0存储体需要T(存取时间r)，因为接下来的地址不属于M0存储体，所以不需要等M0的恢复时间3r。由于连续访问的地址都不属于同一个存储体，所以每次访问时间都是r。连续取n个存储字，耗时T+(n-1)r(这里考虑了访问最后一个存储体的恢复时间3r)

以上是关于存储系统的主要内容，如果未能解决你的问题，请参考以下文章