一个大神的工程(复旦 季同学)16bit RISC cpu
Posted 07H_JH
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了一个大神的工程(复旦 季同学)16bit RISC cpu相关的知识,希望对你有一定的参考价值。
2014年8月25日更新,更新内容为超越函数计算器和CPU指令实现部分
断断续续终于做好了视频和介绍,就用日志一起发出来了。工程还未完工,视频展示计算器功能,电子表和字符显示器时序控制。
视频建议看的时候点右下角设置选超清+全屏观看,选标清既不清楚有时候还会卡,高清也看不清细节,就算是超清也比我上传的原视频缩了。优酷60秒的广告还要缩画质满地节操真心抱歉。。。
本工程基于一个叫Minecraft的游戏,我使用的版本是1.4.7。之所以使用一个游戏作为平台,是因为这个游戏可以做到实时运行超大规模集成电路模型(大于10000个逻辑门)并且提供壮观的可视化效果(三维数字电路)。
半年前我刚接触这个游戏的时候,想做一个简单的计算器。国外玩家两年前已经有人做到了,基于整数ALU和直连总线的机器。我开始规划做一个16bit的计算器,输入输出线路一样是直连的,也就是说这个计算器完全是专用的芯片,连单片机的等级都不到。后来我发现这个游戏可以实现更加复杂的东西。原因很简单,游戏只提供了“或”“非”逻辑电路,但理论上“或”“非”门可以表达一切逻辑。同时游戏提供的基于活塞机械的断路,继电器的延时时序特性以及继电器的锁存特性会让很多高级触发器成为可能。换句话说,FPGA能实现的东西这个游戏基本都能实现,区别在于这个游戏提供的是一个纯粹数学模型化的信号系统,元器件是简化的模型而不是现实中根据半导体材料设计的具有一定特性的电子元件,在线路连接的拓扑结构上也和现实中的电路不同。
在造计算器到一半的时候我打算改单片机,也就是具有“图灵完备性”的简单计算机,他可以执行一切计算机程序。我规划了指令集架构,储存器架构和指令发射方式等。随着除法器,可读写储存器,缓冲队列等重要电路结构的设计成功,我开始有了一个大胆的设想,尝试实现一个具有流水线结构,总线结构,溢出中断,堆栈,标志位寄存器,基本的分支预测和乱序执行等现代高级计算机技术的16bit RISC CPU以及一个附属的包含超越函数的单精度浮点处理器32bit FPU(目前只规划作为计算器使用)。
工程现在进展顺利,只是因为工程量巨大进度较慢。我已经将16bit整数计算器改成了完全时序逻辑电路控制,并且有溢出判断的计算器。这在全世界Minecraft红石电路玩家里应该是首次。这个计算器作为片外系统借用CPU的ALU部分进行运算并经过总线传输数据。目前CPU的ALU,主储存器,和寄存器等EU部分已经完工,内部环状总线已经完工,CU部分,也就是最繁琐的部分正在建设中。而FPU部分已经完成了加法器,乘法器,三角函数运算单元,开方运算单元。现在整个工程大约有10万门以上的电路。
目前不可逾越的困难是游戏的基准单位延时t是0.1秒,加载地图最大范围是长宽1024m,高256m的范围,这就限制了计算机的运算速度以及造出来的硬件规模。特别是储存器,我的片上程序储存器只有1kb,这对于现实中的储存器容量而言太小了。所以想利用这有限的空间做一个汇编编译器,简易的操作系统实在是太困难。
对于工程的介绍我分为6部分:信号系统,硬件单元和硬件算法,储存器架构和流水线,指令集架构,总线和时钟,图形显示原理。我尽量用非专业的语言来介绍,不可避免会用一些术语。
本工程需要的专业知识基本就是微机原理,数字电路,少许编译原理和计算机图形学。
先贴一张CPU架构图
其中每一个方框都代表一个或若干个硬件单元,小一点的大约一两百个门电路,大的有几千个门电路。架构图基本是按照实际距离做的,在工程上方俯视看到的结构和架构图可以一一对应。下面的俯视图对应架构图的右半部分(Data Bus以及其围住的右下部分)
PS:目前决定把乱序执行模块取消。
信号系统
构成超大规模信号系统的逻辑等级基本如下:
基本信号元件→基本逻辑门→复杂逻辑门→简单功能结构:组合电路,时序电路,触发器→复合功能结构→硬件功能单元→硬件功能模块→计算机
举例如:
或门,非门→与门,异或门→全加器,信号长度转换器,多态选择器,储存器单元,译码器单元,求补码单元,移位器单元→可读写储存器,译码器,加法器,移位器,时钟发生器→加减法器,乘法器,除法器,可读写储存器阵列,寄存器,程序计数器→总线,ALU,CU→计算机
信号元件
先从逻辑底层开始介绍。这个游戏用于传输信号的原件称为“红石电路”,是在游戏地下的矿藏里挖出来的红石矿物加上各种材料合成出来的东西。最主要的原件只有四个,如下图:
从左到右依次为:1.继电器/二极管/锁存器/延时器(同时兼有四个功能)2.红石火把(高电平信号源)3.红石粉(红石导线)4.粘性活塞(可推拉的开/通路元件)
这些元件可以被放置在其他实体方块上,方块是这个游戏所有东西占据的空间结构,每一个物品占据一个正方体空间,将一个方块空间占满的是实体方块,像下面几个图中蓝色的,紫色的都是实体方块。长度的计量单位游戏中每一个方块的边长是1米,玩家身高大约1.7米。本工程占地大约600x600x200米
红石火把和继电器:红石火把给邻近的同一高度的方格输出高电平信号,红石粉和继电器都会被激活并传递信号,如下左,而继电器同时为二极管,所以是单向导通的,如下右。继电器亮了表示信号通过,不亮的那个是因为方向反过来所以信号不通过。
信号不是无限传输下去的,每传输15个方格就需要1个继电器延续信号,如下左,可以看到距离红石火把越远的红石导线亮度就越暗,当超过15格还没有继电器的时候就会熄灭。同时每个继电用的电路元件会花0.1秒来反应,并不是一瞬间就继电。游戏中0.1秒即为最小的时间单位,这对应为数字电路里的一刻时间“1t”,一切时序逻辑都是建立在0.1秒这个最小单位上的,这也正好对应现实电路中电子传递速度导致的信号传递延迟。继电器有延时器的特性,可以选择1,2,3,4四种档位,分别对应0.1秒,0.2秒,0.3秒,0.4秒的延时(反应时间),也就是说默认的最小0.1秒反应时间可以延长到0.4秒。如右下,靠左上的继电器档位在1,靠右下的档位在4。这一特性可以用于用尽量少的器件累积长时间延时。比如5个4档继电器串联时信号输出就将延迟2秒。
另外一个重要的特性是,只要信号输入时间够长,继电器将累积一定的信号,累积值和输入时间相等,最大累积值和档位延迟时间相同。比如4档继电器输入端输入信号0.1秒,则0.4秒后继电器输出信号,长度为0.1秒,当输入端输入0.3秒信号,则0.4秒后继电器输出信号,长度为0.3秒。当输入0.4秒信号及以上,输入端关闭后,继电器输出端将输出0.4秒信号。
像下图那样,红石火把发出信号,之后蓝色方块上每15格继电一次。第二个继电器到第一个橙色方块正好是第16格,此时没再加继电器,所以橙色两个方块上的红石导线熄灭了。每15格的传输线需要一个继电器,所以一个单位传输线路最长距离是15格的线+1格的继电器=16格,16格正好是二进制数,游戏开发者选这个数肯定是为了方便编程。
红石粉不仅仅可以在同一个高度上传输,不同高度的红石导线只要可以连在一起即可:红石粉只能铺在方块表面,不同方块表面的红石粉可以和前后左右高一格或低一格的方块表面的红石粉相连,如左下。而当红石粉和继电器组成环路时,一旦通了信号,只要不切断环路,环路信号就一直存在。如右下图中右边一个环路没有红石火把输出也可以保持高电平,这同时表现了继电器的储存特性。而如果环路里没有继电器则不能保存信号。
而红石火把不仅可以放置在方块上面,也可以放置在侧面,如下左,等效于侧面空气方块的位置被一个火把占据。输出的信号同样是相邻的方块表面。而继电器连接信号的方块表面与高度有关,如下右,左边一个继电器比红石导线低一格,可以继电,而右边一个继电器比红石导线高一格,不能继电,这和充能原理有关系,下面再讲。
充能特性:导电方块(游戏提供的大部分方块都是,除了玻璃等)都会被周围的一些信号(如红石导线和继电器)充能。“充能”的意思是这个方块变成了一个信号源,可以像一个红石火把一样工作,即这个方块等效于同一个地方放了一个火把,并且好处是这个方块上仍然可以铺上电路元件,而且可以对其下方的方块输出信号。这是一个很重要的红石信号特性,有了它可以使一些空间错位的信号传输变为可能。
非门特性:这个游戏用于构建非门的方式是,当一个方块被充能时,其前后左右和上方的红石火把会灭掉(变成低电平输出)。
如下左,靠近屏幕的上下两个方块上各有一个火把,而下面的火把正对着上面的方块,上面的方块被充能,所以上面方块上的火把灭了。远离屏幕的三个方块,最右边方块上面和侧面有三个火把,左边低一格的方块表面有导线直连,方块被充能,所以三个火把全灭。右下图里方块被继电器充能,上面的红石粉被激活,下方方块表面的红石粉也被激活,而侧面的火把被熄灭。
再来两个例子,左下上面的紫色方块被充能,侧面火把灭,上方红石导线亮,侧面活塞伸出。右下最左边紫色方块表面的红石导线将该紫色方块充能,所以侧面火把灭。
最后两个例子,下左图是一个不断变化的信号通路,即火把通过一个半环路给自己的所在的方块充能,但被充能的方块会让火把熄灭,火把熄灭后红石导线上又没了信号,方块不被充能,这样火把又会亮,所以左下的火把会不断地亮灭亮灭循环,每0.1秒循环一次。游戏里如果不断有这种信号通路出现势必会给电脑运行造成很大负担,所以游戏规定一个红石火把在1秒钟内在两个状态里循环8次即会永久熄灭,只能通过玩家修改线路让其再次激活。右下利用充能原理说明继电器的不同高度继电效应。左边继电器低一格,可以继电,是因为邻近高一格的方块被充能向四周从输出信号。而右边继电器高一格不继电,是因为虽然下方方块被充能,但是继电器的一个重要特性是接受前后左右邻接的信号,不接受其所在的下方方块的信号。
开路与粘性活塞:粘性活塞是一种可以黏住方块的活塞,游戏里还有普通活塞,没有粘性,将物品推出去就收不回来。而粘性活塞推出去可以拉回来,推出去和拉回来正好对应了两种状态。下图左右均为被激活的活塞,活塞的推拉可以朝向上下左右任意方向。
下左为活塞黏住方块将其推出。
下右为粘性活塞的开路特性。靠前的线路凹下去的那一个方块上的红石导线和两边方块表面的红石导线正常相连,可以让信号通过。而后面的那个线路,凹下去方块的红石导线与两边方块的红石导线被上方的方块阻隔。这时就构成了开路。而粘性活塞可以推拉方块,就可以利用该特性让特定的线路选择通还是断。断路或者说开路的特性就意味着粘性活塞和普通线路可以构成三态门结构,这种开路可以看做是现实中电路的高阻抗状态。
下左仍然是活塞开路特性,只不过活塞从水平方向转移到竖直方向。左边活塞收回是通路,右边活塞推出是开路。
下右是利用充能特性和活塞开路特性的结合电路。红色方块作为可推拉方块当其收回的时候前面的继电器和后面的红石导线没有连接,所以是开路,而当活塞将红色方块推出后继电器会给红色方块充能,这时被充能的红色方块不仅会像后方的导线输出信号,也会激活下方的活塞。即此时活塞就算不被其他信号激活也会被红色方块永久激活,只要继电器信号不撤去,无论活塞下方的输入端(比如最下层的那个蓝色方块)是什么信号,都不会改变活塞推出的状态。这种特性的直接意义就是只要一个短信号激活活塞,就会输出一个永久信号。
继电器锁存特性(储存器原理):继电器的最后一个特性是锁存器。如下左,上下两个横着放的继电器通电,右边两个继电器上就会加上一条黑色的横条,这就表示右边两个继电器被锁住了,他们将保持原来的信号一直不变,不管输入端是高电平还是低电平。而当左边的两个继电器不通信号的时候,右边两个继电器就不再锁存。锁存器的出现使得大规模储存器缩小体积变成了可能(虽然仍很难在游戏可加载范围内放上足够多的储存器)
利用这个特性我设计了一种可同时读写的储存器单元如下右,是一个1byte的储存器。
其他类型的信号单元
下左方块上有一个按钮,这个按钮的功能是输出一个1秒(10t)的信号,按一下会给其所在的方块充能1秒。这一特性可以用于操作者对机器的操控。下右为拉杆,拉杆可以置于两种状态,打开的状态会输出永久信号,关闭的状态不输出信号。
视觉信号与显示器
游戏本身没有显示屏这种东西,但是玩家可以通过各种方式实现视觉上的信息传递。
第一种是红石灯。如下左,红石灯被充能时会亮,不充能时不亮,这两种状态即可组成图形,和计算机的bitmap一致。
第二种是阴影成像。即游戏中白天光照条件下浅颜色的方块凹陷处的阴影会和周围的方块形成反差,也构成了两态信号的图像。如下右的七段显示器。
而实现方块凹陷的方式就是粘性活塞,如下图,活塞推拉分别对应填平和凹陷。
向上传输和BUD
向上传输是游戏提供的一种信号单向向上传输的方式,可以用两种方块实现。如下左,左边花纹方块是萤石,本身有自然发光的作用,同时可以用图中方式向上叠放。正常的方块这样叠放肯定会挡住信号,所以正常方块向上向下传输必须螺旋盘叠,这样会占据更大的空间,于是游戏提供了单向向上传输节约空间。但是可惜游戏没有提供单向向下传输(至少我使用的1.4.7版本没有提供),可以看到如图中左边的萤石信号通路输入端在上方,下方方块的红石导线没有亮,而右边的萤石通路输入端在下方,上方方块的红石导线亮了。另一种单向向上传输的方块是“半砖”,即只占一般空间的砖头,如下左图中右边灰色的砖块。因为只有一半高度,所以这样盘叠不会挡住各自导线的连接。半砖同样只实现单向向上传输。
BUD是游戏中一类类似BUG的信号特性。但是又不能叫做BUG,因为这些特性也可以看做是信号系统的组成部分。由于游戏编程中对于方块更新的检测机制存在一定局限性,所以一些方块会被非正常激活。只举一个例子,如下右图不断升高的信号线路,绿色方块活塞推出是正常被充能的情况,红色方块活塞抽回未被激活也是正常的。但是中间紫色方块活塞没有邻接任何被充能方块,但是处于推出状态,这种情况是反常的,称之为BUD。出现这种情况很多时候会对设计造成困难,有一次我调试线路出现了很奇怪的错误,排查了半天才发现是BUD问题。有些时候也可以利用BUD的特性做成特定功能的线路。
实际上游戏中还是有BUG的,有一次我排查了一个多小时竟然发现某个错误的原因是这样的:两个相隔100多米毫无功能关联的继电器,当一个置于2档的时候,另一个会工作不正常。这属于游戏难免会有的BUG,但是有时候一个小BUG会导致整个计算机瘫痪。
逻辑门
信号元件基本就全部介绍完毕了,然后正式介绍数字电路的部分。
游戏提供的二态信号正好对应于二进制0和1,也对应于数字电路里用高低电平表示的信号。所以二态信号系统无论其实现的载体和方式如何,规律必定都是一样的。所以可以用相同的组合和算法构造更复杂的结构。
有了四种信号元件如何进一步做成逻辑门呢?非门前面已经给出了,即利用红石火把被充能方块熄灭的特性。
或门更简单,“或”在逻辑上就是只要任意一个输入端(不仅仅是一共2个输入端的情况)输入信号,输出端就一定输出信号。如下左,两个橙色的方块为输入端,只要有一个放上火把,绿色的输出端就会输出信号。下右为简单的组合逻辑,4个输入端组成的或门加上输出端的非门组成的或非门。这种电路一般用于“0判断”,即输入端全为0,输出就有信号,只要有一个输入是1,输出端的红石火把就会灭。
可以证明只用或门和非门就能实现一切逻辑,游戏的设计者也只设计了这两种能直接实现的逻辑门,这一点和现实的晶体管电路也很符合。通过在空间上对或门和非门的组合排布就能实现更加复杂的逻辑门。
与非门如下左,紫色为输入端,橙色为输出端,可以看出输入端连着两个红石火把是两个非门,火把中间通着导线是一个或门,真值表我就不写了,简单计算即可知这是一个与非门。常见的与非门应用也就是RS触发器了,比如下右这个基本RS触发器,低电平有效,紫色输入,橙色输出,RSQQ非就随便怎么分配了,此时图中输入端均有效,输出端无效,当输入端从01或10置为00(高电平)时会锁存。而当输入端同时从00变为11时游戏的方块刷新机制会默认选择其中一个输出端输出1,另一个输出端输出0,当然本身就不用考虑会使用这种情况。所以用与非门构造的RS触发器和现实中基本一致。
与门比与非门复杂一点,只要在与非门基础上加个非门的红石火把就可以了。如下图,下左为标准的与门,两个红色的输入端,紫色为输出端,可以看出是3个非门和一个或门组成的逻辑电路。可能读者仍然不便理解,我就将其转化为框图,如下中图。简单的计算可得只有当两个输入端同时输入1时,输出端为1,和与逻辑相同。下右两个同样为与门,只不过线路排布稍微变化即可变为空间构造不同的与门,可以用于各种不同的布线情况。
活塞断路其实也是与逻辑。广义上的“与”可以看做同时满足各自条件的若干个输入端才能使输出端输出特定信号。比如下左上面的紫色输入端输入0,下面的紫色输入端输入1才能使绿色输出端输出1,而下右活塞原本挡住橙色线路,当活塞被激活将蓝色方块推出时,会使凹下的橙色方块线路与两边联通,这时右边的紫色输入1,左边的绿色才会输出1。即这是输入端必须全为1的标准与门。
之后的复杂信号结构的介绍我都尽量简略,如果真要从头到尾讲清楚,要写一本书。其中涉及到的专业知识太多了,很难让所有读者都能理解,见谅。关于数字电路和微机原理的各种基础知识介绍我都从略。
异或门是数字电路里非常重要的一类复杂逻辑门,是构造全加器以及一切具有ALU运算器结构单元的基础。比较简单的异或门设计如下图左右两种,除了红石导线外,左边一种用到了活塞,火把和继电器,右边一种只用了火把。这两种都是国外玩家设计的,是目前设计出来的体积最小的异或门。我一开始自己设计出的异或门比这两种体积大一点。而基础逻辑门的体积对计算机建设至关重要,基础逻辑门稍微大一点整体结构就将超过地图加载范围。我的工程在设计上如果没有这些高手玩家在基础结构上的设计,是不可能实现的,因为用minecraft实现实时运算超大规模信号系统最重要的难题就是体积问题。
这两种异或门右边一种较好,因为游戏中的火把可以在1秒钟内承受8次信号变化才会熄灭,而活塞似乎承受不了这么多次的变化,容易在快速的信号变化中出现差错。所以我的计算机中基本都是采用右边一种异或门。两个橙色方块是输入端,紫色方块是输出端。
其他所有逻辑门都可以通过或,非门的组合得到,就不再详述。
简单功能结构
利用逻辑门的组合就可以设计适用于各种功能的信号结构。
全加器:全加器可以看做是计算机最核心的部件,之前的一个异或门相当于一个半加器,两个半加器可以组合成一个全加器。由第一种异或门组成的全加器 如下左,下右是4个相同的全加器级联。
但是这种基于活塞的全加器不稳定,所以较为好的设计是如下图的基于第二种异或门设计的全加器。两个红色为输入端,蓝色为进位端,紫色为本位输出端。下右为两个不同颜色的全加器级联。
其他的组合电路,时序电路和触发器就举几个例子。
前一部分已经介绍过RS触发器,实际上并不常用。常用的是一些边沿触发的时序电路。下左图为活塞开路的两种最基本的应用,两个同样的蓝色开路线路,作为输入端的红石火把左边在下,右边在上。左边的蓝色线路因为开路的节点(凹下去的地方)比开路输入端的节点更靠近火把,而4档继电器的延迟为0.4秒,活塞的延迟为0.1秒,所以第0.5秒后活塞会伸出使线路开路,这时输入端信号就传不到活塞了。而继电器里可以存下0.4秒的信号,所以再过0.5秒活塞会收回,线路又会通。然后就会这样循环的“开路-通路-开路-通路”下去,每1秒是一个循环。实际的效果就是每1秒钟内可以输出一个0.5秒的信号。右边那条线路输入端通往活塞的节点在开路节点的前面,所以不受开路影响,只要输入端有持久信号就会在0.1秒后永久开路,使得下方输出0.1秒的瞬间信号。必须等待输入端变为低电平活塞才会收回,这等价于一个上沿信号。
下右图是一个T触发器,左边紫色为输入端,接一个上沿信号发生器输出0.2秒短信号,右上绿色方块是输出端,T触发器储存一个信号,高电平短信号使触发器工作,效果是使原有信号翻转并储存输出。
下左为短信号转1秒信号器,实际上可以做出任意长度信号之间的转换,比如0.1秒转4秒,5秒转0.2秒等等。下右为3秒短信号轮换器,即第0秒输出短信号到A端,第3秒输出短信号到B端,第6秒输出到A端……
下图为移位触发器,也是很常用的一种结构,可以做成单向或双向。
下左为时钟频率储存器,即长度mt的信号在长度nt为一个周期的环路中(n>m)作循环传递。时钟频率储存器和信号发生器组合可以变成计算机的时钟信号发生器。下右为短信号阻断器(名字值得吐槽,我也不知道该取什么名字= =),可以滤去0.6秒以下的短信号。
下左蓝色部分为4路选择触发器,发射信号选择其中一路并储存该状态,之后发射信号选择其他某一路会清除之前的选择并存进新的选择。下右黑色部分为总线信号清空单元,可以周期性的阻断总线信号通路。
储存器:见继电器锁存功能的介绍。锁存单元8的并列,然后用同一根线控制锁存,再用一根线控制存储信号的开闭,就组成了一个1byte的储存器。大量储存器组成3D阵列。相邻奇偶编号储存器加上byte/word切换控制模块。最后再用统一的译码模块编码,就成了完整地储存器。
复合功能结构
由简单功能结构可以进一步组成复合功能结构,从而完整地实现某一功能。比如全加器级联变成加法器;异或门和加法器串联,然后级联,再加上符号信号端变成求补器等等。
举几个例子。
下图为带溢出判断的补码加法器
下图为译码器
下图为另一种译码器
下图为显示器单元
下图为可读写储存器单元,作为寄存器MAR。
硬件功能单元
复合功能单元能执行某一个完整的逻辑功能,比如加法器使两个补码相加,求补器使某个原码求补码。而硬件上加减法器的完整功能一般指从求补码到加减法到求原码返回寄存器或总线的完整过程。
举三个例子
复旦大学EMBA2022毕业季丨毕业不忘初心 荣耀再上征程
复旦大学数学学院转入大数据学院的14级同学对高等代数课程的评价