单周期CPU设计

Posted 2020-10-04 柒月

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了单周期CPU设计相关的知识，希望对你有一定的参考价值。

终于有点时间了，恰好多周期的设计也已经完成，其实只想写写多周期的，无奈单周期补上才好，哈哈哈~

—————+—————黄金分割线—————+—————

首先要理解什么叫单周期CPU（与后面多周期CPU对比）单周期CPU指的是一条指令的执行在一个时钟周期内完成，然后开始下一条指令的执行，即一条指令用一个时钟周期完成。

单周期CPU的功能：能够实现一些指令功能操作。需设计的指令与格式如下：

==>算术运算指令

（1）add rd , rs, rt （说明：以助记符表示，是汇编指令；以代码表示，是机器指令）

000000

rs(5位)

rt(5位)

rd(5位)

reserved

功能：rd←rs + rt。reserved为预留部分，即未用，一般填“0”。

（2）addi rt , rs ,immediate

000001

rs(5位)

rt(5位)

immediate(16位)

功能：rt←rs + (sign-extend)immediate；immediate符号扩展再参加“加”运算。

（3）sub rd , rs , rt

000010

rs(5位)

rt(5位)

rd(5位)

reserved

完成功能：rd←rs - rt

==> 逻辑运算指令

（4）ori rt , rs ,immediate

010000

rs(5位)

rt(5位)

immediate(16位)

功能：rt←rs | (zero-extend)immediate；immediate做“0”扩展再参加“或”运算。

（5）and rd , rs , rt

010001

rs(5位)

rt(5位)

rd(5位)

reserved

功能：rd←rs & rt；逻辑与运算。

（6）or rd , rs , rt

010010

rs(5位)

rt(5位)

rd(5位)

reserved

功能：rd←rs | rt；逻辑或运算。

==> 传送指令

（7）move rd , rs

100000

rs(5位)

00000

rd(5位)

reserved

功能：rd←rs + $0 ；$0=$zero=0。

==> 存储器读/写指令

（8）sw rt ,immediate(rs) 写存储器

100110

rs(5位)

rt(5位)

immediate(16位)

功能：memory[rs+ (sign-extend)immediate]←rt；immediate符号扩展再相加。

（9) lw rt , immediate(rs)读存储器

100111

rs(5位)

rt(5位)

immediate(16位)

功能：rt ← memory[rs + (sign-extend)immediate]；immediate符号扩展再相加。

==> 分支指令

（10）beq rs,rt,immediate

110000

rs(5位)

rt(5位)

immediate(位移量，16位)

功能：if(rs=rt) pc←pc +4 + (sign-extend)immediate <<2；

特别说明：immediate是从PC+4地址开始和转移到的指令之间指令条数。immediate符号扩展之后左移2位再相加。为什么要左移2位？由于跳转到的指令地址肯定是4的倍数（每条指令占4个字节），最低两位是“00”，因此将immediate放进指令码中的时候，是右移了2位的，也就是以上说的“指令之间指令条数”。

==>停机指令

（11）halt

111111

00000000000000000000000000(26位)

功能：停机；不改变PC的值，PC保持不变。

设计原理

CPU在处理指令时，一般需要经过以下几个步骤：

(1) 取指令(IF)：根据程序计数器PC中的指令地址，从存储器中取出一条指令，同时，PC根据指令字长度自动递增产生下一条指令所需要的指令地址，但遇到“地址转移”指令时，则控制器把“转移地址”送入PC，当然得到的“地址”需要做些变换才送入PC。

(2) 指令译码(ID)：对取指令操作中得到的指令进行分析并译码，确定这条指令需要完成的操作，从而产生相应的操作控制信号，用于驱动执行状态中的各种操作。

(3) 指令执行(EXE)：根据指令译码得到的操作控制信号，具体地执行指令动作，然后转移到结果写回状态。

(4) 存储器访问(MEM)：所有需要访问存储器的操作都将在这个步骤中执行，该步骤给出存储器的数据地址，把数据写入到存储器中数据地址所指定的存储单元或者从存储器中得到数据地址单元中的数据。

(5) 结果写回(WB)：指令执行的结果或者访问存储器中得到的数据写回相应的目的寄存器中。

单周期CPU，是在一个时钟周期内完成这五个阶段的处理。

技术分享

MIPS32的指令的三种格式：

R类型：

31 26 25 21 20 16 15 11 10 6 5 0

func

6位 5位 5位 5位 5位 6位

I类型：

31 26 25 21 20 16 15 0

immediate

6位 5位 5位 16位

J类型：

31 26 25 0

address

6位 26位

其中，

op：为操作码；

rs：为第1个源操作数寄存器，寄存器地址（编号）是00000~11111，00~1F；

rt：为第2个源操作数寄存器，或目的操作数寄存器，寄存器地址（同上）；

rd：为目的操作数寄存器，寄存器地址（同上）；

sa：为位移量（shift amt），移位指令用于指定移多少位；

func：为功能码，在寄存器类型指令中（R类型）用来指定指令的功能；

immediate：为16位立即数，用作无符号的逻辑操作数、有符号的算术操作数、数据加载（Laod）/数据保存（Store）指令的数据地址字节偏移量和分支指令中相对程序计数器（PC）的有符号偏移量；

address：为地址。

图2是一个简单的基本上能够在单周期上完成所要求设计的指令功能的数据通路和必要的控制线路图。其中指令和数据各存储在不同存储器中，即有指令存储器和数据存储器。访问存储器时，先给出地址，然后由读/写信号控制（1-写，0-读。当然，也可以由时钟信号控制，但必须在图上标出）。对于寄存器组，读操作时，先给出地址，输出端就直接输出相应数据；而在写操作时，在 WE使能信号为1时，在时钟边沿触发写入。图中控制信号作用如表1所示，表2是ALU运算功能表。

表1 控制信号的作用

控制信号名	状态“0”	状态“1”
PCWre	PC不更改，相关指令：halt	PC更改，相关指令：除指令halt外
ALUSrcB	来自寄存器堆data2输出，相关指令：add、sub、or、and、move、beq	来自sign或zero扩展的立即数，相关指令：addi、ori、sw、lw
ALUM2Reg	来自ALU运算结果的输出，相关指令：add、addi、sub、ori、or、and、move	来自数据存储器（Data MEM）的输出，相关指令：lw
RegWre	无写寄存器组寄存器，相关指令： sw、halt	寄存器组写使能，相关指令：add、addi、sub、ori、or、and、move、lw
InsMemRW	读指令存储器(Ins. Data)，初始化为0	写指令存储器
DataMemRW	读数据存储器，相关指令：lw	写数据存储器，相关指令：sw
ExtSel	相关指令：ori，(zero-extend)immediate（0扩展）	相关指令：addi、sw、lw、beq， (sign-extend)immediate（符号扩展）
PCSrc	PC←PC+4，相关指令：add、sub、ori、or、and、move、sw、lw、beq(zero=0)	PC←PC+4+(sign-extend)immediate，同时zero=1，相关指令：beq
RegOut	写寄存器组寄存器的地址，来自rt字段，相关指令：addi、ori、lw	写寄存器组寄存器的地址，来自rd字段，相关指令：add、sub、and、or、move
ALUOp[2..0]	ALU 8种运算功能选择(000-111)，看功能表

相关部件及引脚说明：

InstructionMemory：指令存储器，

Iaddr，指令存储器地址输入端口

IDataIn，指令存储器数据输入端口（指令代码输入端口）

IDataOut，指令存储器数据输出端口（指令代码输出端口）

RW，指令存储器读写控制信号，为1写，为0读

DataMemory：数据存储器，

Daddr，数据存储器地址输入端口

DataIn，数据存储器数据输入端口

DataOut，数据存储器数据输出端口

RW，数据存储器读写控制信号，为1写，为0读

RegisterFile：（寄存器组）

Read Reg1，rs寄存器地址输入端口

Read Reg2，rt寄存器地址输入端口

Write Reg，将数据写入的寄存器端口，其地址来源rt或rd字段

Write Data，写入寄存器的数据输入端口

Read Data1，rs寄存器数据输出端口

Read Data2，rt寄存器数据输出端口

WE，写使能信号，为1时，在时钟上升沿写入

ALU：

result，ALU运算结果

zero，运算结果标志，结果为0输出1，否则输出0

表2 ALU运算功能表

ALUOp[2..0]	功能	描述
000	A + B	加
001	A – B	减
010	B – A	减
011	A ∨ B	或
100	A ∧ B	与
101	/A ∧ B	A非与B
110	A ? B	异或
111	A ⊙ B	同或

需要说明的是根据要实现的指令功能要求画出以上数据通路图，和确定ALU的运算功能(当然，以上指令没有完全用到提供的ALU所有功能，但至少必须能实现以上指令功能操作)。从数据通路图上可以看出控制单元部分需要产生各种控制信号，当然，也有些信号必须要传送给控制单元。从指令功能要求和数据通路图的关系得出以上表1，这样，从表1可以看出各控制信号与相应指令之间的相互关系，根据这种关系就可以得出控制信号与指令之间的关系表（如下），再根据关系表可以写出各控制信号的逻辑表达式，这样控制单元部分就可实现了。

表3 控制信号与指令的关系表

	控制信号
指令	z	PCWre	ALUSrcB	ALUM2Reg	RegWre	InsMemRW	DataMemRW	ExtSel	PCSrc	RegOut	ALUOp[2..0]
add	x	1	0	0	1	0	x	x	0	1	000
addi	x	1	1	0	1	0	x	1	0	0	000
sub	x	1	0	0	1	0	x	x	0	1	001
ori	x	1	1	0	1	0	x	0	0	0	011
and	x	1	0	0	1	0	x	x	0	1	100
or	x	1	0	0	1	0	x	x	0	1	011
move	x	1	0	0	1	0	x	x	0	1	000
sw	x	1	1	x	0	0	1	1	0	x	000
lw	x	1	1	1	1	0	0	1	0	0	000
beq	0	1	0	x	0	0	x	1	0	x	001
beq	1	1	0	x	0	0	x	1	1	x	001
halt	x	0	x	x	x	0	x	x	x	x	xxx

分析与设计

根据实验原理中的单周期CPU数据通路和控制线路图，我们可以清楚的知道单周期CPU的设计应包括controlUnit，RegisterFile, ALU, DataMemory, instructionMemory, PC, signZeroExtend这几个模块，其中为了运行整个CPU还需要加入一个顶层模块（singleCycleCPU）来调用这七个模块，所以自然地，这七个模块为顶层模块的子模块。设计流程逻辑图如下：

技术分享

1、控制单元（controlUnit.v）

根据数据通路图可以知道，控制单元的功能是接收一个6位的操作码（opCode）和一个标志符（zero）作为输入，输出PCWre、ALUSrcB等控制信号，各控制信号的作用见实验原理的控制信号作用表（表1），从而达到控制各指令的目的。其中模块内部实现则根据实验原理中控制信号与指令的关系表（表3）列出各信号的逻辑表达式从而实现各信号的输出。比如：

ALUOp的表达式为：ALUOp[2]=i_and

ALUOp[1]=i_ori | i_or

ALUOp[0]=i_sub | i_ori | i_or | i_beq

所以其实现为：assignALUOp[2] = (opCode == 6‘b010001)? 1 : 0;

assignALUOp[1] = (opCode == 6‘b010000 || opCode == 6‘b010010)? 1 : 0;

assign ALUOp[0] = (opCode == 6‘b000010 || opCode == 6‘b010000|| opCode == 6‘b010010 || opCode == 6‘b110000)? 1 : 0;

整个模块设计如下：

[plain] view plain copy

</pre><pre name="code" class="plain">`timescale 1ns / 1ps
module controlUnit(opCode, zero, PCWre, ALUSrcB, ALUM2Reg, RegWre, InsMemRW, DataMemRW, ExtSel, PCSrc, RegOut, ALUOp);
input [5:0] opCode;
input zero;
output PCWre, ALUSrcB, ALUM2Reg, RegWre, InsMemRW, DataMemRW, ExtSel, PCSrc, RegOut;
output[2:0] ALUOp;
assign PCWre = (opCode == 6‘b111111)? 0 : 1;
assign ALUSrcB = (opCode == 6‘b000001 || opCode == 6‘b010000 || opCode == 6‘b100110 || opCode == 6‘b100111)? 1 : 0;
assign ALUM2Reg = (opCode == 6‘b100111)? 1 : 0;
assign RegWre = (opCode == 6‘b100110 || opCode == 6‘b111111)? 0 : 1;
assign InsMemRW = 0;
assign DataMemRW = (opCode == 6‘b100111)? 0 : 1;
assign ExtSel = (opCode == 6‘b010000)? 0 : 1;
assign PCSrc = (opCode == 6‘b110000 && zero == 1)? 1 : 0;
assign RegOut = (opCode == 6‘b000001 || opCode == 6‘b010000 || opCode == 6‘b100111)? 0 : 1;
assign ALUOp[2] = (opCode == 6‘b010001)? 1 : 0;
assign ALUOp[1] = (opCode == 6‘b010000 || opCode == 6‘b010010)? 1 : 0;
assign ALUOp[0] = (opCode == 6‘b000010 || opCode == 6‘b010000 || opCode == 6‘b010010 || opCode == 6‘b110000)? 1 : 0;
endmodule

2、算术运算单元（ALU.v）

模块ALU接收寄存器的数据和控制信号作为输入，将结果输出，具体设计如下：

[html] view plain copy

`timescale 1ns / 1ps
module ALU(ReadData1, ReadData2, inExt, ALUSrcB, ALUOp, zero, result);
input [31:0] ReadData1, ReadData2, inExt;
input ALUSrcB;
input [2:0] ALUOp;
output zero;
output [31:0] result;
reg zero;
reg [31:0] result;
wire [31:0] B;
assign B = ALUSrcB? inExt : ReadData2;
always @(ReadData1 or ReadData2 or inExt or ALUSrcB or ALUOp or B)
begin
case(ALUOp)
// A + B
3‘b000: begin
result = ReadData1 + B;
zero = (result == 0)? 1 : 0;
end
// A - B
3‘b001: begin
result = ReadData1 - B;
zero = (result == 0)? 1 : 0;
end
// B - A
3‘b010: begin
result = B - ReadData1;
zero = (result == 0)? 1 : 0;
end
// A ∨ B
3‘b011: begin
result = ReadData1 | B;
zero = (result == 0)? 1 : 0;
end
// A ∧ B
3‘b100: begin
result = ReadData1 & B;
zero = (result == 0)? 1 : 0;
end
// /A ∧ B
3‘b101: begin
result = (~ReadData1) & B;
zero = (result == 0)? 1 : 0;
end
// A ⊕ B
3‘b110: begin
result = ReadData1 ^ B;
zero = (result == 0)? 1 : 0;
end
// A ⊙ B
3‘b111: begin
result = ReadData1 ^~ B;
zero = (result == 0)? 1 : 0;
end
endcase
end
endmodule

3、PC单元（PC.v）

PC单元以时钟信号clk、重置标志Reset、立即数以及PCWreck和PCSrc两个信号控制为输入，输出当前PC地址，具体设计如下：

[html] view plain copy

`timescale 1ns / 1ps
module PC(clk, Reset, PCWre, PCSrc, immediate, Address);
input clk, Reset, PCWre, PCSrc;
input [31:0] immediate;
output [31:0] Address;
reg [31:0] Address;
/*initial begin
Address = 0;
end*/
always @(posedge clk or negedge Reset)
begin
if (Reset == 0) begin
Address = 0;
end
else if (PCWre) begin
if (PCSrc) Address = Address + 4 + immediate*4;
else Address = Address + 4;
end
end
endmodule

4、扩展单元（signZeroExtend.v）

扩展单元的设计比较简单，其功能就是将一个16位的立即数扩展到32位，具体模块设计如下：

[html] view plain copy

`timescale 1ns / 1ps
module signZeroExtend(immediate, ExtSel, out);
input [15:0] immediate;
input ExtSel;
output [31:0] out;
assign out[15:0] = immediate;
assign out[31:16] = ExtSel? (immediate[15]? 16‘hffff : 16‘h0000) : 16‘h0000;
endmodule

5、数据存储单元（DataMemory.v）

数据存储单元的功能是读取数据，根据数据通路图可以有如下模块设计：

[html] view plain copy

`timescale 1ns / 1ps
module dataMemory(DAddr, DataIn, DataMemRW, DataOut);
input [31:0] DAddr, DataIn;
input DataMemRW;
output reg [31:0] DataOut;
reg [31:0] memory[0:31];
// read data
always @(DataMemRW) begin
if (DataMemRW == 0) assign DataOut = memory[DAddr];
end
// write data
integer i;
initial begin
for (i = 0; i < 32; i = i+1) memory[i] <= 0;
end
always @(DataMemRW or DAddr or DataIn)
begin
if (DataMemRW) memory[DAddr] = DataIn;
end
endmodule

6、指令存储单元（instructionMemory.v）

根据当前的PC地址得到对应的op，rs，rt，rd以及immediate.

内部实现：

将需要测试的汇编指令程序转化为指令代码，当然，每个人都可以有自己的测试指令，能正确转化为指令代码就好。为了书写的简便，我们可以将32位的二进制指令代码转化为16进制。具体测试表设计如下：

地址	汇编程序	指令代码
地址	汇编程序	op（6）	rs(5)	rt(5)	rd(5)/immediate (16)	16进制数代码
0x00000004	addi $1,$0,8	000001	00000	00001	0000 0000 0000 1000	=	04010008
0x00000008	ori $2,$0,12	010000	00000	00010	0000 0000 0000 1100	=	4002000C
0x0000000C	add $3,$1,$2	000000	00001	00010	00011 00000000000	=	00221800
0x00000010	sub $4,$2,$1	000010	00010	00001	00100 00000000000	=	08412000
0x00000014	and $5,$1,$2	010001	00001	00010	00101 00000000000	=	44222800
0x00000018	or $6,$1,$2	010010	00001	00010	00110 00000000000	=	48223000
0x0000001C	beq $1,$2,4 (转030)	110000	00001	00010	0000 0000 0000 0100	=	C0220004
0x00000020	move $7,$1	100000	00001	00000	00111 00000000000	=	80203800
0x00000024	sw $1,1($7)	100110	00111	00001	0000 0000 0000 0001	=	98E10001
0x00000028	lw $2,0($1)	100111	00001	00010	0000 0000 0000 0000	=	9C220000
0x0000002C	beq $2,$7,-5 (转01C)	110000	00010	00111	1111 1111 1111 1011	=	C047FFFB
0x00000030	halt	111111	00000	00000	0000000000000000	=	FC000000

其次，为了存储这些指令代码，可以申请一个32位的二进制数组来存储它们，最后根据PC地址得到对应的op,rs,rt,immediate等,具体模块设计如下：

[html] view plain copy

`timescale 1ns / 1ps
module instructionMemory(
input [31:0] pc,
input InsMemRW,
output [5:0] op,
output [4:0] rs, rt, rd,
output [15:0] immediate);
wire [31:0] mem[0:15];
assign mem[0] = 32‘h00000000;
// addi $1,$0,8
assign mem[1] = 32‘h04010008;
// ori $2,$0,12
assign mem[2] = 32‘h4002000C;
// add $3,$1,$2
assign mem[3] = 32‘h00221800;
// sub $4,$2,$1
assign mem[4] = 32‘h08412000;
// and $5,$1,$2
assign mem[5] = 32‘h44222800;
// or $6,$1,$2
assign mem[6] = 32‘h48223000;
// beq $1,$2,4 (转030)
assign mem[7] = 32‘hC0220004;
// move $7,$1
assign mem[8] = 32‘h80203800;
// sw $1,1($7)
assign mem[9] = 32‘h98E10001;
// lw $2,0($1)
assign mem[10] = 32‘h9C220000;
// beq $2,$7,-5 (转01C)
assign mem[11] = 32‘hC047FFFB;
// halt
assign mem[12] = 32‘hFC000000;
assign mem[13] = 32‘h00000000;
assign mem[14] = 32‘h00000000;
assign mem[15] = 32‘h00000000;
// output
assign op = mem[pc[5:2]][31:26];
assign rs = mem[pc[5:2]][25:21];
assign rt = mem[pc[5:2]][20:16];
assign rd = mem[pc[5:2]][15:11];
assign immediate = mem[pc[5:2]][15:0];
endmodule

7、寄存器文件单元（registerFile.v）

寄存器文件单元的功能是接收instructionMemory中的rs，rt，rd作为输入，输出对应寄存器的数据，从而达到取寄存器里的数据的目的。需要注意的是，在其内部实现的过程中，为了防止0号寄存器写入数据需要在writeReg的时候多加入一个判断条件，即writeReg不等于0时写入数据。具体设计如下：

[html] view plain copy

`timescale 1ns / 1ps
module registerFile(clk, RegWre, RegOut, rs, rt, rd, ALUM2Reg, dataFromALU, dataFromRW, Data1, Data2);
input clk, RegOut, RegWre, ALUM2Reg;
input [4:0] rs, rt, rd;
input [31:0] dataFromALU, dataFromRW;
output [31:0] Data1, Data2;
wire [4:0] writeReg;
wire [31:0] writeData;
assign writeReg = RegOut? rd : rt;
assign writeData = ALUM2Reg? dataFromRW : dataFromALU;
reg [31:0] register[0:31];
integer i;
initial begin
for (i = 0; i < 32; i = i+1) register[i] <= 0;
end
// output
assign Data1 = register[rs];
assign Data2 = register[rt];
// Write Reg
always @(posedge clk or RegOut or RegWre or ALUM2Reg or writeReg or writeData) begin
if (RegWre && writeReg) register[writeReg] = writeData; // 防止数据写入0号寄存器
end
endmodule

8、顶层模块（singleStyleCPU）

顶层模块（singleStyleCPU）是整个CPU的控制模块，通过连接各个子模块来达到运行CPU的目的，整个模块设计可以如下：

[html] view plain copy

`include "controlUnit.v"
`include "dataMemory.v"
`include "ALU.v"
`include "instructionMemory.v"
`include "registerFile.v"
`include "signZeroExtend.v"
`include "PC.v"
`timescale 1ns / 1ps
module SingleCycleCPU(
input clk, Reset,
output wire [5:0] opCode,
output wire [31:0] Out1, Out2, curPC, Result);
wire [2:0] ALUOp;
wire [31:0] ExtOut, DMOut;
wire [15:0] immediate;
wire [4:0] rs, rt, rd;
wire zero, PCWre, PCSrc, ALUSrcB, ALUM2Reg, RegWre, InsMemRW, DataMemRW, ExtSel, RegOut;
// module ALU(ReadData1, ReadData2, inExt, ALUSrcB, ALUOp, zero, result);
ALU alu(Out1, Out2, ExtOut, ALUSrcB, ALUOp, zero, Result);
// module PC(clk, Reset, PCWre, PCSrc, immediate, Address);
PC pc(clk, Reset, PCWre, PCSrc, ExtOut, curPC);
// module controlUnit(opCode, zero, PCWre, ALUSrcB, ALUM2Reg, RegWre, InsMemRW, DataMemRW, ExtSel, PCSrc, RegOut, ALUOp);
controlUnit control(opCode, zero, PCWre, ALUSrcB, ALUM2Reg, RegWre, InsMemRW, DataMemRW, ExtSel, PCSrc, RegOut, ALUOp);
// module dataMemory(DAddr, DataIn, DataMemRW, DataOut);
dataMemory datamemory(Result, Out2, DataMemRW, DMOut);
/* module instructionMemory(
input [31:0] pc,
input InsMemRW,
input [5:0] op,
input [4:0] rs, rt, rd,
output [15:0] immediate);*/
instructionMemory ins(curPC, InsMemRW, opCode, rs, rt, rd, immediate);
// module registerFile(clk, RegWre, RegOut, rs, rt, rd, ALUM2Reg, dataFromALU, dataFromRW, Data1, Data2);
registerFile registerfile(clk, RegWre, RegOut, rs, rt, rd, ALUM2Reg, Result, DMOut, Out1, Out2);
// module signZeroExtend(immediate, ExtSel, out);
signZeroExtend ext(immediate, ExtSel, ExtOut);
endmodule