采用数据流的方式进行OC8051内部的逻辑分析,需要首先理解其存储器架构,然后追踪程序到再到数据流。
前面有提到过,OC8051程序和数据存储器逻辑分离,在物理上,其可能有4种存储器,分别为内部程序存储器irom,内部数据存储器iram,外部程序存储器器xrom,外部数据程序存储器xram,其中访问xram和访问iram的指令不同(mov、movx,并要通过DPTR寄存器)。OC8051使用oc8051_defines.v控制所采用的存储结构,oc8051_defines.v部分代码如下:
1 //
2 // oc8051 ITERNAL ROM
3 //
4 `define OC8051_ROM
5
6
7 //
8 // oc8051 memory
9 //
10 //`define OC8051_CACHE
11 //`define OC8051_WB
12
13 //`define OC8051_RAM_XILINX
14 //`define OC8051_RAM_VIRTUALSILICON
15 `define OC8051_RAM_GENERIC
16
17
18 `define OC8051_XILINX_ROM
define OC8051_ROM:使用内部iROM,而外部xROM ,OC8051提供了3种可选的接口,1、CACHE;2、WISHBONE;3、内部信号线直通。
irom和iram是属于8051的部分,xrom,xram则可以没有,在实际的实现上,irom和xrom只要有一个就行。OC8051提供了irom的一个FPGA(XILINX)实现和一个行为仿真模型,均在文件oc8051_rom.v里,通过`define OC8051_XILINX_ROM,使用XILINX的实现,否则使用的是通用的仿真模型。另外OC8051工程提供了一个工具可以将HEX文件转换为.v,这种转换的实现和`define OC8051_XILINX_ROM所选用的实现是一样的,其更新ROM中代码非常不方便;这和其采用的ROM模型有关,通过如下代码可以看出其采用的存储器模型:
1 reg [7:0] buff [0:65535]; //64kb
2
3 assign ea = 1'b0;
4
5 initial
6 begin
7 $readmemh("../../../bench/in/oc8051_rom.in", buff);
8 end
9
10 always @(posedge clk or posedge rst)
11 if (rst)
12 ea_int <= #1 1'b1;
13 else ea_int <= #1 !ea;
14
15 always @(posedge clk)
16 begin
17 data_o <= #1 {buff[addr+3], buff[addr+2], buff[addr+1], buff[addr]};
18 end
这样的存储模型很难直接使用通用的存储器进行实现。因为8051为8位微处理器,一般而言,程序存储器位宽为8即可,然而OC8051的实现使用了预取指令,需要一次发射3条指令(具体可通过其内部代码得到证实。);上述代码所示模型,需要存储器一个周期发射4Byte的程序,而由于8051送出来的地址是非字对齐的,因此这样的行为模型需要存储器支持非对其访问。如:addr=1;则data_o={buff[4],buff[3],buff[2],buff[1]},而如果采用32位宽的存储器,0~3个字节是一组,4~7为一组,一次只能出来一组的32位数据。
外部程序存储器接口可以选择CACHE方式和WB方式和直通方式,由于内部cpu实现方式,其行为模型依然需要和内部程序存储器一样。oc8051_xrom.v代码如下:
1 module oc8051_xrom (rst, clk, addr, data, stb_i, cyc_i, ack_o);
2
3 parameter DELAY=5;
4
5
6 input rst, clk, stb_i, cyc_i;
7 input [15:0] addr;
8 output ack_o;
9 output [31:0] data;
10
11
12 reg ack_o;
13 reg [31:0] data;
14
15 reg [7:0] buff [0:65535];
16 //reg [7:0] buff [8388607:0];
17 reg [2:0] cnt;
18 integer i;
19
20
21 initial
22 begin
23 // for (i=0; i<65536; i=i+1)
24 // buff [i] = 8'h00;
25 $readmemh("../../../bench/in/oc8051_xrom.in", buff);
26 end
27
28 always @(posedge clk or posedge rst)
29 begin
30 if (rst) begin
31 data <= #1 31'h0;
32 ack_o <= #1 1'b0;
33 end else if (stb_i && ((DELAY==3'b000) || (cnt==3'b000))) begin
34 data <= #1 {buff[addr+3], buff[addr+2], buff[addr+1], buff [addr]};
35 ack_o <= #1 1'b1;
36 end else
37 ack_o <= #1 1'b0;
38 end
39
40 always @(posedge clk or posedge rst)
41 begin
42 if (rst)
43 cnt <= #1 DELAY;
44 else if (cnt == 3'b000)
45 cnt <= #1 DELAY;
46 else if (stb_i)
47 cnt <= #1 cnt - 3'b001;
48 else cnt <= #1 DELAY;
49 end
50
51 endmodule
可以看出基本和irom行为模型一样,只不过支持参数定义其延迟周期(一般外部存储器访问速度会要慢些。)
ps:今天在仿真过程发现,使用外部xrom(tb中读入得ea=0:使用xrom,ea=1:使用irom),接口配置为WB接口(`define OC8051_WB),其延迟参数只有定义为DELAY=2时,程序才能正常运行,其他设置均会出错。