达拉斯半导体超高速闪存微控制器具有双数据指针,具有自动递增/递减和切换选择功能。本应用笔记将采用一个数据指针的原始8051架构与DS89C430和DS89C450的新架构及其更高的数据移动效率进行了比较。本文提供了大量代码示例,以帮助理解该超高速微控制器的双数据指针的使用。
概述
嵌入式系统设计人员和程序员一直在寻找巧妙的方法来突破其 8051 微控制器设计的性能极限。如果您的应用受到微控制器复制外部数据存储器缓冲器或读/写存储器映射外设的速率的限制,则可能会受益于使用更多片上硬件和更少软件的方案。本应用笔记介绍了使用定时器/计数器作为终止固定长度复制例程的方法。将这种方法与达拉斯的超高速 8051 架构及其数据指针增强功能结合使用,可以以超过 2MBps 的速率复制数据,比以相同时钟频率运行并配备单个数据指针的标准 20 内核快 8051 倍以上。
XDATA 复制例程 - 原始 8051
最初的8051架构仅包含一个数据指针(DPTR = DPH + DPL),但提供了两种间接访问外部数据存储器的不同方式。MOVX指令可以使用16位数据指针(例如,MOVX @DPTR,A)或8位工作寄存器(例如,MOVX @R0,A)来访问MOVX数据空间。请注意,后一条指令使用 8 位寄存器指针,因此要求在执行指令之前使用指针的最高有效地址字节写入端口 2。只有一个数据指针,在复制超过 256 字节的数据时管理源指针和目标指针需要大量使用工作寄存器进行临时存储。下面是使用单个数据指针复制数据时通常执行的代码示例。
; Original 8051 Copy - Single DPTR
; R6:R7 control copy length
; R4:R0 used for source/dest DPTR hi/lo temp storage
loop: ; Cycle Count @ 12clks/cycle
movx a,@dptr ; 2
inc dptr ; 2
xch a,r0 ; 1
xch a,dpl ; 1
xch a,r0 ; 1
xch a,r4 ; 1
xch a,dph ; 1
xch a,r4 ; 1
movx @dptr,a ; 2
inc dptr ; 2
xch a,r0 ; 1
xch a,dpl ; 1
xch a,r0 ; 1
xch a,r4 ; 1
xch a,dph ; 1
xch a,r4 ; 1
djnz r7,loop ; 2 => 22cycles * length
djnz r6,loop ; 2 => 2cycles * (1 + (length/256))
XDATA 复制例程-超高速微控制器
超高速微控制器包含两个数据指针(DPTR = DPH + DPL;DPTR1 = DPH1 + DPL1),允许单独的源和目标数据指针。此外,它还实现了硬件控件,以在数据指针之间自动切换,并自动递增或递减活动数据指针,以响应某些与 DPTR 相关的指令。有关增强型双数据指针的完整详细信息,请参阅超高速微控制器用户指南。下面的代码演示了增强的双数据指针如何简化复制例程。自动切换活动数据指针的指令标有 [T],自动前进数据指针的指令标有 [+/-]。为了与原始8051架构进行比较,假设了标准的8051外部P2,P0存储器总线结构,从而给出了5个时钟周期的最小MOVX持续时间(1个时钟周期用于MOVX操作码提取,4个时钟周期用于数据存储器访问)。虽然页面模式 1 外部总线配置的周期计数未反映在下面的代码示例中,但应该注意的是,页面模式 1 确实提供了绝对的最小外部 MOVX 持续时间(3 个时钟周期 = MOVX 操作码提取的 1 个时钟周期 + 数据存储器访问的 2 个时钟周期)。
; Ultra High-Speed Micro Copy - Enhanced Dual DPTRs
; DPS.4 (AID) = 1; DPS.5 (TSL) = 1;
; R6:R7 control copy length
loop: ; Cycle Count @ 1clk/cycle
movx a,@dptr ; 5 [T][+/-]
movx @dptr,a ; 5 [T][+/-]
djnz r7,loop ; 5 => 15 cycles * length
djnz r6,loop ; 5 => 5 cycles * (1 +(length/256))
XDATA 复制例程 - 使用计时器/计数器
若要使用计时器/计数器,应用程序必须在复制例程期间提供计时器/计数器及其关联的输入引脚。基本思想是使用片内计数器来跟踪和终止复制环路,而不是使用工作寄存器。/WR选通用作计数器的输入信号。图 1 显示了一个硬件配置示例。
图1.低电平有效WR选通计数的硬件图。
所有超高速微控制器定时器/计数器输入引脚(T0、T1、T2)都能够对相当于系统时钟频率四分之一的输入频率进行采样。这意味着要采样的输入信号必须具有最小高电平和低电平时间,每个周期为2个系统时钟周期。除了 1 周期或 2 周期寻呼模式 1 中最快的 MOVX 外,/WR 选通器还满足所有其他外部 MOVX 操作的此标准。在进入复制循环之前,16 位计数器加载适当的值 (216- #bytes复制),定时器/计数器中断被启用,并且增强的数据指针配置为最快速的复制。复制的最后一个字节会导致计数器翻转并生成计时器中断,从而允许将代码执行返回到主程序。
使用定时器/计数器方法的好处
使用计时器/计数器的主要好处是提高了性能,同时允许更宽容的 xdata 访问时间。已经注意到,最快的复制循环执行时间是通过将外部总线结构配置为寻呼模式 1(端口 2 = 多路复用地址 MSB/LSB 和端口 0 = 数据)来实现的。尽管页面模式 1 提供了终极性能,但它也需要最快的 xdata 访问时间 (tRLDV < 中联).计时器/计数器方法提供几乎相同的性能,同时使最大 xdata 访问时间几乎翻倍。
此外,预计并非所有超高速微控制器设计都将使用新的总线结构。一些系统设计人员可能希望保留传统的8051总线接口,甚至可能将超高速微控制器放入现有插座中。在这些情况下,计数器端接复制环路提供了高性能折衷方案。
由于定时器/计数器端接复制环路依赖于内部 16 位定时器硬件来计算外部读/写事件的数量,因此不需要单独的 DJNZ 指令来跟踪 16 位环路控制变量。这允许应用程序对大于 256 字节的数据长度执行高速同步传输。
表1比较了原始8051架构的复制环路与三种可能的超高速微控制器配置。计数器终止的复制循环已突出显示。下表是计时器/计数器终止副本的示例代码清单。代码中突出显示了复制循环,以便与前两个示例进行比较。
计数器终止复制方法(代码示例)
;------------------------------------------------------------
; Demonstrate use of Timer/Counter 1 to terminate copy loop
; Use P3.6 (Active-Low WR) as an input to Timer/Counter 1 (P3.5)
; In this example:
; 1) Source, dest, and length defined as constants.
; 2) Code saves only DPTR0 state under the assumption that a
; single DPTR is normally used and that the second (DPTR1)
; is enabled only for certain routines (such as this one).
; 3) Code disables all other interrupts during the copy.
; 4) External non-overlapping xdata to xdata transfer
;------------------------------------------------------------
$include(420.def) ; include file w/SFRs
source equ 0100h ; source xdata address
dest equ 0200h ; dest xdata address
length equ 256d ; #bytes to copy
;------------------------------------------------------------
org 0h
ljmp 0100h
;------------------------------------------------------------
;Timer/Counter 1 interrupt
;------------------------------------------------------------
org 1bh
clr tr1 ; disable timer/counter 1
pop acc ; pop 'ajmp' loop addr
pop acc ; from the stack
pop dps ; return pre-transfer
pop dph ; DPTR state
pop dpl
pop ie ; return interrupt config
pop eie
reti ; back to instruction
; after "xmemcpy_.." call
;------------------------------------------------------------
; Main
;------------------------------------------------------------
org 0100h
orl tmod, #50h ; 16-bit counter
anl ckcon, #0F8h ; fast 2-cycle MOVX
call xmemcpy_count ; call xdata copy code
sjmp $
;------------------------------------------------------------
; 1) Save interrupt enable registers, make only T/C#1 enabled
; 2) Save DPTR0
; 3) Timer/Counter 1 loaded with (2^16-#bytes to copy)
; 4) Configure source/destination pointers
; 5) Execute copy loop
; - last write rolls the Counter
; - Timer/Counter 1 Interrupt breaks the loop
;------------------------------------------------------------
xmemcpy_count:
push eie
push ie
mov eie, #00h ; disable other ints
mov ie, #88h ; EA=1, ET1=1
push dpl ;save DPTR state
push dph
push dps
mov th1, #high(-length) ; copy length
mov tl1, #low(-length)
setb tr1 ; enable Timer1
orl dps, #30h ; SEL=0,TSL=1, AID=1
mov dptr, #source ; DPTR0 = source addr
mov dptr, #dest ; DTPR1 = dest addr
transfer:
movx a, @dptr ;[5] read from @DPTR0
movx @dptr, a ;[5] write to @DPTR1
ajmp transfer ;[2] in loop etil int
; ----
; [12] total
end
使用内部 XRAM 实现更高的传输速率
使用定时器/计数器提高执行效率的基本原理不仅适用于外部数据复制例程,还可用于外部数据读取或写入内部数据存储器。例如,如果应用要求从外部存储器(或从并行外设)读取或写入不超过1024字节,则可以使用DS1C89/430的内部450kB数据存储器进一步提高传输速率。
由于内部MOVX操作只需要2个周期,因此读/写传输环路(到目前为止一直是讨论的主题)可以减少到9个周期,有效传输速率为3.67MBps(@33MHz),并且仅占用4B的代码空间(下面的代码)。请记住,两个MOVX操作之一,无论是读取还是写入,都必须在外部存储器上执行,以便/RD或/WR选通递递增加定时器/计数器,最终终止传输环路。下面的第一个代码示例给出了对应于外部 MOVX 写入的周期计数,第二个示例显示了外部 MOVX 读取。另请注意,当计数/RD信号时,计数器应初始化为[216- (#bytes复制 +1)],以便在循环中断之前进行最终的字节写入。
loop: ; Ultra High-Speed Microcontroller User's Guide Cycle Count / Byte Count
movx a,@dptr ; 2 (internal MOVX) / 1
movx @dptr,a ; 5 (external MOVX) / 1
ajmp loop ; 2 / 2
; 9 cycles / 4 bytes
-- OR --
loop: ; Ultra High-Speed Microcontroller User's Guide Cycle Count / Byte Count
movx a,@dptr ; 5 (external MOVX) / 1
movx @dptr,a ; 2 (internal MOVX) / 1
ajmp loop ; 2 / 2
; 9 cycles / 4 bytes