使用超高速闪存微控制器实现快速内存传输

发布时间:2023-07-21  

达拉斯半导体超高速闪存微控制器具有双数据指针,具有自动递增/递减和切换选择功能。本应用笔记将采用一个数据指针的原始8051架构与DS89C430和DS89C450的新架构及其更高的数据移动效率进行了比较。本文提供了大量代码示例,以帮助理解该超高速微控制器的双数据指针的使用。

概述

嵌入式系统设计人员和程序员一直在寻找巧妙的方法来突破其 8051 微控制器设计的性能极限。如果您的应用受到微控制器复制外部数据存储器缓冲器或读/写存储器映射外设的速率的限制,则可能会受益于使用更多片上硬件和更少软件的方案。本应用笔记介绍了使用定时器/计数器作为终止固定长度复制例程的方法。将这种方法与达拉斯的超高速 8051 架构及其数据指针增强功能结合使用,可以以超过 2MBps 的速率复制数据,比以相同时钟频率运行并配备单个数据指针的标准 20 内核快 8051 倍以上。

XDATA 复制例程 - 原始 8051

最初的8051架构仅包含一个数据指针(DPTR = DPH + DPL),但提供了两种间接访问外部数据存储器的不同方式。MOVX指令可以使用16位数据指针(例如,MOVX @DPTR,A)或8位工作寄存器(例如,MOVX @R0,A)来访问MOVX数据空间。请注意,后一条指令使用 8 位寄存器指针,因此要求在执行指令之前使用指针的最高有效地址字节写入端口 2。只有一个数据指针,在复制超过 256 字节的数据时管理源指针和目标指针需要大量使用工作寄存器进行临时存储。下面是使用单个数据指针复制数据时通常执行的代码示例。

; Original 8051 Copy - Single DPTR

; R6:R7 control copy length

; R4:R0 used for source/dest DPTR hi/lo temp storage

loop: ; Cycle Count @ 12clks/cycle

movx a,@dptr ; 2

inc dptr ; 2

xch a,r0 ; 1

xch a,dpl ; 1

xch a,r0 ; 1

xch a,r4 ; 1

xch a,dph ; 1

xch a,r4 ; 1

movx @dptr,a ; 2

inc dptr ; 2

xch a,r0 ; 1

xch a,dpl ; 1

xch a,r0 ; 1

xch a,r4 ; 1

xch a,dph ; 1

xch a,r4 ; 1

djnz r7,loop ; 2 => 22cycles * length

djnz r6,loop ; 2 => 2cycles * (1 + (length/256))


XDATA 复制例程-超高速微控制器

超高速微控制器包含两个数据指针(DPTR = DPH + DPL;DPTR1 = DPH1 + DPL1),允许单独的源和目标数据指针。此外,它还实现了硬件控件,以在数据指针之间自动切换,并自动递增或递减活动数据指针,以响应某些与 DPTR 相关的指令。有关增强型双数据指针的完整详细信息,请参阅超高速微控制器用户指南。下面的代码演示了增强的双数据指针如何简化复制例程。自动切换活动数据指针的指令标有 [T],自动前进数据指针的指令标有 [+/-]。为了与原始8051架构进行比较,假设了标准的8051外部P2,P0存储器总线结构,从而给出了5个时钟周期的最小MOVX持续时间(1个时钟周期用于MOVX操作码提取,4个时钟周期用于数据存储器访问)。虽然页面模式 1 外部总线配置的周期计数未反映在下面的代码示例中,但应该注意的是,页面模式 1 确实提供了绝对的最小外部 MOVX 持续时间(3 个时钟周期 = MOVX 操作码提取的 1 个时钟周期 + 数据存储器访问的 2 个时钟周期)。


; Ultra High-Speed Micro Copy - Enhanced Dual DPTRs

; DPS.4 (AID) = 1; DPS.5 (TSL) = 1;

; R6:R7 control copy length

loop: ; Cycle Count @ 1clk/cycle

movx a,@dptr ; 5 [T][+/-]

movx @dptr,a ; 5 [T][+/-]

djnz r7,loop ; 5 => 15 cycles * length

djnz r6,loop ; 5 => 5 cycles * (1 +(length/256))

XDATA 复制例程 - 使用计时器/计数器

若要使用计时器/计数器,应用程序必须在复制例程期间提供计时器/计数器及其关联的输入引脚。基本思想是使用片内计数器来跟踪和终止复制环路,而不是使用工作寄存器。/WR选通用作计数器的输入信号。图 1 显示了一个硬件配置示例。


图1.低电平有效WR选通计数的硬件图。


图1.低电平有效WR选通计数的硬件图。

所有超高速微控制器定时器/计数器输入引脚(T0、T1、T2)都能够对相当于系统时钟频率四分之一的输入频率进行采样。这意味着要采样的输入信号必须具有最小高电平和低电平时间,每个周期为2个系统时钟周期。除了 1 周期或 2 周期寻呼模式 1 中最快的 MOVX 外,/WR 选通器还满足所有其他外部 MOVX 操作的此标准。在进入复制循环之前,16 位计数器加载适当的值 (216- #bytes复制),定时器/计数器中断被启用,并且增强的数据指针配置为最快速的复制。复制的最后一个字节会导致计数器翻转并生成计时器中断,从而允许将代码执行返回到主程序。

使用定时器/计数器方法的好处

使用计时器/计数器的主要好处是提高了性能,同时允许更宽容的 xdata 访问时间。已经注意到,最快的复制循环执行时间是通过将外部总线结构配置为寻呼模式 1(端口 2 = 多路复用地址 MSB/LSB 和端口 0 = 数据)来实现的。尽管页面模式 1 提供了终极性能,但它也需要最快的 xdata 访问时间 (tRLDV < 中联).计时器/计数器方法提供几乎相同的性能,同时使最大 xdata 访问时间几乎翻倍。

此外,预计并非所有超高速微控制器设计都将使用新的总线结构。一些系统设计人员可能希望保留传统的8051总线接口,甚至可能将超高速微控制器放入现有插座中。在这些情况下,计数器端接复制环路提供了高性能折衷方案。

由于定时器/计数器端接复制环路依赖于内部 16 位定时器硬件来计算外部读/写事件的数量,因此不需要单独的 DJNZ 指令来跟踪 16 位环路控制变量。这允许应用程序对大于 256 字节的数据长度执行高速同步传输。

表1比较了原始8051架构的复制环路与三种可能的超高速微控制器配置。计数器终止的复制循环已突出显示。下表是计时器/计数器终止副本的示例代码清单。代码中突出显示了复制循环,以便与前两个示例进行比较。

image.png

计数器终止复制方法(代码示例)

;------------------------------------------------------------

; Demonstrate use of Timer/Counter 1 to terminate copy loop

; Use P3.6 (Active-Low WR) as an input to Timer/Counter 1 (P3.5)

; In this example:

; 1) Source, dest, and length defined as constants.

; 2) Code saves only DPTR0 state under the assumption that a

; single DPTR is normally used and that the second (DPTR1)

; is enabled only for certain routines (such as this one).

; 3) Code disables all other interrupts during the copy.

; 4) External non-overlapping xdata to xdata transfer

;------------------------------------------------------------

$include(420.def) ; include file w/SFRs

source equ 0100h ; source xdata address

dest equ 0200h ; dest xdata address

length equ 256d ; #bytes to copy

;------------------------------------------------------------

org 0h

ljmp 0100h

;------------------------------------------------------------

;Timer/Counter 1 interrupt

;------------------------------------------------------------

org 1bh

clr tr1 ; disable timer/counter 1

pop acc ; pop 'ajmp' loop addr

pop acc ; from the stack

pop dps ; return pre-transfer

pop dph ; DPTR state

pop dpl

pop ie ; return interrupt config

pop eie

reti ; back to instruction

; after "xmemcpy_.." call

;------------------------------------------------------------

; Main

;------------------------------------------------------------

org 0100h

orl tmod, #50h ; 16-bit counter

anl ckcon, #0F8h ; fast 2-cycle MOVX

call xmemcpy_count ; call xdata copy code

sjmp $

;------------------------------------------------------------

; 1) Save interrupt enable registers, make only T/C#1 enabled

; 2) Save DPTR0

; 3) Timer/Counter 1 loaded with (2^16-#bytes to copy)

; 4) Configure source/destination pointers

; 5) Execute copy loop

; - last write rolls the Counter

; - Timer/Counter 1 Interrupt breaks the loop

;------------------------------------------------------------

xmemcpy_count:

push eie

push ie

mov eie, #00h ; disable other ints

mov ie, #88h ; EA=1, ET1=1

push dpl ;save DPTR state

push dph

push dps

mov th1, #high(-length) ; copy length

mov tl1, #low(-length)

setb tr1 ; enable Timer1

orl dps, #30h ; SEL=0,TSL=1, AID=1

mov dptr, #source ; DPTR0 = source addr

mov dptr, #dest ; DTPR1 = dest addr

transfer:

movx a, @dptr ;[5] read from @DPTR0

movx @dptr, a ;[5] write to @DPTR1

ajmp transfer ;[2] in loop etil int

; ----

; [12] total

end

使用内部 XRAM 实现更高的传输速率

使用定时器/计数器提高执行效率的基本原理不仅适用于外部数据复制例程,还可用于外部数据读取或写入内部数据存储器。例如,如果应用要求从外部存储器(或从并行外设)读取或写入不超过1024字节,则可以使用DS1C89/430的内部450kB数据存储器进一步提高传输速率。


由于内部MOVX操作只需要2个周期,因此读/写传输环路(到目前为止一直是讨论的主题)可以减少到9个周期,有效传输速率为3.67MBps(@33MHz),并且仅占用4B的代码空间(下面的代码)。请记住,两个MOVX操作之一,无论是读取还是写入,都必须在外部存储器上执行,以便/RD或/WR选通递递增加定时器/计数器,最终终止传输环路。下面的第一个代码示例给出了对应于外部 MOVX 写入的周期计数,第二个示例显示了外部 MOVX 读取。另请注意,当计数/RD信号时,计数器应初始化为[216- (#bytes复制 +1)],以便在循环中断之前进行最终的字节写入。


loop: ; Ultra High-Speed Microcontroller User's Guide Cycle Count / Byte Count

movx a,@dptr ; 2 (internal MOVX) / 1

movx @dptr,a ; 5 (external MOVX) / 1

ajmp loop ; 2 / 2

; 9 cycles / 4 bytes

-- OR --

loop: ; Ultra High-Speed Microcontroller User's Guide Cycle Count / Byte Count

movx a,@dptr ; 5 (external MOVX) / 1

movx @dptr,a ; 2 (internal MOVX) / 1

ajmp loop ; 2 / 2

; 9 cycles / 4 bytes


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    51单片机数据传送指令;51单片机数据传送指令   数据传送指令共有29条,数据传送指令一般的操作是把源操作数传送到目的操作数,指令执行完成后,源操作数不变,目的操作数等于源操作数。   如果要求在进行数据传送......
    设定 DMA_CCR 寄存器的 DIR[1:0]位的值决定。比如本章实验是从内存读取数据发送到串口,所以数据传输方向为存储器到外设,配置为DMA_DIR_MemoryToPeripheral......
    一文详解80C51单片机的指令集;数据传送类指令 数据传送是单片机最基本的操作。数据传送的一般功能是将源操作数传送到指令所指定的目的操作数,指令执行后,源操作数不变。 数据传送......
    内存一般就是DDR RAM,不会是硬盘硬盘是保存数据的地方;由此类比时,自己把自己弄晕菜了,单片机的RAM对应于DDR RAM,那Flash是不是就对应于硬盘了呢?在CSAPP上明白了,PC上之......
    ,但是PC上内存一般就是DDR RAM,不会是硬盘硬盘是保存数据的地方;由此类比时,自己把自己弄晕菜了,单片机的RAM对应于DDR RAM,那Flash是不是就对应于硬盘了呢?在CSAPP上明......
    ,但是PC上内存一般就是DDR RAM,不会是硬盘硬盘是保存数据的地方;由此类比时,自己把自己弄晕菜了,单片机的RAM对应于DDR RAM,那Flash是不是就对应于硬盘了呢?在CSAPP上明......
    空间匮乏而减缓,则可尝试通过增加虚拟内存来进行补偿。但是,计算机从RAM读取数据的速率要比从硬盘读取数据的速率快,因而扩增RAM容量(可加内存条)是最佳选择。 虚拟内存是Windows 为作为内存使用的一部分硬盘......
    递参数,依次将各个字数据分别传送到寄存器R0-R3中去。 当参数个数超过4个时,还需使用数据栈来传递参数,把前4个字数据分别传送到寄存器R0-R3中去,剩余的字数据传送到数据栈中,需要注意的是,入栈......
    快速、精确地定量分析混合燃料中煤与矸石的搭配比例,就成为监管部门及企业需要解决的问题。为解决上述问题,本文基于ARM7芯片S3C44BOX,设计了一个集数据采集、处理、显示为一体的嵌入式定量分析系统,并可以通网络将数据传送到......
    中,它有多个输出插件将这些视频数据经过处理,其中最重要的输出插件是网站服务器插件,它将视频数据传送到用户浏览器中,MJPG-streamer的工......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>