STM32F7高速缓存

发布时间:2023-03-06  

STM32F7是第一款带有内部高速缓存的STM32微控制器,所以接下来我们会介绍一些和高速缓存和Cache相关的基本概念,会介绍一些如果是开发者在使用STM32F7的时候需要注意的事情。


STM32F7的内核中带有一级高速缓存,实现了4K的数据缓存和4K的指令缓存。

下面介绍一下什么是高速缓存和与高速缓存相关的一些基本概念。

高速缓存就是高速存储器块,包括地址信息和相关联的数据,它的目的主要是为了提高对存储器的平均访问速度。

执行代码的时候CPU每次都要去访问FLASH,而我们知道FLASH的读取速度是远远低于CPU的主频的,所以需要设置一个等待周期来保证能够正确地从FLASH中把数据读出来。有了Cache之后,第一次访问FLASH读取出需要的指令和数据之后,可以把指令和数据先放到Cache里,当下次再需要这部分内容的时候就不需要再去访问FLASH,而是直接从Cache中把这部分内容读出来,这样就可以提高存储器的平均访问速度和程序的执行速度。


高速缓存的这种应用是基于下面两个程序的局部性:

一个是空间局部性,如果一个存储器的位置被访问,那么将来它附近的位置也会被访问,比如顺序执行代码或者是使用一个数据结构。


另一种是时间局部性,被访问过一次的存储器位置,接下来会被多次引用。比如代码中的循环。


下面介绍一下高速缓存中的一些术语。

缓存行是指逻辑上的一组存储器位置,是内存交换数据的最小粒度。

缓存命中是指要访问的数据或者指令已经在缓存中。

缓存缺失是指要访问的数据或者指令不在缓存中。

处理器需要访问某个可缓存的寄存器位置时,会先检查缓存内是否已经存在该位置的内容。如果缓存命中,就直接从缓存读出;如果缓存缺失,就从存储器中读出,同时放入缓存。


缓存分配是指当出现缓存缺失时,需要在缓存中发现一个位置,并且把新的缓存数据存到这个位置。在缓存分配时有两种策略,一种是读分配,就是说在进行读操作发生缓存缺失的时候,进行缓存分配,所有可缓存的存储器都是读分配;另一种是写分配,是在进行写操作发生缓存缺失的时候进行缓存分配。


在应用高速缓存的时候会带来一致性问题,一个原因是程序员不能控制对存储器的访问时机,不知道什么时候会发生CPU访问存储器,可能在读数据写数据的时候都是从缓存中读从缓存中取和把数据写到缓存中,根本就没有真正地访问存储器,可能在某一个时刻缓存满了,但又需要存新的缓存内容,这个时候可能会把数据重新写到FLASH中,这个时机是程序员不能控制的。另一个问题是同一个数据被保存在多个物理位置,被保存在缓存里,又被保存在FLASH中,这两个物理位置中的数据并不都是一致的,所以这个时候就会出现一致性问题。


驱逐是指从缓存中移除一个缓存行,为新的数据腾位置的过程。它发生在一个标位“dirty”的缓存行被新的缓存行替代的时候,标位“dirty”是说现在数据还只是存在缓存里,需要更新到存储器中。


回写是指在对数据进行操作时,只更新缓存,然后将缓存行标记为“dirty”,当这个缓存行需要被替换的时候,再将数据写到存储器中。


透写是指在对数据进行操作的时候同时更新缓存和二级存储,这时候缓存行不被标记为“dirty”。


缓存策略

第一种:透写,就是说数据直接同时写到缓存和下一级存储器中。

第二种:回写,是说数据只写到缓存。



Cortex-M7高速缓存

Cortex-M7的高速缓存采用了哈佛结构,指令缓存和数据缓存都是分开的,而且是可选的,只在AXIM接口有缓存。对于M7的系统架构来说,增加了Cache之后它增加了Cache的维护操作,增加了新的相关寄存器,最重要的是使用Cache会对系统软件有影响。


Cortex-M7高速缓存全面支持下列的缓存属性:

透写,不支持写分配;

回写,不支持写分配;

回写,支持写分配。

回写的方式有利于优化性能,因为减少了对FLASH的访问次数,但是会带来一致性的问题,Cortex-M7没有对一致性的硬件支持,所以需要从软件的层面去保证数据的一致性。

对于一致性有两种可选方案

一种是把所有的共享存储器都定义为共享属性,定义为共享属性之后这些区域将默认不被缓存到D-Cache,由于所有的操作都是直接针对二级存储器进行的,性能就会降低。但是因为这种情况下缓存对于这些区域是透明的,所以写软件会更容易。

另一种是通过软件对cache进行维护,包括两个方面,一方面M7的写操作必须是全局可见的,另一方面其他主设备的写操作要对M7可见。

存储器的属性可以由MPU来进行设定,包含共享属性、分配策略和存储器类型。

下图是存储器默认的映射和属性



最后说一下初始化和使能以及缓存的时候需要注意的问题

上电复位时,在使能之前,cache必须全部被作废,作废就是告诉CPU现在缓存中的数据已经没有用了,如果想对这些数据进行操作的话必须重新从二级存储中把它读出来。如果不这样做,可能会引发程序不可预测的行为。如果是通过软复位并且确定复位前RAM中的值都是可靠的,可以不用做这一步。


为了保证数据的一致性,必须在除能D-cache之前对其进行清理,这个只在使用回写策略时需要,如果不这么做就可能会丢失数据。


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    128KB DTCM- AXI总线:512KB- AHB总线:288KB- 低功耗域:64KB- 全部SRAM都带有ECC校验 H7系列具有强大的内核,Chrom-ART Accelerator ......
    DTCM主要放置常用代码;实时控制部分通过SDMMC和传统通讯接口,进行传感器以及马达驱动控制,在执行上实现了真正的零等待过程。 H7功耗优化功能非常突出。 STM32H7优异的能效表现 在运......
    接口的64KB的DTCM RAM16KB的ITCM RAM,这两个部分的RAM可以被内核直接访问,访问的速度更快。 STM32F7还支持更多的外设,比如说Quad SPI等。 整个STM32F7......
    配有定时器,那么你有关注、对比过各系列、各型号MCU中定时器的差异吗? 2 哪些STM32配有LPTIM定时器? 在STM32中,相对较新的MCU部分型号配有LPTIM定时器。 比如:STM32F7H7高性......
    似乎看起来是冲突的。实际上,STM32F7是基于Cortex-M7内核,而Cortex-M7Cortex-M3/M4的复位序列有些不一样。本文中,将针对这个问题做详细讲解。 STM32F4的复......
    他的系列的linker file有所区别,所以此处分为H7others两个文件夹进行存放。我们此处选用H7目录下的问题件。将所有的文件添加到工程中。 第二步 修改Dev_Inf.c中的name为你想设置的名称,一般......
    下,由于H7和其他的系列的linker file有所区别,所以此处分为H7others两个文件夹进行存放。我们此处选用H7目录下的问题件。将所有的文件添加到工程中。 第二步 修改Dev_Inf.c......
    2.2uF电容换为0.1uF。 要是把BYPASS_REG引脚拉高了不给VCAP_1VCAP_2供电的话,芯片也一定工作不了。 图4. STM32F7系列MCU内部稳压器关闭时的注意事项 知道......
    似乎看起来是冲突的。实际上,STM32F7是基于Cortex-M7内核,而Cortex-M7Cortex-M3/M4的复位序列有些不一样。本文中,将针对这个问题做详细讲解。 STM32F4的复......
    上,STM32F7是基于Cortex-M7内核,而Cortex-M7Cortex-M3/M4的复位序列有些不一样。本文中,将针对这个问题做详细讲解。 STM32F4的复位序列 STM32F4基于Cortex......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>