基于STM32的三种库函数代码效率对比解析

发布时间:2023-09-01  

前言

ST已经推出了三种库函数,以方便客户快速开发STM32系列MCU。从最早的标准外设驱动库,到后来的Cube HAL,再到Cube LL以及直接操作寄存器。这几种库的代码效率到底如何呢?本文将针对这个问题进行粗略分析,并提供对比数据供大家参考。


问题分析

我们以GPIO翻转、TIM PWM 输出、ADCDMA 数据采集和DMA M2M这四个常用功能,通过不同的库函数来实现相同功能,最终来对比各个库函数的性能。四个工程代码的内容简述如下:

GPIO翻转:切换GPIO的输出电平,其中包含了系统时钟初始化和GPIO翻转的代码。TIM PWM输出:通过TIM1 的通道1输出频率是36KHz的PWM,循环修改其占空比从25%到50%,其中包含了系统时钟初始化、TIM1的初始化和切换占空比的代码。ADC DMA数据采集:通过ADC的模拟通道1,采集100次ADC的结果,并使用DMA传输到到用户缓冲区,其中包含了系统时钟初始化、ADC初始化和DMA的初始化的代码。DMA M2M:使用DMA1的通道1,从Flash中传输100字节的数据到片内的SRAM中。其中包含了系统时钟的初始化和DMA的初始化代码。


主要对比三个参数:Flash占用量、SRAM占用量和执行代码的效率。

Flash和SRAM的占用量可以通过查看IAR生成的*.map文件了解到。

在*.map文件中,会有如上图的内容,其中的readonly code memory加上readonly data memory的和,就是Flash的占用量。而Readwrite data memory的大小即为SRAM的占用量。那么上图所示的Flash占用量即为3204=3174+30,SRAM占用量即为1032。因用户堆(Cstack)我们设置的为1024,所以真正应用代码所占用的SRAM量为8=1032-1024.

代码的运行效率部分,我们是通过IAR提供的内核运行周期数(CYCLECONTER)来计算的。在功能函数的开始处和结束处分别设置断点,两次内核运行周期数的差值,就是此处代码的运行周期。

测试硬件选用了Nucleo-F302评估板。

软件环境和库函数详情如下:

• IAR V7.60

• Optimizations Level High (Size)

• STM32CubeMX V4.17

• Create Project with Copy the necessary libraryfiles

• STM32CubeF3 V1.60

• STM32F30x_DSP_StdPeriph_Lib_V1.2.3

• STM32F3xx CMSIS V2.3.0

测试结果如下:[手机模式下图片可点击放大观看]

总体来看,代码效率与代码的兼容性及可移植性成反比的规律是明显的。Cube LL库的效率明显优于HAL库的,几乎和直接写寄存器的效率相差无几。HAL库函数因为要顾及整个STM32系列间的代码高度兼容与可移植性,代码相对庞大。对于刚接触STM32的人来说,非常易于上手做些基本的评估和验证,入门快捷。LL库的出现,是对HAL库的有力补充。相比HAL库用户,LL库用户需要对MCU及相应外设有更为细致的了解。

目前,STM32cubeMX不但支持基于HAL库的初始化文件的生成,也已支持基于LL库的初始化文件及工程的生成,对于已经比较熟悉STM32应用或关注代码效率的开发人员来说,可以优先考虑使用LL库。

顺便介绍在STM32CubeMx的图形化界面下,如何选择使用HAL库还是LL库生成初始化文件及相应工程。

在CubeMx界面下,做好各个外设的选择及配置后,在ProjectProject SettingAdvanced Settiing如下图示界面上,你可以选择要使用的库类型:HAL/LL.

另外,偶尔人询问及LL库在哪里,其实LL库函数跟HAL库函数是在同一目录下。以STM32F4为例,你下载STM32CubeF4解压后,在类似如下目录可以看见HAL函数和LL函数库文件。

。。。DriversSTM32F4xx_HAL_DriverSrc


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    方针和最佳实践的集合,它可以识别语言中容易引起Bug的行为,防止你在源代码中做可疑的事情,消除容易出现缺陷的代码结构,帮助你快速提高代码质量。 在嵌入式系统中,MISRA-C/C++,CERT-C/C++,CWE等已......
    stm32位带操作有什么用;STM32位带操作是一种在ARM Cortex-M微控制器中使用的特殊技术,它允许同时处理多个位,并且可以提高代码效率和性能。在这篇文章中,我将详细介绍STM32位带......
    会导致硬件设备的故障或安全漏洞,严重影响系统的正常运行。 编码标准是提高代码质量的最佳实践 基于历史原因,目前在嵌入式开发中,主要还是使用C/C++高级编程语言,而C/C++是一种不安全的语言,包含......
    代替。在ICCAVR中,如果乘以2n,都可以生成左移的代码,而乘以其它的整数或除以任何数,均调用乘除法子程序。用移位的方法得到代码比调用乘除法子程序生成的代码效率高。实际上,只要......
    代替。在ICCAVR中,如果乘以2n,都可以生成左移的代码,而乘以其它的整数或除以任何数,均调用乘除法子程序。用移位的方法得到代码比调用乘除法子程序生成的代码效率高。实际上,只要......
    出状态翻转一次,如果我们的 LED 接在 PB5 上,就可以看到 LED 闪烁了。 2define宏定义 define 是 C 语言中的预处理命令,它用于宏定义(定义的是常量),可以提高源代码......
    出状态翻转一次,如果我们的 LED 接在 PB5 上,就可以看到 LED 闪烁了。 2define宏定义 define 是 C 语言中的预处理命令,它用于宏定义(定义的是常量),可以提高源代码......
    出状态翻转一次,如果我们的LED接在PB5上,就可以看到LED闪烁了。   2 define宏定义     define是C语言中的预处理命令,它用于宏定义(定义的是常量),可以提高源代码的可读性,为编......
    我们的LED接在PB5上,就可以看到LED闪烁了。   02 define宏定义 define是C语言中的预处理命令,它用于宏定义(定义的是常量),可以提高源代码的可读性,为编程提供方便。常见......
    以看到LED闪烁了。   2 define宏定义   define是C语言中的预处理命令,它用于宏定义(定义的是常量),可以提高源代码的可读性,为编程提供方便。常见的格式: “标识符”为所......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>