在应用编程(IAP)应该是MCU使用过程中常见的一种功能,MCU厂商为了加速用户的产品开发,都会在其SDK中添加相关示例,而且也有不少用户只需要简单的集成,就完成了该功能并实现产品的量产。但你是否真的会在Flash上存数据?
首先我们需要从片内和片外存储谈起,MCU内部的非易失性存储器绝大多数都是基于FLASH的(也有少部分是EEPROM的,比如NXP LPC80x系列),MCU外部的非易失性存储器可以有FLASH,EEPROM,其中EEPROM比较常见的是I2C接口,FLASH有NAND, NOR, SPI NOR等等。
实际应该过程中,我们到底应该怎么选择呢?需要存储的数据量大小是首要问题,我们可以根据它来大致设定规则
-
当数据量大于128MB时,NAND FLASH或者SD(TF)卡是常见的选择,但考虑到NAND FLASH会有坏块的问题,编写存储软件时需要考虑磨损均衡以及坏块管理的问题,想要做的非常可靠并不容易。
-
当数据量小于128MB,大于2MB时,可以选择NOR FLASH或EEPROM,EEPROM技术上的优势是耐久性好,可以反复多次编程,最高可达100W次的擦写循环,NOR FLASH相比EEPROM容量会更大,平均成本更好,但是寿命会少个0,最大只能到10W次的擦写循环。
EEPROM(AT24C02)
FLASH(IS25WP032)
-
当数据量小于2MB时,就可以考虑将其放入MCU内部的FLASH中,一旦决定把数据放MCU内部FLASH时,就面临两个问题:
(1)MCU片内FLASH承诺的寿命更短,一般可能是1~5W次,好像也有几百次的,鉴于大佬已经停线,这里就不点名了。关于这个参数切记要参考手册,不同厂家的参数不一样,同一厂家的不同系列也可能有差异
NXP Kinetis系列MCU
STM32 F103xx
(2) 擦写过程可能需要关闭中断,虽然这个不是必须的,但除非MCU的Datasheet明确有写支持,绝大多数MCU都是有这方面的要求,并且IAP编程的函数需要运行于RAM或ROM中,因为擦写过程中,如果MCU没有特殊的设计(比如下图NXP Kinetis K64系列带有双Block flash是可以支持WWR),该过程是无法进行取指的,关中断的目的是防止外部中断触发运行于FLASH上的ISR,如果用户不希望关中断,则必须要将可能发生中断的函数Relocate到RAM中
//RAM中执行的编程函数 static status_t flash_command_sequence(flash_config_t *config) { uint8_t registerValue; __set_PRIMASK(1); #if FLASH_DRIVER_IS_FLASH_RESIDENT /* clear RDCOLERR & ACCERR & FPVIOL flag in flash status register */ FTFx->FSTAT = FTFx_FSTAT_RDCOLERR_MASK | FTFx_FSTAT_ACCERR_MASK | FTFx_FSTAT_FPVIOL_MASK; status_t returnCode = flash_check_execute_in_ram_function_info(config); if (kStatus_FLASH_Success != returnCode) { __set_PRIMASK(0); return returnCode; } /* We pass the ftfx_fstat address as a parameter to flash_run_comamnd() instead of using * pre-processed MICRO sentences or operating global variable in flash_run_comamnd() * to make sure that flash_run_command() will be compiled into position-independent code (PIC). */ callFlashRunCommand((FTFx_REG8_ACCESS_TYPE)(&FTFx->FSTAT)); __set_PRIMASK(0); #else /* clear RDCOLERR & ACCERR & FPVIOL flag in flash status register */ FTFx->FSTAT = FTFx_FSTAT_RDCOLERR_MASK | FTFx_FSTAT_ACCERR_MASK | FTFx_FSTAT_FPVIOL_MASK; /* clear CCIF bit */ FTFx->FSTAT = FTFx_FSTAT_CCIF_MASK; /* Check CCIF bit of the flash status register, wait till it is set. * IP team indicates that this loop will always complete. */ while (!(FTFx->FSTAT & FTFx_FSTAT_CCIF_MASK)) { } #endif /* FLASH_DRIVER_IS_FLASH_RESIDENT */ /* Check error bits */ /* Get flash status register value */ registerValue = FTFx->FSTAT; /* checking access error */ if (registerValue & FTFx_FSTAT_ACCERR_MASK) { __set_PRIMASK(0); return kStatus_FLASH_AccessError; } /* checking protection error */ else if (registerValue & FTFx_FSTAT_FPVIOL_MASK) { __set_PRIMASK(0); return kStatus_FLASH_ProtectionViolation; } /* checking MGSTAT0 non-correctable error */ else if (registerValue & FTFx_FSTAT_MGSTAT0_MASK) { __set_PRIMASK(0); return kStatus_FLASH_CommandFailure; } else { __set_PRIMASK(0); return kStatus_FLASH_Success; } }
(3) 擦写时间对系统的影响,之前讲过擦写过程是不能执行FLASH code的,所以势必会让系统pending住,而这个pending时间可以在Datasheet中寻找答案,一般擦除是按照sector/block大小来的,编程时按照word或者page大小来的,擦除时间一般更长,对系统影响更大。用户需要考虑的是系统是否可以接受每个控制周期,等待1个擦除最小单位的编程时间,这是由于有可能需要编程的数据比较大,如果同一时间更新势必会影响到控制周期,但如果把擦写任务分配到每个控制周期,就可以将影响降低到最小,以NXP Kinetis,擦除一个Sector典型值是14ms,每次写入Longword(8字节)所需要的时间是65us,当需要升级的时候,在接收到升级命令的第一帧处理时,增加sector删除命令,本次运算周期会增加14ms的pending时间,然后每周期编程8字节数据。如果系统需要将数据存在内部flash上,就必须接受某一个周期增加14ms的pending,随着flash写入次数的增多,14ms还会增大到114ms
在确定了上述问题之后就可以完成存储设备的选型,但软件处理还需要注意以下几个要点,这些问题MCU厂家一般是不会提供解决方案的,需要用户根据自己的需求来完成:
-
冗余备份:有些时候用户需要更新正在使用的参数/固件,考虑到更新失败的情况下,需要支持参数/固件版本回退,所以需要两片备份区进行冗余备份。
-
Magic number or 校验码:Magic number一般就是在FLASH编程结束时候,写一个位数较高的(64bit)值到固定地址,使用加载数据时,先判断Magic number是否正确,以此判断编程过程是否完整,切记Magic number要在编程时先擦后写(第一个擦,最后一个写),否则无法起到验证效果。这种验证方式比较初级,对于可靠性要求更高的场合,一般会使用校验码的方式(CRC或者MD5),特别是参数文件通过通信的方式传输到MCU中,虽然通信过程可能也有校验(比如Modbus RTU的CRC),但是无法保证数据在RAM缓冲区不发生位翻转的情况,大多数MCU都不支持ECC功能,在这种情况下是无法纠错的,如果对端设备会将文件的校验码发过来进行校验,就可以避免该问题的发生,虽然RAM出现位翻转的概率非常低,但是如果发生位翻转的参数是设备的保护点或者PWM死区值,一旦出现错误,就可能会发生设备故障或损毁,甚至出现安全事故。
-
编程过程掉电或复位:在编程的过程中出现掉电或者复位是经常出现的一种异常情况。比如震动导致电源接触不良,或者系统异常导致看门狗无法喂狗都有可能出现,还有使用POE电源对端设备直接断电都有可能造成这种异常。所有一定要考虑在这种情况下的异常处理,比如上电加载数据的时候,如果校验失败,可以使用一组安全数据或者更新前的数据。对于带操作系统的应用,建议硬件添加系统掉电检测电路,在检测到掉电事件(如24V掉电)发生时,如果当前没有写入Flash,则lock住写入进程,如果当前正在写入Flash,则立即调用sync函数,尽快将数据从缓存写入Flash(硬件上MCU VDD加个稍微大点的电容,多扛一段时间),不要等待系统后台写入。
-
二次编程:有些MCU内部的Flash是带有校验机制的,对于同一地址在擦除完成后,只能进行一次编程,如果进行二次编程写入不同数值进去,可能会除非校验失败,导致该地址无法正常读写。
总结,这里列了一个表格,当需要IAP的时候,可以根据所选芯片的参数判断是否满足自身系统的需求(下表已经填入示例数据):
NVM | 擦除编程最小单元 | 擦除编程所用时间 | 擦除编程寿命 | 编程过程是否需要关中断 | 编程数据的校验 | 编程过程中掉电/复位 |
---|---|---|---|---|---|---|
EEPROM | 不需要擦,可以按字节或者Page写入 | 写周期5ms | 1000000 | 不需要 | 软件添加 | 软件添加 |
NOR FLASH | Sector = 4K, 最小写入Page = 256B | Sector擦70ms,Page写0.2ms | 100000 | 不需要 | 软件添加 | 软件添加 |
MCU FLASH | Sector = 2KB, 最小写入8Byte | Sector擦14ms,写65us | 50000 | 需要 | 软件添加 | 软件添加 |