数据是社会发展的基础资源。随着数字经济时代到来,爆发式增长的数据量为用户生活带来便利,也为企业智能化发展提供动力。存储作为数据载体设备发挥着重要作用,数据存储既要满足当前全球数据量ZB级的高速增长需求,又要保证数据安全可靠、高效精准的存、读、写。数据中心"稳定的数据存力"离不开各存储节点的平稳运行,提升数据存储的安全可靠性,避免意外场景下的数据丢失,已成为存储硬件平台发展的重要挑战。
存储备电——数据存储安全的保障
存储系统采用电源单元(PSU)"X+X"冗余供电,在供电之外还配置备用电池BBU(Battery Back-Up Unit),当机房市电掉电或PSU模块出现异常,存储系统实时监测PSU供电状态,并进行预判,无缝切换由备用电池BBU供电。BBU提供持续的供电能力,确保存储系统控制器写缓存中数据完整且安全地写入非易失性介质(HDD、SSD硬盘),避免数据丢失。为保证数据存储的业务连续性,机房市电意外掉电、市电恢复后能快速恢复存储系统的业务。
随着数据量级成倍增长、存储业务复杂程度提升,存储硬件平台正朝着高密度与高性能方向发展,传统供电备电控制策略难以满足存储系统的稳定性要求。高端存储平台从系统架构到部件性能的升级伴随着系统整体功率提升,正常运行时存储阵列整机功耗是上一代产品2倍,掉电时刻控制器快速降低功耗,备份数据时整机功耗仍是上一代产品2倍;单个BBU的电芯节数增加2倍才能满足异常掉电时备份数据功耗需求。受功率密度限制,供电需求增加,PSU异常掉电维持时间会减小3/4,大功率BBU输出启动时间会增加3倍。因此,需要设计新的供电架构,PSU供电异常时无缝切换至BBU供电。
高端存储性能提升,存储备电方案挑战升级
浪潮信息提出BBU冷备份模式无缝切换和"X+X"冗余供电控制方案:
1、PSU、BBU实现"X+X"冗余供电,三年产品生命周期内,BBU冗余供电状态满足两次掉电数据备份要求;BBU非冗余供电状态满足存储产品1次掉电数据备份要求。
2、相比传统BBU热备份供电,创新采用备用电池BBU冷备份无缝切换控制策略,满足存储系统高可靠性要求的同时,提高了电池的使用寿命,降低了BBU热备份能耗和电池报废数量,降低对环境的污染。
浪潮信息智能备电控制方案设计双向流动充放电控制电路,BBU需要充电时,充放电模块工作在BUCK充电模式,为BBU充电;数据备份BBU放电电压低于一定阈值,充放电模块工作在BOOST升压放电模式,输出电压恒定。旁路放电+OR-ING线或控制电路保证PSU工作正常时BBU不为系统供电,PSU工作异常时无缝切换至BBU为系统供电。PSU为系统供电时BBU放电模块不需要工作,降低了BBU热备份能耗。
智能控制算法根据不同使用场景选用不同充电控制模式(预充、CC、CV)对BBU进行充放电管理,保证BBU供电时恒压输出,提高电池使用寿命的同时降低BBU电池报废数量和对环境的污染。智能PID控制算法,调频与调幅相结合,提高了充电、放电控制精度。根据负载大小选取不同控制算法,提高转化效率,达到节能减排目的。BBU单节点供电升级成1+1冗余供电,全数字控制算法,优化现有供电链路侦测、备电能力评估算法,杜绝了丢失数据隐患,提高供电稳定性、可靠性。
存储系统作为备电流程顺利进行的关键,对BBU单元的管理至关重要,基于BBU单元自诊断的状态信息,从以下五个方面进行智能备电状态监测处理,并对传统监测处理算法进行优化:
1) 定期对BBU供电链路侦测,模拟存储系统供电切换流程,BBU供电链路异常时提前识别链路隐患,出现隐患时存储系统不会下电;
2) 定期评估BBU单元备电能力,深度放电提高评估精度,判定是否满足存储系统备电需求,同时消除BMS采样累积误差;
3) 存储系统实时读取BBU单元电压与电流、电芯电压与温度、充放电MOS管温度,接近BMS内置阈值时异常修复,无法修复时报警处理;
4) 充电过程自动监测BBU备电能力,检测是否满足存储系统一次备电需求,实时更新BBU状态;
5)存储系统对BBU单元BMS状态寄存器状态值实时监控,出现异常后智能修复,无法修复及时告警,BBU非冗余模式,进入数据备份异常处理流程。
浪潮信息BBU状态智能诊断,提前识别供电隐患,将潜在异常的识别率提升了5倍,杜绝了数据丢失风险;问题诊断完成后,存储系统对日志进行智能分析,准确定位如BBU电芯异常、控制模块异常、放电链路异常和系统散热异常等问题源头。
浪潮信息秉承"极致存储,智慧有数"的理念,深耕于存储平台底层硬件创新研发,全方位从源头落实智能备电控制策略,充分发挥硬件平台的数据备份处理优势,实现数据存得高效、存得可靠,打造安全可靠、经济高效、易用易管的存储平台。
相关文章