最近,IBM透露了其全球首个四核的发展AI加速器采用7nm MOSFET技术。IBM开发的新芯片使用超低精度混合8位浮点算术单元在训练过程中使用,在推理(即执行AI)过程中使用4位。
在典型的计算系统中,增加位宽可以提高计算能力并访问更多内存。但是,AI通常容忍低精度,并且系统的位宽越大,所需的内存就越多。因此,人工智能系统的开发人员经常尝试尽可能地减少位宽,而IBM的新型四核AI加速器将推理精度降低到了4位。
最终的四核AI加速器实现了80%以上的利用率在训练期间(即正在使用多少处理器),以及在推理期间超过60%,明显优于通常低于30%的GPU性能。此外,IBM还集成了独特的电源管理系统,该系统通过在执行大量计算任务时降低时钟频率来降低加速器的功耗。
在传统处理器上运行AI任务非常耗电,对内存的要求很高,并且整体效率极低。然而,事实证明,在受影响的行业所有领域中,日常应用中的AI应用都具有不可思议的优势。
尽管固定计算系统可以继续负担在高性能CPU和GPU上运行AI算法的费用,但嵌入式世界通常不得不依靠基于云的计算来执行AI算法。 这种远程计算的结果使人们越来越关注隐私,对互联网基础架构的额外压力以及请求和响应之间的长时间延迟。
诸如IBM开发的AI加速器,不仅允许嵌入式应用程序在本地运行AI,而且能够高效地运行。此外,在本地运行AI通过将潜在的敏感信息保留在设备本地来改善对隐私的关注,并减少延迟。AI加速器的使用还将导致低功率设备中的实时AI响应,这是当前无法实现的。
相关文章