11月3日,据官方消息披露,寒武纪正式发布第三代云端AI芯片思元370。据介绍,思元370基于7nm工艺打造,也是寒武纪首款采用Chiplet(小芯片or芯粒)技术的AI芯片。思元370集成了390亿个晶体管,最大算力高达256TOPS(INT8),是寒武纪第二代产品思元270算力的2倍。
官方表示,凭借寒武纪最新智能芯片架构MLUarch03,相较于峰值算力的提升,思元370实测性能表现更为优秀。
以ResNet-50为例,MLU370-S4加速卡(半高半长)实测性能为同尺寸主流GPU的2倍。MLU370-X4加速卡(全高全长)实测性能与同尺寸主流GPU相当,能效则大幅领先。
值得一提的是,思元370也是国内第一颗支持LPDDR5内存的云端AI芯片,内存带宽是上一代产品的3倍,访存能效达GDDR6的1.5倍。
解码方面,思元370支持132路1080p视频解码或10路8K视频解码。
编码上,全新编码器通过灵活的码率优化(RDO)控制、多参考帧、二次编码等特性组合,在相同图像质量(全高清视频PSNR)的情况下比上一代产品节省42%带宽,有效降低带宽成本。
从云端推理思元270、边缘推理思元220、云端训练思元290,到最新发布的推训一体思元370,寒武纪为用户提供了覆盖不同场景、不同算力规模的全系列产品。此次发布的256TOPS算力的思元370主要面向中高端推训场景,与主要面向训练的512TOPS高端产品思元290形成协同,共同为客户提供全功能、全场景的智能算力。
思元370在2020年三季度流片,相关加速卡产品于2021年二季度陆续送测客户。目前,部分客户已完成测试、导入,产品进入早期销售阶段。
日前寒武纪发布了2021第三季度业绩报告。2021年前三季度,寒武纪营业收入2.22亿元,同比增长41.19%;研发投入合计7.04亿元,同比增加62.62%,研发投入占营业收入的比例为316.72%,同比增加41.74%。
封面图片来源:拍信网