国际电子商情20日讯 号称今年全球头号人工智能(AI)领域开发者大会的英伟达2024 GTC AI大会于美东时间3月18日周一拉开帷幕。今年是英伟达时隔五年首次让年度GTC重回线下,也是此前分析认为英伟达要“拿出点真家伙”的AI盛会。
会上,英伟达正式推出名为Blackwell的新一代AI图形处理器(GPU),Blackwell平台能够在万亿参数级的大型语言模型(LLM)上构建和运行实时生成式AI,而成本和能耗比前身低25倍。
这是继2022年3月发布的Hopper架构数据中心GPU之后,英伟达的最新一代旗舰产品,有望取代被“爆抢”的H100的市场地位。在命名序号上,最新亮相的产品直接跳过了100的序列,而是直接以“B200”命名。
英伟达称,Blackwell拥有六项革命性的技术:
- 全球最强大的芯片:Blackwell架构GPU由2080亿个晶体管组成,采用量身定制的台积电4纳米工艺制造,两个reticle极限GPU裸片将10 TB/秒的芯片到芯片链路连接成单个统一的GPU。
- 第二代Transformer引擎:结合了Blackwell Tensor Core技术和TensorRT-LLM和NeMo Megatron框架中的英伟达先进动态范围管理算法,Blackwell将通过新的4位浮点AI支持双倍的计算和模型大小推理能力。
- 第五代NVLink:为提高数万亿参数和混合专家AI模型的性能,最新一代英伟达NVLink为每个GPU提供了突破性的1.8TB/s双向吞吐量,确保最复杂LLM之间多达576个GPU之间的无缝高速通信。
- RAS引擎:Blackwell支持的GPU包含一个专用引擎,实现可靠性、可用性和服务性。此外,Blackwell架构还增加了芯片级功能,利用基于AI的预防性维护进行诊断和预测可靠性问题。这可以最大限度地延长系统正常运行时间,并提高大部署规模AI的弹性,使其能连续运行数周甚至数月,并降低运营成本。
- 安全人工智能:先进的机密计算功能可在不影响性能的情况下保护AI模型和客户数据,并支持新的本机接口加密协议,这对于医疗保健和金融服务等隐私敏感行业至关重要。
- 解压缩引擎:专用解压缩引擎支持最新格式,加快数据库查询,提供数据分析和数据科学的最高性能。未来几年,在企业每年花费数百亿美元的数据处理方面,将越来越多地由GPU加速。
售价方面,黄仁勋表示,B200的售价可能在3万到4万美元之间。这个定价低于一些分析师的预期,他希望新芯片的定价能吸引尽可能多的客户。
不过他后来又补充说,英伟达将把其新芯片纳入更大的计算系统中,价格将根据它们提供的价值而变化。
此外,他预计B200将于今年晚些时候发货。黄仁勋说,英伟达正在与台积电合作,以避免芯片封装瓶颈,正是因封装瓶颈致使其上一代旗舰AI处理器的出货速度放缓。
文章来源于:国际电子商情 原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。