谷歌迅速成为Nvidia强大的竞争对手

发布时间:

来源: 电子产品世界

迅速成为Nvidia强大的竞争对手 —— 驱动其超级计算机的TPU v5p人工智能芯片比以往任何时候都更快，具有更大的内存和带宽，甚至胜过强大的H100

本文引用地址：

伴随其Gemini人工智能模型的最新推出，发布了用于人工智能训练和推理的旗舰张量处理单元（TPU）的最新版本，这似乎是试图挑战Nvidia市场领先的GPU。

TPU v5p —— 最强大的定制设计人工智能加速器 —— 已经部署以驱动该公司的“超级计算机”。这是一个专门用于运行人工智能应用的超级计算机架构，而不是通常用于运行科学工作负载的超级计算机，因为TPU不适用于这种工作负载。

其TPU的最新版本每个架构（组成系统的一部分）有8960个芯片，而v4中有4096个，其总浮点运算数（FLOPs）每个架构的可用性方面具有四倍的可伸缩性。这些新的架构提供4800Gbps的吞吐量。新的架构还配备了95GB的高带宽内存（HBM），而TPU v4中的HBM RAM为32GB。

Nvidia H100 vs 谷歌 TPU v5p：哪个更快？与Nvidia将其GPU提供给其他公司购买不同，谷歌的定制TPU仍然在内部使用，用于其自己的产品和服务。谷歌的TPU长期以来一直用于推动其服务，包括Gmail、YouTube和Android，而最新版本也用于训练Gemini。

谷歌的v5p TPU比TPU v4在训练大型语言模型方面快2.8倍，性价比提高了2.1倍。尽管今年早些时候发布的中间版本TPU v5e在所有三者中提供了最高性价比，但它只比TPU v4快1.9倍，使TPU v5p成为最强大的版本。

它甚至足够强大，可以与Nvidia广受欢迎的H100 GPU媲美，后者是最适用于工作负载的最佳显卡之一。根据该公司自己的数据，该组件在训练工作负载方面比Nvidia的A100 GPU快四倍。

与此同时，谷歌的TPU v4据估计比A100快1.2到1.7倍，根据其在四月份发布的研究。因此，极其粗略的计算表明，TPU v5p相对于A100大约快3.4到4.8倍，使其与H100相当或更强大，尽管在得出任何结论之前需要更详细的基准测试。

文章来源于: 电子产品世界原文链接

本站所有转载文章系出于传递更多信息之目的，且明确注明来源，不希望被转载的媒体或个人可与我们联系，我们将立即进行删除处理。