英伟达发布GPT全新硬件,算力将不再拉智能汽车的后腿

发布时间:2023-03-23  

“AI的iPhone时刻”,在英伟达第14次GTC大会上,创始人黄仁勋3次强调“AI的iPhone时刻已经到来”的论调,苹果的iPhone从诞生,到改变整个手机行业,大概经历了5—8年,而AI技术在2022—2023年的全面爆发,可能会在3-5年间将人类社会的很多既定规则、规律,逐一打破。


上一次GTC大会的主角,一定是英伟达自动驾驶技术,而这一次GTC上提到汽车的只有寥寥几句,比如英伟达已与比亚迪达成合作,将在下一代王朝系列和海洋系列的多款车型中使用英伟达DRIVE Orin高性能计算平台,以及车企已经在使用Omniverse构建自己工厂的数字孪生、为新车型构建、优化和规划组装流水,这些信息其实在上一年的GTC和今年初的CES展上我们已经听过了,并不是新的内容。


而最近AI技术的大爆发,让英伟达的股价较年初低点疯涨了超过80%,这一次的GTC大会,AI是完全的主角。



智能汽车的硬件成本,会被英伟达打下来?


从ChatGPT地让大家开眼,再到GPT-4发布、百度文心一言跟进发布,事情逐渐变得不太对了,而到了微软发布AI助手Microsoft 365 Copilot、Midjourney发布能“画手指”的V5版本,AI行业的真实影响力开始逐渐影响到我们每一个人。自动驾驶的故事最多也就是讲到实现完全自动驾驶,而AI领域的边际其实我们现在还看不到,而智能座舱领域又是AI领域中一个很小的组成部分。



其实无论是自动驾驶还是整体的AI领域,算力问题都是一个最大的瓶颈,车企们在自动驾驶和座舱方面通过多芯片叠加融合的方式,让算力变得更加充裕,但是到了AI领域,算力不够的问题单纯通过堆芯片的方式,并不能解决,大家也会发现,在使用ChatGPT的时候,经常会出现卡顿或者崩溃的问题,甚至有时候直接就打不开了。


尽管微软当时为了训练ChatGPT已经斥资数亿美元,购买了数万块A100芯片,但是单纯的堆算力让整体的开发,以及芯片损耗和电费方面,都要付出极高的成本,所以还需要更高效的手段去解决算力问题。



这一次英伟达发布了专门支持ChatGPT训练的GPU芯片H100 NVL,像A100或者H100这些芯片,大家也会比较熟悉,因为目前国内外训练自动驾驶,互联网服务商的云计算芯片,都用的是这两款芯片,像我们之前提到过的特斯拉超级计算机、小鹏的数据中心。这一次的H100 NVL是H100的改进型,虽说是改进,但是它的升级幅度可以说就是换代产品,它配备双GPU NVLink,将两张拥有94GB HBM3显存的PCIe H100 GPU拼接在一起,基于NVIDIA Hopper 架构的H100配有一个Transformer引擎。



这款全新的芯片也可以叠加使用,一台搭载四对H100和双NVLINK的标准服务器能将ChatGPT的处理速度提升10倍,带来效率的同时可以显著降低成本(耗损和电费)。


除了能训练ChatGPT,还英伟达推出了全新GPU推理平台,包括了L4 Tensor Core GPU、L40 GPU、H100 NVL GPU、Grace Hopper超级芯片四种配置。这四种配置分别用于加速AI视频、图像生成加速、大型语言模型加速(LLM)和推荐系统。



虽然英伟达没有说它们可以训练自动驾驶,但是大家可以来看看它们能够实现的功能,L4 Tensor Core GPU是针对AI视频设计的通用型GPU,它可以提供比CPU高120倍的AI视频性能,能效提高一倍。同时,优化了视频解码与转码、视频内容审核、视频通话等功能,如背景替换、重新打光、眼神交流、转录和实时翻译等。L40 GPU用于图像生成,针对2D、3D图像生成进行了优化,甚至能够融合Omniverse直接生成3D甚至元宇宙内容,其推理性能是英伟达云推理GPU T4的10倍。



使用这些硬件的能力去训练自动驾驶,可能真的是大材小用,在全场景全链条的AI面前,智能汽车所需要处理的数据,确实是有些不够看的了。不过随着硬件性能的不断提升,汽车可能真的不太需要在车辆本身上堆太高的硬件,更强大的后台处理能力,能够极大提升图片和音视频的处理能力,又给了智能汽车新的生命力,特别是随着5G的逐渐上车,基础设施的不断完善,能够极大降低单车上的硬件成本,更多内容交给后台去处理。



车企们甘愿被英伟达完全绑架?


除了硬件之外,英伟达在CES上发布过关于元宇宙以及云服务的内容,这一次GTC大会上,英伟达发布的DGX Cloud人工智能云服务,甚至比那些硬件还要吸引人,DGX Cloud是一项人工智能超级计算服务,它可以让企业快速访问一些能够生成式人工智能和其他开创性应用训练高级模型所需的基础设施和软件。



DGX Cloud所需的基础设施由英伟达与微软Azure、谷歌OCP、Oracle OCI等其他云厂商一起托管,而租用的DGX Cloud起价为单个每月36999 美元,单个实例可由8块A100或H100芯片以及相关软件算法技术组成,这片能够月租的云计算系统,甚至可以让企业们不用买硬件,就可以得到需要的训练效果或者模型成果。


而对于已经自建或者正有自建云计算中心想法的车企们来说,英伟达吹来的这片云的吸引力不可谓不大,成本会大幅降低,而且大家的自动驾驶芯片或者计算平台几乎都来自英伟达,如果再以这种低成本的方式让英伟达也来接管云计算的工作量,那么车企就太轻松了,甚至于车企都不需要在其中去努力什么了,不仅是硬件成本的降低,整体的开发成本可能就是付给英伟达的租金。



不过问题就在于要可能会被卡脖子,因为整个自动驾驶研发的全链条上已经几乎没有车企需要参与的了,去年英伟达被迫向中国断供A100和H100芯片时,就有了不小的风波,有些车企采用囤货的方式度日,也有换芯片供应商的,而到了云计算这方面,上文我们提到了,这片云并非英伟达一家企业搭建的,还有众多其他美国互联网企业,风险会变得更高,可矛盾点也正在这里,自研自建的风险虽然低,但是成本并不是所有车企都能承受得了的。



总结:


前文提到的专为大模型研发的GPU,还有DGX Cloud云服务,都让我们看到了英伟达在AI时代展现出的强大实力,自动驾驶以及和车辆相关的AI技术需求,在这些AI技术和软硬件面前就像小打小闹一样,所以我们才会说让智能汽车变得暗淡,智能汽车只是AI技术要去赋能的很小一部分。


苹果的秋季发布会和特斯拉的AI DAY,会有不少人会去为它们熬大夜,但是在AI技术井喷式发展的今天,英伟达的GTC很有可能会在未来比它们更受关注,“AI的iPhone时刻”已经来到,AI的故事远不止我们现在的目之所及。


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    用于图形渲染。 此前沐曦联合创始人杨建透露,到 2025 年将推出融合了图形渲染的完整 GPU 产品。该公司推出主要用于 AI 推理的 MXN 系列(曦思 N100)也已经量产,单卡算力......
    产品线在中国大陆市场的完整性,尽最大努力排除其他因素的影响,避免可能存在的产品线缺失,以充分满足中国大陆的高端玩家对于高性能游戏显卡的追求。......
    引擎和XMX计算引擎,车载显示能力可以同时支持8个独立的显示屏,支持同时4K分辨率显示。每秒浮点运算能力(FLOPS)相比集成显卡算力提升4倍,功耗为225W。最高可以在本地运行14B以上的模型,或同......
    LOL全国高校实力榜:北大、清华依旧无敌;谁说学霸们只会读书?! 《英雄联盟》官方刚刚公布了最新的全国高校实力排行榜,清华、北大依然遥遥领先其他大学,分别居于排行榜第一、二位。 据官......
    AMD叫板英伟达为何吃力不讨好?国产GPU不能只看算力; 【导读】近日,芯片巨头AMD推出全新AI GPU MI300系列芯片,与英伟达在AI 算力市场展开竞争。AMD首席......
    4060 Ti 规格“传闻”: RTX 4060 Ti 预计将使用阉割版的 AD106-350-A1 GPU 核心。根据之前的传闻,它将包含 34 个 SM 或 4352 个 CUDA 核心,配备......
    中国各大车企智能驾驶能力排名公布;近日,有网友根据各家车企在中国的高速及城市智能驾驶落地情况制作了一张排行榜。目前,这张排行榜计划会双周更新。需要注意,这是民间排行榜,目的是提升信息效率、减少自研排行......
    18,432 个 CUDA 内核,让有足够的自由度为 RTX 5880 Ada 打造芯片。美国的出口限制规定,制造商不能向中国运送总处理能力(TPP)等级高于 4,800 TPP 的显卡。具有 5,828......
    为开放生态系统创造友好的支持和体验。我们只有与生态伙伴、行业用户凝聚在一起,才能将摩尔线程的算力真正发挥出来,为元宇宙和数字经济提供核心动力。” “春晓”芯片及首款国潮游戏显卡MTT S80 保持光速前进的节奏,摩尔......
    CPU+NPU+GPU的异构计算架构,并支持将第三方小芯片集成。 其中,第一代锐炫ARC 760独立显卡,提供每秒浮点运算能力(FLOPS)相比集成显卡算力提升4倍,最高可以在本地运行14B......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>