这是英伟达CEO黄仁勋在11月21日苏州举办的GTC China玩了好几次的“梗”,来表达使用NVIDIA RTX光线追踪技术让游戏画面更自然逼真,如果没有这个技术(黄仁勋口中的“me”),那游戏画面将会显得没有质感。(其中提到的游戏为《易水寒》,也是中国首款RTX游戏。)
with me(左)without me(右)
黄仁勋不得不用游戏开场,因为这是英伟达家里的矿山。从最新的第三季度财报来看,游戏业务占其第三季度收入比重超过55%。游戏业务当季收入为17.6亿美元,环比下降2.3%,同比增长13%。增速已经没先前那么迅猛,但这并不影响英伟达是个会玩游戏的公司。
“云游戏”、“掌机Shield”这些都跟英伟达有关系。这些足以说明在游戏领域英伟达是个野心勃勃的公司,但延迟问题让云游戏竞争力非常弱。在媒体问答环节,英伟达依旧认定这是一个好生意:“未来所有的东西都要上云,但时间上至少要再等上两年,英伟达会解决诸如延迟的问题,也希望和中国更多云游戏公司合作。”
黄仁勋的兴奋不只因为看到《易水寒》完美特效的表现,更是其中采用的核心相关技术:Turing(图灵)构架、Tensor Core(张量计算核心)和DLSS(超级采样)。
“with me”特效炸裂
“without me”平平无奇
“with me”核心技术酷翻天
“without me”游戏世界该怎么进步?
黄仁勋来回重复着这几个单词,让大屏幕上的特效在开与关之间来回切换,如一场魔术秀。
其中,Turing是前几个月英伟达刚刚发布的第八代GPU构架,当时黄仁勋称之为“原力”。Turing通过光线追踪与AI重塑图形技术,而光线追踪技术可模拟光线的物理行为,并取代传统光栅化所使用的粗糙近似值。
Turing Tensor Core支持深度学习超级采用(DLSS),并且Turing能够使用革新的深度学习方法生成图像,使用传统方法渲染分辨率较低的图片。
Turing DLSS由两个模型组成,一个模型经训练后可根据原始图像生成超高画质图像,两一个经训练后可实现超分辨率并以此作为最终分辨率。此方法可利用强大的Tensor Core同时实现高画质和高帧率。
有了DLSS,英伟达的RTX GPU产品性能得到了大幅提升。而且可以让499美元的RTX 2070运行速度甚至比699美元的Pascal 1080Ti 更快。
除了游戏,基于Turing架构的GPU为五千万电影渲染或为保时捷原型的新产品建模的专业人士打造,除了带来了实时的逼真场景渲染,也为其工作流程增添AI能力,使其能够与复杂的模型和场景进行流畅的互动,从而彻底变革以往的工作流程。
加速、加速,还是加速
黄仁勋很乐意一次次的说“摩尔定律已经终结”这句话,就像英特尔经常在公开场合说“摩尔定律并未死去,只是以新的方式驱动和存在。”
不管怎么说,性能和成本才是核心竞争力。黄仁勋表示:“NVIDIA开创了加速计算,其可利用专门设计的处理堆栈加速需进行大量处理的工作负载。NVIDIA已在10年内为众多关键应用程序加速了1000倍。”
“加速计算需要全栈专业知识,其中涵盖构架、芯片设计、系统、算法以及应用程序优化等所有方面。”黄仁勋这句话颇有深意,显然是为了自夸,因为接下来介绍的产品全部涉及。
首先,黄仁勋直接抱上来了颇有分量的HGX-2。
老黄一面调侃“还是蛮重的,感觉自己老了。”一面说了实在话“不便宜。数据、人工智能科学家现在是薪资最高的工程师,他们工作非常有价值,而这就是他们的生产力工具。”
据悉,HGX-2连接8个V100 GPU,总共1 PFLOPS。每个GPU以300 GB/s的速度与其他GPU通信,可以实现8TB/s的速度访问所有256GB的显存。
黄仁勋表示:“计算机产业领导者广泛采用HGX-2,能够极大提升了人工智能研究人员、数据科学家和软件开发人员的工作效率,将迭代次数从几天减少到几小时。”据悉,目前华为、浪潮、联系、QCT、曙光、Supermicro正在制造HGX-2计算机,百度和腾讯将提供基于HGX-2的云计算服务。
此外,对于大规模计算集群,NVIDIA创建了T4,适用于对延迟有要求的工作。与P4相比,T4在训练和推理方面都很出色。
据TechSugar记者现场了解,搜索、社交媒体和在线购物网站等互联网公司是 T4 的早期使用者,也是最大的终端客户群。中国首批开始使用 T4 扩展并提升工作负载横向扩展的企业包括百度、腾讯、京东以及科大讯飞。中国领先的计算机制造商也将推出一系列基于 T4 的服务器,包括浪潮、联想、华为、曙光、浪潮商用机器和新华三等。前不久,谷歌刚刚宣布是第一家提供英伟达T4 GPU接入服务的云运营商。
老黄现场还用例子现场虐了一把CPU,这个底气似乎来自三季度财报中,数据中心业务同比增长58.1%的增速。据悉,本季度全球500强超级计算机中有127个使用了英伟达的GPU,同比增长48%,显示了英伟达在这一领域的强劲上升。
然而AMD也发布了面向数据中心的7纳米GPU,可用于机器学习训练和推理,可谓与英伟达形成了正面竞争的态势。但在英伟达眼里,AMD的表现似乎并不能引起他们的注意,NVIDIA全球市场运营执行副总裁Jay Puri对TechSugar等媒体表示:“在芯片方面,AMD 7nm性能是令人失望的,不及我们V100的四分之一,在功耗方面,我们的T4只有它的四分之一,而且现在人工智能已经不仅是芯片问题,是全软件堆栈的竞争,显然我们已经领先了。”
此外黄仁勋现场还秀了针对数据科学和机器学习的GPU加速平台RAPIDS;部署NGC容器注册中的软件 NGC-Ready 系统。
其中RAPSID加速了数据提取,数据抽取加载转换处理和机器学习。研究人员通过RAPSID,端到端的模型训练可以从小时缩短到分钟。
NVIDIA 在上周发布了NGC-Ready计划,让采用基于NVIDIA GPU的强大系统的客户能够在更广的范围内放心地部署 GPU 加速软件。此外, 搭载NVIDIA Quadro GPU的 NGC-Ready 工作站将为研究人员提供一个平台,为其提供快速构建、训练及开发深度学习项目所需的性能和灵活性。
大秀无人驾驶“肌肉”
XAVIER是第一个专为处理机器人计算业务而设计的芯片,其功能强大,可以处理高速率传感器,复杂传感器,AI和控制算法的传感器。
黄仁勋表示:“未来一切都是人工智能主导的,我们要让机器与我们一起共享世界,协助我们完成工作,我们需要新处理器,所以我们创造了XAVIER。”
这款芯片似乎凝聚了难以想象的智慧,NVIDIA自主机器全球副总裁 Rob Csongor 表示:“我们自动驾驶计算机处理系统已经达到第四代,Xavier是世界上最为复杂的一款处理器,上面包含90亿晶体管,我们研发累计投入达到20亿美元,它基本囊括了我们过去在无人驾驶上的所有经验。”
NVIDIA DRIVE AGX Xavier 计算系统已经有一批“信徒”:小鹏汽车、奇点汽车和SFMotors。新能源汽车公司计划在DRIVE AGX、DRIVE OS、DriveWorks上构建自己的AV软件。当然NVIDIA DRIVE AGX Xavier不仅吸引了车企,还有移动出行服务商。比如有初创企业使用GPU开发L4机器人出租车解决方案,也有企业开发AI自动货物配送车辆和送餐服务。
自动驾驶的话题将“黄教主”的演讲推向高潮,整个会议也在充满趣味的视频中(如下)结束。
全场2个多小时会议,一直萦绕在笔者耳边的仍是那句“With me, without me。”这显然不是黄仁勋简单的一句打趣,当初有句广告叫“假如世界没有联想,将会怎样?”经过岁月蹉跎,我们得出的答案是:“没有联想,该怎样还是怎样。”但如果世界没有黄仁勋,会怎样?
相关文章