美国拉斯维加斯—CES—2024年1月8日—NVIDIA发布具有高性能功能的GeForce RTX™ SUPER桌面端,来自OEM合作伙伴的全新AI笔记本电脑,及面向开发者和消费者的全新NVIDIA RTX™加速的AI应用和工具。
数十年来,NVIDIA在PC领域一直处于领军地位,现已有超1亿RTX GPU在推动着AI PC时代的发展,NVIDIA正通过提供工具以提升PC上的生成式 AI体验:NVIDIA TensorRT™加速用于文本生成图像工作流的热门Stable Diffusion XL模型、NVIDIA RTX Remix与生成式AI纹理工具、NVIDIA ACE微服务以及更多使用DLSS 3帧生成技术(Frame Generation)的游戏。
此外,NVIDIA TensorRT-LLM (TRT-LLM) 是一个开源库,可加速和优化最新大语言模型 (LLMs) 的推理性能,现已支持更多面向PC的预优化模型。本月,NVIDIA发布由TRT-LLM加速的Chat with RTX技术Demo,让AI爱好者能与他们的笔记、文档和其他内容进行交互。
NVIDIA创始人兼首席执行官黄仁勋表示:"生成式AI是计算史上最重要的平台转变,它将改变包括游戏在内的所有行业。NVIDIA拥有超过1亿台RTX AI PC和工作站的用户基础,为开发者和玩家提供保证,让他们尽享生成式AI的魔力。”
在 PC 上本地运行生成式AI对于隐私、延迟和成本敏感型应用至关重要。但这需要大量AI系统安装基础,以及合适的开发者工具来调优PC平台的AI模型。
为满足这些需求,NVIDIA正通过其整个技术栈提供创新,推动新体验,并在现已支持超过 500 款NVIDIA RTX游戏和应用的AI PC基础上更进一步。
RTX AI PC 和工作站
NVIDIA RTX GPU能以最高性能运行各种应用,充分释放 PC上生成式AI的潜力。RTX GPU 中的Tensor Core可显著加速工作和娱乐应用中要求最严苛的AI功能。
今天在 CES 发布的全新 GeForce RTX 40 SUPER 系列GPU包括 GeForce RTX 4080 SUPER、4070 Ti SUPER 和 4070 SUPER,提供出色的 AI 性能。在AI工作负载方面,GeForce RTX 4080 SUPER 生成视频的速度比 RTX 3080 Ti 快 1.5 倍,生成图像的速度比 RTX 3080 Ti 快 1.7 倍。SUPER GPU 的Tensor Core可提供最高可达 836 AI TOPS,在游戏、创作和日常工作等方面提供革命性的AI性能。
包括宏碁、华硕、戴尔、惠普、联想、微星等合作伙伴发布全新 RTX AI 笔记本电脑,为用户带来开箱即用的生成式 AI体验。与使用NPU相比,RTX AI笔记本电脑的性能可提升 20-60 倍。
配备RTX GPU的移动工作站可运行NVIDIA AI Enterprise软件,包括TensorRT和NVIDIA RAPIDS™,用于简化、安全的生成式AI和数据科学开发。每台NVIDIA A800 40GB Active GPU都包含为期三年的NVIDIA AI Enterprise许可证,为AI和数据科学提供理想的工作站开发平台。
用于构建AI模型的全新 PC 开发者工具
为帮助开发者使用 PC 级的性能和显存快速创建、测试和定制预训练生成式 AI 模型和 LLM,NVIDIA于近期发布统一、易用的工具包NVIDIA AI Workbench。
AI Workbench 将于本月底推出测试版,提供对Hugging Face、GitHub 和 NVIDIA NGC™ 等热门资源库的流畅访问、简化用户界面,使开发者能轻松复制、协作和迁移项目。
项目可扩展到数据中心、公有云或 NVIDIA DGX™ Cloud等任何地方,然后再回到PC 或工作站上的本地 RTX 系统进行推理和轻量定制。
NVIDIA通过与惠普的合作,将 NVIDIA AI Foundation Models and Endpoints(包括RTX加速的AI模型和软件开发工具包)集成到惠普AI Studio中,这是一个集成化的数据科学平台,从而简化AI模型的开发。这将使用户能跨 PC 和云轻松搜索、导入和部署优化后的模型。
为PC使用场景构建AI模型之后,开发者可使用NVIDIA TensorRT 对其进行优化,以充分利用 RTX 的Tensor Core。
最近,NVIDIA通过TensorRT-LLM for Windows将TensorRT扩展到基于文本的应用,TensorRT-LLM for Windows是一个用于加速LLM的开源库。TensorRT-LLM 最新更新现已发布,将Phi-2加入不断增长的 PC 预优化模型列表,与其他backend相比,推理速度提升5倍。
RTX 加速生成式AI为全新 PC 体验提供动力
在CES 2024上,NVIDIA及其开发者合作伙伴发布全新生成式AI驱动的 PC 应用和服务,包括:
● NVIDIA RTX Remix,用于创建令人惊叹的经典游戏 RTX 重制版的平台。测试版将于本月底发布,提供生成式AI工具,可将经典游戏中的基本纹理转化物理精准的4K高精度材质。
● NVIDIA ACE 微服务,包括驱动的语音和动画模型,使开发者能为游戏添加智能、动态的虚拟数字人物。
● TensorRT 加速Stable Diffusion XL (SDXL) Turbo 和LCM,这是两种最热门的Stable Diffusion加速方法。与之前最快的实现相比,TensorRT 将这两种方法的性能提升 60%。Stable Diffusion WebUI TensorRT 扩展的更新版现在也已发布,包括 SDXL、SDXL Turbo、LCM-LoRA加速以及优化的 LoRA支持。
● NVIDIA DLSS 3 支持帧生成技术(Frame Generation),可利用AI将帧率提高到原生渲染的 4 倍,将用于已发布的 14 款全新 RTX 游戏中的十几款游戏中,包括《地平线:西之绝境》(Horizon Forbidden West)、Pax Dei和《龙之信条 2》(Dragon’s Dogma 2)。
● NVIDIA技术Demo "Chat with RTX"将于本月晚些时候发布,让AI爱好者使用名为 " 检索增强生成retrieval-augmented generation(RAG)"的热门技术,轻松地将PC LLM连接到自己的数据。该Demo由 TensorRT-LLM 加速,使用户快速与自己的笔记、文档和其他内容进行交互。作为开源参考项目,开发者可轻松地在自己的应用中实现相同的功能。
相关文章