借助 Tensor Core GPU、LLM和适用于RTX PC 和工作站的工具，NVIDIA为数百万用户带来生成式AI

美国拉斯维加斯—CES—2024年1月8日—NVIDIA发布具有高性能功能的GeForce RTX™ SUPER桌面端，来自OEM合作伙伴的全新AI笔记本电脑，及面向开发者和消费者的全新NVIDIA RTX™加速的AI应用和工具。

数十年来，NVIDIA在PC领域一直处于领军地位，现已有超1亿RTX GPU在推动着AI PC时代的发展，NVIDIA正通过提供工具以提升PC上的生成式 AI体验：NVIDIA TensorRT™加速用于文本生成图像工作流的热门Stable Diffusion XL模型、NVIDIA RTX Remix与生成式AI纹理工具、NVIDIA ACE微服务以及更多使用DLSS 3帧生成技术(Frame Generation)的游戏。

此外，NVIDIA TensorRT-LLM (TRT-LLM) 是一个开源库，可加速和优化最新大语言模型 (LLMs) 的推理性能，现已支持更多面向PC的预优化模型。本月，NVIDIA发布由TRT-LLM加速的Chat with RTX技术Demo，让AI爱好者能与他们的笔记、文档和其他内容进行交互。

NVIDIA创始人兼首席执行官黄仁勋表示："生成式AI是计算史上最重要的平台转变，它将改变包括游戏在内的所有行业。NVIDIA拥有超过1亿台RTX AI PC和工作站的用户基础，为开发者和玩家提供保证，让他们尽享生成式AI的魔力。”

在 PC 上本地运行生成式AI对于隐私、延迟和成本敏感型应用至关重要。但这需要大量AI系统安装基础，以及合适的开发者工具来调优PC平台的AI模型。

为满足这些需求，NVIDIA正通过其整个技术栈提供创新，推动新体验，并在现已支持超过 500 款NVIDIA RTX游戏和应用的AI PC基础上更进一步。

RTX AI PC 和工作站

NVIDIA RTX GPU能以最高性能运行各种应用，充分释放 PC上生成式AI的潜力。RTX GPU 中的Tensor Core可显著加速工作和娱乐应用中要求最严苛的AI功能。

今天在 CES 发布的全新 GeForce RTX 40 SUPER 系列GPU包括 GeForce RTX 4080 SUPER、4070 Ti SUPER 和 4070 SUPER，提供出色的 AI 性能。在AI工作负载方面，GeForce RTX 4080 SUPER 生成视频的速度比 RTX 3080 Ti 快 1.5 倍，生成图像的速度比 RTX 3080 Ti 快 1.7 倍。SUPER GPU 的Tensor Core可提供最高可达 836 AI TOPS，在游戏、创作和日常工作等方面提供革命性的AI性能。

包括宏碁、华硕、戴尔、惠普、联想、微星等合作伙伴发布全新 RTX AI 笔记本电脑，为用户带来开箱即用的生成式 AI体验。与使用NPU相比，RTX AI笔记本电脑的性能可提升 20-60 倍。

配备RTX GPU的移动工作站可运行NVIDIA AI Enterprise软件，包括TensorRT和NVIDIA RAPIDS™，用于简化、安全的生成式AI和数据科学开发。每台NVIDIA A800 40GB Active GPU都包含为期三年的NVIDIA AI Enterprise许可证，为AI和数据科学提供理想的工作站开发平台。

用于构建AI模型的全新 PC 开发者工具

为帮助开发者使用 PC 级的性能和显存快速创建、测试和定制预训练生成式 AI 模型和 LLM，NVIDIA于近期发布统一、易用的工具包NVIDIA AI Workbench。

AI Workbench 将于本月底推出测试版，提供对Hugging Face、GitHub 和 NVIDIA NGC™ 等热门资源库的流畅访问、简化用户界面，使开发者能轻松复制、协作和迁移项目。

项目可扩展到数据中心、公有云或 NVIDIA DGX™ Cloud等任何地方，然后再回到PC 或工作站上的本地 RTX 系统进行推理和轻量定制。

NVIDIA通过与惠普的合作，将 NVIDIA AI Foundation Models and Endpoints(包括RTX加速的AI模型和软件开发工具包)集成到惠普AI Studio中，这是一个集成化的数据科学平台，从而简化AI模型的开发。这将使用户能跨 PC 和云轻松搜索、导入和部署优化后的模型。

为PC使用场景构建AI模型之后，开发者可使用NVIDIA TensorRT 对其进行优化，以充分利用 RTX 的Tensor Core。

最近，NVIDIA通过TensorRT-LLM for Windows将TensorRT扩展到基于文本的应用，TensorRT-LLM for Windows是一个用于加速LLM的开源库。TensorRT-LLM 最新更新现已发布，将Phi-2加入不断增长的 PC 预优化模型列表，与其他backend相比，推理速度提升5倍。

RTX 加速生成式AI为全新 PC 体验提供动力

在CES 2024上，NVIDIA及其开发者合作伙伴发布全新生成式AI驱动的 PC 应用和服务，包括：

● NVIDIA RTX Remix，用于创建令人惊叹的经典游戏 RTX 重制版的平台。测试版将于本月底发布，提供生成式AI工具，可将经典游戏中的基本纹理转化物理精准的4K高精度材质。

● NVIDIA ACE 微服务，包括驱动的语音和动画模型，使开发者能为游戏添加智能、动态的虚拟数字人物。

● TensorRT 加速Stable Diffusion XL (SDXL) Turbo 和LCM，这是两种最热门的Stable Diffusion加速方法。与之前最快的实现相比，TensorRT 将这两种方法的性能提升 60%。Stable Diffusion WebUI TensorRT 扩展的更新版现在也已发布，包括 SDXL、SDXL Turbo、LCM-LoRA加速以及优化的 LoRA支持。

● NVIDIA DLSS 3 支持帧生成技术(Frame Generation)，可利用AI将帧率提高到原生渲染的 4 倍，将用于已发布的 14 款全新 RTX 游戏中的十几款游戏中，包括《地平线：西之绝境》(Horizon Forbidden West)、Pax Dei和《龙之信条 2》(Dragon’s Dogma 2)。

● NVIDIA技术Demo "Chat with RTX"将于本月晚些时候发布，让AI爱好者使用名为 " 检索增强生成retrieval-augmented generation(RAG)"的热门技术，轻松地将PC LLM连接到自己的数据。该Demo由 TensorRT-LLM 加速，使用户快速与自己的笔记、文档和其他内容进行交互。作为开源参考项目，开发者可轻松地在自己的应用中实现相同的功能。