如何让机器人更加“真人化”？英伟达在GTC上发布全新生成式AI和具身智能技术

发布时间: 2024-03-19

来源: 21IC

国际联合会 (IFR)预测了2024年在机器人上将会发生的五大趋势，其中包括AI化、协作机器人的普及、移动机械手（MoMas）在制造业中普及、数字孪生以及人形机器人发展。而将这五条总结起来看，即我们将会在2024年看到更多的更加智能化和人性化的机器人的进展，并且协作机器人将会进一步走入各行各业之中。

而令人期待的展望背后，离不开来自芯片、应用和制造商各方的创新和努力。全球的机器人技术先锋们正聚焦力量，集结多元的技术力量，旨在人工智能通用机器人领域取得革命性的进展。技术巨擘NVIDIA正在打造一个全面的机器人开发平台：这一平台专为领先的人形机器人企业而设计，旨在支撑不断进化的机器人生态。他们坚信，现代 AI 技术的快速发展将为机器人铺设前行之路，助其在人类日常生活的方方面面发挥关键作用；同时，包括GenAI和具身智能的未来技术不仅能帮助人类应对人口下降、气候变化、疾病等重大挑战，还能激发出目前我们所无法企及或想象的创新成就。

在今天的GTC 2024大会上，发布了关于机器人的诸多技术和平台更新，包括首个人形机器人基础模型Project GR00T、新型人形机器人计算机Jetson Thor以及来自Isaac机器人平台的诸多新特性新功能更新。通过一系列的新技术加持，我们可以预见到机器人未来将会变得更加“真人化”，不仅具备人的外形，而是具备类人的思考和反应能力，能够与人一起在同一环境中协作创新。

首个人形机器人基础模型Project GR00T，让机器人更加像真人

Project GR00T是英伟达发布的首个人形机器人通用基础模型，旨在进一步推动其在机器人和具身智能方面的突破。

对于Project GR00T而言，不仅要具备“人形”，更要具备“人性”。而在“人性”方面的打造，离不开具身智能的技术加持。

具身智能（Embodied Intelligence)是指机器人或其他人工智能系统通过与真实世界的物理交互来学习和适应环境的能力。这种类型的智能强调了机器人的身体和环境之间的交互对于智能行为的重要性。具身智能的理念认为，智能不仅仅是计算或数据处理的结果，而是通过感知环境、在环境中移动、与环境互动并从这些互动中学习而形成的。

在具身智能中，机器人的身体不仅是行动的工具，也是感知和认识世界的媒介。这意味着AI系统通过其传感器接收外部信息，并通过其执行器（例如，机械臂、轮子、其他移动装置等）在物理世界中采取行动。通过这种方式，AI能够更好地理解和适应其所处的环境，从而执行复杂的任务，如导航、操纵物体或与人类自然交流。

具身智能领域的研究可以应用于多个领域，包括机器人学、虚拟现实、增强现实和游戏设计等。通过具身智能，有望可以创造出能够更自然、更有效与人类和环境互动的智能机器人。

而英伟达通过其强大的GPU硬件技术和AI平台，为开发具身智能提供了强大的计算能力和高效工具。软件方面，此前发布的Isaac SDK就使开发者能够为机器人提供高级感知、导航和操作能力，促进机器人在真实世界中的自主学习和互动。硬件解决方案方面，Jetson平台支持高性能的深度学习、计算机视觉和多模态传感器处理，使得具身智能应用成为可能。在AI驱动工具方面，英伟达的SimNet可以帮助工程师创建精确的仿真环境，用于测试和训练具身智能系统，而无需频繁地进行物理测试。

最新发布的GR00T技术驱动机器人具备了解自然语言的能力，并能够通过观察人类的行为来学习模仿动作——这使它们能够迅速掌握协调性、灵活性以及其他关键技能，从而顺利地在真实世界中导航、适应并进行交互。在NVIDIA的GTC大会上，创始人及CEO黄仁勋通过主题演讲，展示了这些机器人如何巧妙地执行了一系列复杂任务。

这种前沿技术赋予机器人的能力，使其行为更加贴近人类。自然语言理解的进步让机器人能够与人类进行更加流畅、直观的沟通，不仅能解析语言的字面意义，还能捕捉到语调和上下文中的隐含情感。其次，观察并模仿人类动作的能力让机器人在社交互动中显得更自然，它们能通过观察人类的肢体语言和反应，学习到如何在特定情境下做出相应的反应或表达，从而在社交互动中展现出更加人性化的行为模式。

此外，快速学习协调性和灵活性等技能，让机器人能够适应各种复杂的环境和任务。这不仅限于物理动作的模仿，还包括解决问题的能力和在不同情境下做出适应性调整的能力，使得机器人能够更好地理解并应对现实世界的多样性和不确定性。

通过这些技术的融合与应用，机器人不再是单一功能的自动化工具，而是成为了能够理解和响应人类情感、社交需求，并能在复杂环境中独立操作的伙伴。这种技术的发展，正推动着机器人从工业和服务的辅助角色，向更加深入的人类生活领域拓展，预示着未来机器人将在人类社会中扮演更加复杂且亲密的角色。

新型机器人计算机Jetson Thor，加速人形机器人的开发

此次发布的有关机器人的另一个重要解决方案是Jetson Thor，它代表着一种革命性的人形机器人计算平台，它不仅能够处理高度复杂的任务，还能以安全和自然的方式与人类及其他机器进行交互。这一平台以其模块化的设计而闻名，该设计精心考虑了性能、能耗以及体积的最优平衡，旨在满足未来计算需求的同时，保持极致的效率和灵活性。

核心部分是一个集成了Transformer engine的下一代GPU，基于NVIDIA最先进的Blackwell架构。这款GPU能够提供令人震惊的每秒最多800万亿次的8位浮点运算能力，使其成为运行如GR00T这类多模态生成式AI模型的理想选择。这种强大的AI性能使Jetson Thor能够无缝执行语言理解、图像识别和模式生成等任务，为机器人、自动化系统和智能设备提供前所未有的智能水平。

此外，Jetson Thor平台还集成了功能安全处理器，这是确保系统在执行关键任务时的可靠性和安全性的关键。高性能CPU集群进一步强化了其处理能力，使得复杂的算法和模型能够高效运行。而100GB的以太网带宽保证了数据传输的极致速度和低延迟，这对于实时数据处理和远程操作尤为关键。

这种集成高度先进技术的设计，大大简化了系统的设计和集成工作，为开发人员提供了前所未有的灵活性和易用性。开发人员现在能够更加专注于创新，而不是花费大量时间解决集成和兼容性问题。Jetson Thor开启了一个全新的可能性领域，为机器学习、自动化和智能交互设定了新的标准，预示着我们步入了一个更加智能、更加互联的未来。

Isaac机器人平台大更新，助力客户探索机器人未来潜力

在2018年的GTC大会上，英伟达首次发布了Isaac平台。这一平台旨在为机器人开发人员提供一套综合工具，以便他们能够创建、模拟和部署适用于各种机器人应用的AI模型。Isaac围绕着提升机器人的感知、导航和操控能力而构建，特别强调了机器人视觉和AI驱动的自主功能。经过了多年的迭代升级，当前Isaac为研究人员、开发人员和企业提供了强大的工具集，帮助他们探索和实现机器人技术的未来潜力。

而在今年的GTC大会上，英伟达同样也带来了在Isaac上的一系列新特性和新功能。首先最值得关注的是能够支持最新的GR00T模型的、用于其强化学习的Isaac Lab和用于计算编排服务的OSMO。

新推出的Isaac Lab是一个基于Isaac Sim开发的GPU加速、性能优化的轻量级应用，旨在支持成千上万个机器人学习所需的并行仿真。而为了适应分布式计算环境中的机器人开发工作负载，新推出的OSMO则负责在分布式环境中协调数据生成、模型训练以及软硬件集成的工作流。

除以上两大新增功能外，NVIDIA还推出了一系列预训练的机器人模型、库和参考硬件，包括Isaac Manipulator和Isaac Perceptor。

Isaac Manipulator为机械臂提供了卓越的灵活性和AI功能，配备了一系列的基础模型和GPU加速库。它能够实现高达80倍的路径规划加速，通过零样本感知大幅提高效率和吞吐量，使开发者能够自动化更多新的机器人任务。早期的生态系统合作伙伴包括Franka Robotics、PickNik Robotics、READY Robotics、Solomon、泰瑞达子公司TERRA和安川电机。

而新的Isaac Perceptor则为制造业和物流业中的自主移动机器人提供了多摄像头和3D环绕视觉功能，旨在提高效率、更好地保护工人安全，同时降低错误率和成本。ArcBest、比亚迪和凯傲集团等公司是这些先进视觉AI功能的早期行业合作伙伴，为物料搬运等操作引入了新的自主化水平。

结语

机器人技术的进步对于解决全球面临的各种挑战，如老龄化社会、医疗保健需求增加、生产效率提升等，具有重要意义。我们希望未来的机器人，不仅具备人形，更重要的是具备“人性”，更加的像一个真正的人：能够理解人的自然语言，读懂人的微表情，恰当地和人进行互动协作。而这种能够进行自主学习和决策的系统，背后需要的是高性能计算（HPC）和深度学习的支持。通过强大的GPU技术和AI算法、平台的支持，正在帮助我们迈向未来人机共创的新时代。