随着在生活、工作中的普及,机器人与人的协调共生、安全共存愈发引起大家的关注。谷歌DeepMind机器人团队2024年1月4日公布了三项新进展,称这些进展将帮助机器人在做出更快、更好、更安全的决策。此次更新引入了AutoRT、SARA-RT和RT-Trajectory三个系统,分别改进了机器人的数据收集、速度和泛化。其中较为引人注目的是,DeepMind起草了“机器人宪法”,并将其引入数据收集系统AutoRT,以确保机器人助理不会伤害到人类。
“机器人宪法”的灵感来自美国科幻小说家艾萨克·阿西莫夫(Isa Asimov)提出的“机器人三定律”,它被描述为一组“以安全为重点的提示”,指示LLM避免选择涉及人类、动物、尖锐物体甚至电器的任务。
机器人宪法
AutoRT是一个数据收集系统,可以使用视觉语言模型(VLM)和大型语言模型(LLM)协同工作,以了解环境、适应陌生环境、并决定适当的任务。
该系统设有安全护栏,其中之一是为其决策者提供“机器人宪法”——一套以安全为重点的提示,以便在为机器人选择任务时遵守。
为了提高安全性,DeepMind对机器人进行了,对其关节处设限,使其在关节的用力超过一定阈值时自动停止,并安装了一个物理终止开关,操作人员可以使用它来关闭机器人。
谷歌表示在过去7个月的时间里,部署了一支由53台AutoRT机器人组成的机群,分别部署在四个不同的办公楼,并进行了超过77000次试验。
一些机器人由人类操作员远程控制,而另一些机器人则根据脚本或完全自主地使用谷歌的学习模型Robocs Transfmer 2(RT-2)进行操作。
试验中使用的机器人只配备了一个摄像头、臂和移动基座。
这份报告中写道,“对于每个机器人,系统使用VLM来了解其环境和视线内的物体。接下来,LLM会提出一系列机器人可以执行的创造性任务,比如‘把零食放在台面上’,并扮演决策者的角色,为机器人选择合适的任务。”
此外,DeepMind的其他新技术包括SARA-RT系统,这是一种架构,旨在使现有的RT-2模型更准确、更快。
SARA-RT-2模型在接收了较短的图像历史后,准确率比RT-2模型高10.6%,速度快14%。
该团队还宣布了RT-Trajectory系统,它增加了2D轮廓,以帮助机器人更好地完成特定的物理任务,比如擦桌子。
审核编辑:黄飞