触摸未来:利用新算法让机器人掌握身体接触
宾夕法尼亚大学工程师开发出一种新算法,使机器人能够实时对复杂的物理接触做出反应,从而使自主机器人能够完成以前不可能完成的任务,例如控制滑动物体的运动。该算法被称为共识互补控制 (C3),可能成为未来机器人的重要组成部分,将大型语言模型或 LLM 等人工智能工具输出的指令转化为适当的行动。
“你的大型语言模型可能会说,‘去切洋葱’,”机械工程与应用力学 (MEAM) 助理教授、通用机器人、自动化、传感和感知 (GRASP) 实验室核心教员 Michael Posa 说道。“你如何移动手臂来将洋葱固定在适当位置、握住刀子、以正确的方式切开它、在必要时重新调整方向?”
机器人技术面临的最大挑战之一是控制,这是一个统称,指的是机器人执行器的智能使用,执行器是机器人移动或控制其肢体的部件,如电机或液压系统。控制机器人与周围环境的物理接触既困难又重要。
波萨说:“这种低级和中级推理对于物理世界中任何事物的运作都是至关重要的。”
自 20 世纪 80 年代以来,人工智能专家已经认识到,矛盾的是,人类学习的第一项技能——如何操纵物体并从一个地方移动到另一个地方,即使面临障碍——却是最难教给机器人的,反之亦然。
“机器人在开始接触物体之前表现得非常好,”波萨说。“目前的人工智能机器可以解决国际数学奥林匹克级别的数学问题,并在国际象棋比赛中击败专家。但它们的身体能力最多相当于 2 或 3 岁的孩子。”
本质上,这意味着机器人的每一次互动,包括触摸某物(拿起一个物体,将其移动到其他地方),都必须经过精心设计。“关键挑战是接触顺序,”Posa 动态自主和智能机器人 (DAIR) 实验室的应届博士毕业生 William Yang 说。“你把手放在环境中的什么位置?你把脚放在环境中的什么位置?”
当然,人类很少需要仔细考虑如何与物体互动。机器人面临的挑战部分在于,像拿起杯子这样简单的事情实际上涉及许多不同的选择——从正确的接近角度到适当的力量。
波萨指出:“并不是每一个选择都与周围的选择有太大的不同。”但到目前为止,还没有一种算法可以让机器人评估所有这些选择并实时做出适当的决定。
为了解决这个问题,研究人员设计了一种方法,帮助机器人“想象”与物体接触时可能出现的不同可能性。“通过想象触摸物体的好处,你就可以在算法中获得与这种互动相对应的梯度,”波萨说。
“然后你可以应用某种基于梯度的算法,在解决这个问题的过程中,随着时间的推移,物理学逐渐变得越来越精确,你不仅仅是想象‘如果我触摸它会怎样?’但你实际上打算出去触摸它。”
在过去的一年里,Posa 和 DAIR 实验室就该主题撰写了一系列获奖论文,最近一篇发布在arXiv预印本服务器上的论文由杨担任主要作者,并获得了2024 年荷兰机器人:科学与系统会议的杰出学生论文奖。
该论文展示了 C3 如何使机器人能够实时控制滑动物体。杨说:“众所周知,滑动在机器人技术中很难控制。从数学上讲,这很难,但你也必须依靠物体反馈。”
但是,使用 C3,杨展示了机械臂如何安全地操纵托盘,类似于餐厅服务员使用的托盘。在录像实验中,杨让机械臂拿起托盘并将其放下,有或没有咖啡杯,并将托盘靠在墙上旋转。“以前的工作认为,‘我们只是想避免滑动’,”杨说,“但算法将滑动作为机器人考虑的一种可能性。”
未来,波萨和他的团队希望使算法对不同情况更加稳健,例如当机器人处理的物体重量略高于或低于预期时,并将项目扩展到 C3 目前无法处理的更多开放式场景。
“这是一个构建模块,可以从一个非常简单的规范开始 - 让这个部件到那边 - 然后将其提炼为机器人实现该目标所需的电机扭矩,”波萨说。“从一个非常、非常复杂、混乱的世界到对任何给定任务都很重要的关键对象集、特征或动态属性,这是我们感兴趣的悬而未决的问题。”
页:
[1]