神经运动规划方法可帮助机器人在陌生的环境中克服具有挑战性的障碍
人类几乎无需思考就能从书架上拿起一本书。但对于大脑来说,这是一个复杂的过程,需要规划和绕过障碍物,比如其他书籍或小摆设。机器人研究人员一直在努力复制这种人类运动,让他们的系统执行类似的任务。训练机器人将物体从一个点移动到另一个点而不撞到任何障碍物的过程被称为运动规划,这个过程需要时间和资源,因为机器人无法像人类一样在未知环境中做出动态反应。卡内基梅隆大学机器人研究所 (RI) 的一个团队开发了神经运动规划,以帮助改善机器人在新环境中的反应。这种数据驱动的方法使用单一、多功能的人工智能网络在各种不熟悉的家庭环境中执行运动规划,例如橱柜、洗碗机和冰箱。
“有时,当你部署机器人时,你希望它在非结构化或未知的环境中运行——在这些环境中,你不能假设自己知道一切,”RI 博士生 Murtaza Dalal 说。“这就是这些经典运动规划方法失效的地方。一个大问题是这些算法非常慢,因为它们必须进行数千次甚至数百万次碰撞检查。”
神经运动规划的灵感来自于人类如何积累各种经验来练习并逐渐提高熟练程度。在获得新技能时,人类从缓慢、不确定的行为开始,逐渐发展到快速、动态的动作。神经运动规划使机器人在陌生的环境中更加灵活,并且在移动物体时通常能够适应。
图片来源:卡内基梅隆大学
研究人员模拟了数百万个复杂环境来训练神经运动规划。在这些模拟中,机器人会遇到家庭环境——架子、储物柜、微波炉、洗碗机、打开的盒子和橱柜——有时还必须绕过随机物体,比如小狗或花瓶。这些模型经过训练,可以执行反应性和快速运动规划。这个过程和数据被提炼为通用策略,因此当机器人部署到现实世界中时,它可以在与之前见过的不同环境中执行任务。
“我们已经看到了视觉和语言大规模学习的惊人成功——比如 ChatGPT——但在机器人领域还没有。还没有,”RI 的 Raj Reddy 助理教授 Deepak Pathak 说。“这项工作是朝着这个目标迈出的一步。神经运动规划使用在模拟中进行大规模学习的简单方法在现实世界中产生很大程度的泛化。它适用于具有不同背景、物体、障碍物甚至整个场景布置的场景。”
在实验室中,神经运动规划在机械臂上使用时,成功导航了陌生的环境。机器人系统获得了场景中起点的三维表示,该表示由深度摄像头创建,并显示了目标位置——研究人员希望机械臂最终到达的位置。然后,神经运动规划为机械臂从起点移动到终点提供了关节配置。
“看到一个模型巧妙地避开各种家居障碍物(包括灯、植物、书架和橱柜门),同时移动机械臂完成任务,真是令人兴奋,”RI 硕士生 Jiahui Yang 说道。“这一壮举是通过大规模扩大数据生成实现的,其成功秘诀与机器学习在视觉和语言领域的成功秘诀类似。”
页:
[1]