Josiah02 发表于 2024-11-6 21:37:25

水上机器人的自学习优化增强了水下物体操纵技能

近年来,机器人专家推出了可以在各种环境中完成任务的机器人系统,从地面到地下、地上和水下。虽然其中一些机器人可以在地面上抓取和移动物体,但迄今为止,水下机器人系统对物体的处理更具挑战性。
哥伦比亚大学的研究人员最近开发了 AquaBot,这是一种新型水下机器人,可以在水下自主完成基本的物体操作任务。该机器人在arXiv预印本服务器上发表的一篇论文中进行了介绍,它将可访问的硬件与根据从人类演示中提取的数据进行训练的计算模型相结合。
“由于复杂的流体动力学和非结构化环境,水下机器人操作面临巨大挑战,导致大多数操作系统严重依赖人类远程操作,”Ruoshi Liu、Huy Ha 及其同事在论文中写道。“我们推出了 AquaBot,这是一种完全自主的操作系统,它将人类演示中的行为克隆与自学优化相结合,以提高超越人类远程操作的性能。”
Aquabot 是由刘、哈和他们的同事设计的机器人,基于 QYSEA V-EVO 水下无人机。研究人员为这款水下无人机添加了 QYSEA 平行钳口夹持器和两个摄像头,这样它就可以在水下收集相关图像并完成物体操控任务。
他们还编写了代码,使机器人能够自主学习端到端视觉运动策略,指导其在水下操纵物体。规划和控制机器人动作的计算模型分两个不同阶段进行训练。
“在第一阶段,我们将人类的适应性提炼为闭环视觉运动策略,”研究人员写道。“为此,我们记录了人类遥控机器人执行各种操作任务的演示,然后使用数据来训练视觉运动策略。通过缩短策略的行动范围,我们有效地提高了其反应能力,这对于处理意外的水下动态至关重要。”
AquaBot 将行为克隆与自我学习相结合,以优化完全自主的端到端视觉运动策略,从而实现在各种任务中高效的操控技能,包括对看不见的物体(抓取岩石)、长视界任务(垃圾分类)以及对未建模的可变形和铰接物体(救援检索)的巨大扰动的鲁棒性。图片来源:刘等人。
作为第二阶段训练的一部分,刘、哈和他们的同事试图加快机器人学习新行为的速度。为此,他们使用了自我引导优化,这种方法允许系统使用从过去的预测或决策中得出的反馈来自主调整其学习过程。
研究人员写道:“在这一步中,我们反复执行学习到的策略,并使用执行时间作为奖励,以基于代理的优化算法来加速策略。这一步允许系统进一步优化人类演示数据中的次优参数(例如执行速度)。”
研究人员在一系列真实实验中对 Aquabot 进行了评估,测试了它完成不同物体操控任务的能力。这些任务包括在水下抓取之前未见过的岩石、将垃圾分类放入不同的容器以及取回模仿人体的大型可变形物体。
机器人在所有这些任务中都表现出色,完成速度比人类操作员更快。值得注意的是,其底层自引导优化方法还允许根在现实世界环境中获得更多经验时不断改进其基础策略。
“通过大量的实际实验,我们展示了 AquaBot 在各种操作任务中的多功能性,包括抓取物体、分类垃圾和救援检索​​,”刘、哈和他们的同事写道。“我们的实际实验表明,AquaBot 的自我优化策略在速度上比人类操作员快 41%。AquaBot 代表着朝着自主和自我改进的水下操作系统迈出了有希望的一步。”
研究团队使用的硬件设计和软件都是开源的,世界各地的其他计算机科学家都可以访问。未来,他们开发的机器人系统可以进一步改进,在其他实验中进行测试,并最终部署在自然环境中完成各种任务。例如,它可以用于协助人类特工执行搜救任务,以及从海底收集垃圾、矿物或其他物体。

页: [1]
查看完整版本: 水上机器人的自学习优化增强了水下物体操纵技能