一种使用数小时视频和强化学习元素的方法可以在没有完整的环境地图的情况下引导机器人车辆近两英里。
使用目的地的图像作为参考,在这种情况下,场地另一边的房子,以及如何在各种地形上进行陆路导航的“先验”,从数小时的拍摄视频中收集,无人驾驶车辆几乎可以导航自己走两英里就可以达到目标。
机器人和自动驾驶汽车有一个非常大的共同挑战,那就是如何驾驭世界。通常,人工智能将这项任务作为如何绘制周围环境的问题来处理,以便在机器人或汽车穿过该地形之前构建场景几何形状的精确概览。
可能有更简单的方法。
今年2月,美国加州大学伯克利分校的学者在 arXiv 上发表的一篇论文中,轮式机器人能够在郊区地形上行驶数公里。机器人坚持路径并躲避以前看不见的障碍。重要的是它不会像其他一些方法那样映射其环境,例如在自动驾驶人工智能程序中。
相反,它依赖于从之前运行的 30 小时视频中提取的启发式方法和一些地形的俯视图,以创建一个改进的沿途站点相互关联的示意图,而不需要完整的地图。这项名为“ViKiNG:具有地理提示的基于视觉的公里级导航”的研究由博士撰写。候选人 Dhruv Shah 和加州大学伯克利分校助理教授 Sergey Levine。
多年来,Levine一直致力于与谷歌合作将人工智能引入机器人技术。这项工作的许多关键发现都与 Levine 去年在一篇题为“如何训练你的机器人”的论文中相关。那篇论文重点关注所谓“强化学习”的发现,这是一种训练神经网络的深度学习 AI 形式朝着一个目标分阶段前进。
Shah 和 Levine 的最新作品 ViKiNG 与 RL 有着重要的联系。
ViKiNG 建立在之前的系统之上,称为“RECON”,代表Shah 和 Levine 去年推出的“结果驱动导航的快速探索控制器” 。
RECON 的训练是让轮式机器人(Clearpath Robotics 制造的Jackal 无人驾驶地面车辆)在 18 个月的时间里在停车场和田野等多个环境中“随机行走”,通过安装的 RGB 摄像头收集数小时的视频,激光雷达和 GPS。
ViKiNG 建立在其前身程序 RECON 的基础上,以高空卫星或高空景观示意图数据的形式添加“提示”。
RECON 通过压缩和解压缩图像数据的卷积网络学习了所谓的“导航先验”,即所谓的“信息瓶颈”,这是 Naftali Tishby 及其同事在 2000 年引入的一种处理信号的方法。
RECON 的这种方法开发了软件通过压缩图像然后回忆突出的内容来良好表示视觉环境的能力。在测试阶段,RECON 会看到一个目标的图像,比如说一个特定的建筑物,并且必须在飞行中弄清楚如何导航到那个新的地方。
RECON 沿着通往该目标的路径构建了一个步骤图,这是一种即兴地图。使用这些技术,Jackal 机器人能够在其从未遇到过的新环境中导航至 80 米远的目标。在所有其他现有的机器人导航方法都未能达到目标的情况下,它能够做到这一点。
在 ViKiNG 中,Shah 和 Levine 以一种特定方式扩展了 RECON:提示。他们给豺狼软件提供新地形的卫星图像或高空地图。
正如 Shah 和 Levine 所写,“与执行不知情搜索的 RECON 相比,ViKiNG 以近似 GPS 坐标和高空地图的形式结合了地理提示。
“这使 ViKiNG 能够达到远距离目标,比 RECON 报告的最远目标远达 25 倍,并且在探索新环境时达到目标的速度比 RECON 快 15 倍。”
ViKiNG 系统方法大纲。从图像中采样以及提示,允许系统动态构建本地拓扑图,以绘制到目的地的路线图。
ViKiNG 计划增加了随机行走的摄像机观察训练数据,增加了 12 小时的视频,这些视频来自“遥控”旅行,人类引导豺狼沿着人行道或远足小径等路径建立那些先前的例子。用于处理所有训练数据的神经网络相当单调,即熟悉的 MobileNet 卷积神经网络。
这一次,配备 ViKiNG 的 Jackal 远远超出了 RECON 的 80 米,从起点到目的地的距离约为 3 公里,或近 2 英里。
在该项目的博客页面上展示的视频中,Shah 和 Levine 展示了带有 ViKiNG 的 Jackal 如何计算出如何绕过以前未知的障碍物,例如停放的车辆挡住了它的路径。一个配套视频解释了这项工作,您可以在这篇文章的底部查看。
RECON 明确采用了强化学习的元素。同样,ViKiNG 也以某种方式借用。当被问及与 RL 的联系时,Levine 在一封电子邮件中告诉ZDNet,“我将 ViKiNG 描述为一种强化学习方法,其之上有更高级别的规划器。”
Levine解释说,关键在于将用于实时导航的低级学习控制方法与类似于 RL 的高级规划相结合。
正如莱文所描述的, 显式的高级规划提供了处理非常长的视野的能力,因此查看该方法的一个好方法是使用无模型 [RL] 技术来处理本地导航的低级问题(例如,如何驾驶一棵树)规划如何绘制通往遥远目标的路径的高级问题。我认为这实际上是一种非常自然的契合——就像一个开车的人可能不会仔细考虑他们所做的每一个转弯,但会在他们的脑海中做一些明确的计划来决定走哪条路线去他们的目的地,也许是推理关于地标作为计划中的“节点”。
Levine 认为,自动驾驶汽车等更复杂的导航具有高度相关性。他说,ViKiNG 是“人行道送货机器人”的开始。
Levine说:“但是自动驾驶或其他风险更高的任务(甚至是必须处理密集交通的真正人行道交付)必须有额外的机制来处理安全和约束,目前的方法还没有直接处理。”
Levine提出,在安全等方面的额外工作可以包括人类作为“副驾驶”的明确指示,以引导机器人远离伤害。它还可以包括模仿将灌输一些保障措施的现有政策。
然而,Levine说要处理高速行驶的车辆以及乱穿马路的行人等看不见的因素,需要做更多的研究。当然,为此类系统提供严格的安全保证是一个主要的开放性问题,我确实认为需要做更多的工作才能使这种系统对于全尺寸自动驾驶汽车足够安全。
2025-04-24 15:08
2025-04-21 12:14
2025-04-21 12:11
2025-04-18 08:54
2025-04-18 08:53
2025-04-17 08:16
2025-04-17 08:13
2025-04-16 10:55
2025-04-16 08:50
2025-04-14 14:57