发布询价单
您的位置:首页 > 资讯 > 企业动态 > 正文

解决机器人比萨制作的挑战

2022-04-11 11:13 性质:原创 作者:优优 来源:中国AGV网
免责声明:AGV网(www.chinaagv.com)尊重合法版权,反对侵权盗版。(凡是我网所转载之文章,文中所有文字内容和图片视频之知识产权均系原作者和机构所有。文章内容观点,与本网无关。如有需要删除,敬请来电商榷!)
想象一下,一个比萨饼制作者正在处理一团面团。她可能会用铲子把面团抬到砧板上,然后用擀面杖把它压成一个圆形。很简单,对吗?如果这个比萨饼制作者是一个机器人就不一样了。对于机器人来说,处...

想象一下,一个比萨饼制作者正在处理一团面团。她可能会用铲子把面团抬到砧板上,然后用擀面杖把它压成一个圆形。很简单,对吗?如果这个比萨饼制作者是一个机器人就不一样了。

对于机器人来说,处理像面团这样的可变形物体是很棘手的,因为面团的形状可以有很多变化,这很难用公式来表示。此外,从面团中创造一个新的形状需要多个步骤和使用不同的工具。对于一个机器人来说,学习一个具有长序列步骤的操作任务是特别困难的--那里有许多可能的选择--因为学习常常是通过试验和错误进行的。

麻省理工学院、卡内基梅隆大学和加州大学圣地亚哥分校的研究人员想出了一个更好的办法。他们创建了一个机器人操纵系统的框架,该系统使用两阶段的学习过程,这可以使机器人在很长的时间范围内执行复杂的面团操纵任务。一个 "教师 "算法解决了机器人为完成任务必须采取的每一个步骤。然后,它训练一个 "学生 "机器学习模型,学习关于何时和如何执行任务中所需要的每项技能的抽象概念,如使用擀面杖。有了这些知识,系统就会推理出如何执行这些技能来完成整个任务。

研究人员表明,这种被他们称为DiffSkill的方法可以在模拟中执行复杂的操作任务,如切割和铺开面团,或从砧板周围收集面团碎片,同时优于其他机器学习方法。

除了制作披萨之外,这种方法还可以应用于机器人需要操纵可变形物体的其他场合,例如为老人或有运动障碍的人喂食、洗澡或穿衣的护理机器人。

"这种方法更接近于我们人类计划行动的方式。当人类做一个长距离的任务时,我们不是在写下所有的细节。我们有一个更高层次的计划器,它大致上告诉我们阶段是什么,以及沿途我们需要实现的一些中间目标,然后我们执行它们,"计算机科学和人工智能实验室(CSAIL)的研究生李云珠说,她是介绍DiffSkill的论文的作者。

李云珠的合著者包括主要作者卡内基梅隆大学(CMU)的研究生林星宇、加州大学圣地亚哥分校的研究生黄志豪、Paul E. Newton职业发展教授Joshua B. Tenenbaum。牛顿职业发展教授和CSAIL成员;CMU助理教授David Held;以及资深作者Chuang Gan,MIT-IB+M Watson人工智能实验室的研究科学家。该研究将在国际学习表征会议上发表。

学生和老师

DiffSkill框架中的 "老师 "是一种轨迹优化算法,可以解决短距离的任务,即物体的初始状态和目标位置很接近。轨迹优化器在一个模拟现实世界物理学的模拟器中工作(被称为可微分物理学模拟器,这使 "DiffSkill "中的 "Diff "成为现实)。教师 "算法使用模拟器中的信息来学习面团在每个阶段必须如何移动,一次一个,然后输出这些轨迹。

然后 "学生 "神经网络学习模仿老师的动作。作为输入,它使用两个摄像机图像,一个显示面团的当前状态,另一个显示任务结束时的面团。该神经网络生成一个高级计划,以确定如何将不同的技能联系起来以达到目标。然后,它为每个技能生成具体的、短距离的轨迹,并直接向工具发送命令。

研究人员使用这种技术对三种不同的模拟面团操作任务进行了实验。在一项任务中,机器人使用铲子将面团举到砧板上,然后使用擀面杖将其压平。在另一项任务中,机器人使用抓手从柜台的各个角落收集面团,将其放在铲子上,然后将其转移到砧板上。在第三项任务中,机器人用刀将一堆面团切成两半,然后用抓手将每块面团运送到不同的地方。

研究人员开发的机器人操纵系统可以在模拟中用工具完成复杂的面团操纵任务,如收集面团并将其放到砧板上(左),将一块面团切成两半并将两半分开(中间),以及将面团抬到砧板上然后用擀面杖压平(右)。他们的技术能够成功地执行这些任务,而其他机器学习方法则失败了。

胜人一筹

DiffSkill能够胜过依靠强化学习的流行技术,即机器人通过试验和错误学习任务。事实上,DiffSkill是唯一能够成功完成所有三项面团操作任务的方法。有趣的是,研究人员发现,"学生 "神经网络甚至能够胜过 "教师 "算法,林说。

"我们的框架为机器人获得新技能提供了一种新颖的方式。这些技能然后可以被串联起来,以解决更复杂的任务,这超出了以前机器人系统的能力,"林说。

因为他们的方法专注于控制工具(铲子、刀、擀面杖等),它可以应用于不同的机器人,但前提是它们使用研究人员定义的特定工具。在未来,他们计划将工具的形状整合到 "学生 "网络的推理中,这样它就可以应用于其他设备。

研究人员打算通过使用3D数据作为输入来提高DiffSkill的性能,而不是使用难以从模拟转移到现实世界的图像。他们还希望使神经网络规划过程更加有效,并收集更多不同的训练数据,以增强DiffSkill对新情况的概括能力。从长远来看,他们希望将DiffSkill应用于更多不同的任务,包括布的操作。

这项工作得到了美国国家科学基金会、LG电子、麻省理工学院-IBM Watson人工智能实验室、海军研究办公室和国防高级研究计划局机器常识项目的部分支持。

网友评论
文明上网,理性发言,拒绝广告

相关资讯

关注官方微信

手机扫码看新闻