发布询价单
您的位置:首页 > 资讯 > 企业动态 > 正文

谷歌研究人员教机器人通过观看来学习

2022-04-23 10:23 性质:原创 作者:优优 来源:中国AGV网
免责声明:AGV网(www.chinaagv.com)尊重合法版权,反对侵权盗版。(凡是我网所转载之文章,文中所有文字内容和图片视频之知识产权均系原作者和机构所有。文章内容观点,与本网无关。如有需要删除,敬请来电商榷!)
不同的机器人末端执行器机器人学家通常通过远程操作机器人执行任务来教机器人新的任务。然后,机器人模仿演示,直到它能独立完成任务。虽然这种教授机器人的方法是有效的,但它将演示限制在实验室...

不同的机器人末端执行器

机器人学家通常通过远程操作机器人执行任务来教机器人新的任务。然后,机器人模仿演示,直到它能独立完成任务。

虽然这种教授机器人的方法是有效的,但它将演示限制在实验室环境中,而且只有程序员和机器人专家可以做演示。谷歌公司机器人部门的一个研究小组一直在为机器人开发一种新的学习方法。

人类一直在通过观察来学习,但对机器人来说,这不是一个简单的任务。这对机器人来说是很困难的,因为它们看起来与人类不同。例如,一个拥有双指抓手的机器人不会从观察一个拥有五指手的人类拿起一支笔的过程中获得多少知识。

为了解决这个问题,该团队引入了一种自我监督的跨环境逆向强化学习(XIRL)方法。

这种教学方法的重点是机器人从视频中学习高层次的任务目标。因此,机器人不是试图使单个人类行动与机器人行动相对应,而是弄清楚其最终目标是什么。

然后,它以奖励函数的形式总结该信息,该函数对形状、行动和末端效应器动态等物理差异是不变的。通过利用学到的奖励和强化学习,研究小组教机器人如何通过试验和错误处理物体。

当样本视频更加多样化时,机器人学得更多。实验表明,该团队的学习方法导致在新的体现上的样本效率强化学习提高了2到4倍。

该团队已经对其方法和X-MAGICAL(其模拟的跨实例模仿的基准)进行了开源实施,以便让其他人在他们的工作基础上进行扩展和建设。

X-MAGICAL的创建是为了评估XIRL在一个一致的环境中的表现。该程序挑战一组具有不同形状和终端效应器的代理体现,以执行一项任务。这些代理以不同的方式和速度执行任务。

展示不同的形状在X-MagICAL中执行任务。|来源:谷歌

该团队还使用真实世界的人类示范任务进行教学。他们用自己的方法来训练模拟的索耶尔手臂将冰球推入目标区域。他们的教学方法也优于基线方法。

该研究团队包括来自谷歌机器人技术的 Kevin Zakka、Andy Zeng、Pete Florence、Jonathan Tompson 和 Debidatta Dwibedi,以及来自斯坦福大学的 Jeannette Bohg。

Google正在成立一个名为 “Area 120” 的部门,该部门由公司高管 Don Harrison 和 Bradley Horowitz 直接负责,用于支持员工进行内部创业。员工可提 BP申请加入,被批准后其自发组织的团队便可全职为新想法而工作,如果成功的话可以单独成立公司并获得 Google 投资。有评论称Google此举是为了阻止员工跳槽创业公司。

Google成立新部门Area120支持员工内部创业

这个名为“Area 120”的Google内部创业孵化器由公司高管唐·哈里斯(Don Harrison)和布拉德利·霍洛维茨(Bradley Horowitz)掌管。在最近举行的全员大会上,两位高管对新组织做了介绍。

“Area 120”办公地位于Google旧金山新办公楼内。Google高管希望Area 120可以让富有企业家精神的员工在公司工作更长时间,同时还可以物色大创意。孵化器主要面向员工,目的是保持创业氛围,和一些热门企业家建立联系。孵化器的运作细节尚未确定,目前大体框架如下:Google团队可以申请加入孵化器,全职工作几个月,提交具体商业计划;之后,他们有机会收到Google的投资意向书,建立一家新公司,Google是投资者。

Google有一个众所周知的传统就是鼓励员工用20%的工作时间研究自己喜欢的项目,新孵化器之所以取名“Area 120”正是向该制度致敬。从理论上讲,Area 120允许员工全职研究喜欢的项目。

目前Google已经成立了Google风投(Google Ventures)和Google资本(Google Capital)两家公司,它们的目标也是为创业公司提供资金支持,将一些富有企业家精神的前Google员工留在公司之内。不清楚这些基金公司是否会与Area 120合作,照推测Area 120的资金应该来自Google企业发展预算之外。

网友评论
文明上网,理性发言,拒绝广告

相关资讯

关注官方微信

手机扫码看新闻