发布询价单
您的位置:首页 > 资讯 > 行业资讯 > 正文

有没有将深度学习融入机器人领域的新尝试?

2017-04-19 09:01 性质:转载 作者:才企传媒 来源:才企传媒
免责声明:AGV网(www.chinaagv.com)尊重合法版权,反对侵权盗版。(凡是我网所转载之文章,文中所有文字内容和图片视频之知识产权均系原作者和机构所有。文章内容观点,与本网无关。如有需要删除,敬请来电商榷!)
现在深度学习这么火,大家都会想着看看能不能用到自己的研究领域里。所以,将深度学习融入到机器人领域的尝试也是有的。我就自己了解的两个方面(视觉与规划)来简单介绍一下吧。物体识别...

现在深度学习这么火,大家都会想着看看能不能用到自己的研究领域里。所以,将深度学习融入到机器人领域的尝试也是有的。我就自己了解的两个方面(视觉与规划)来简单介绍一下吧。 

物体识别

这个其实是最容易想到的方向了,比较DL就是因为图像识别上的成果而开始火起来的。

这里可以直接把原来CNN的那几套网络搬过来用,具体工作就不说了,我之前在另一个回答amazon picking challenge(APC)2016中识别和运动规划的主流算法是什么?下有提到,2016年的『亚马逊抓取大赛』中,很多队伍都采用了DL作为物体识别算法。 

物体定位

当然,机器视觉跟计算机视觉有点区别。机器人领域的视觉除了物体识别还包括物体定位(为了要操作物体,需要知道物体的位姿)。

2016年APC中,虽然很多人采用DL进行物体识别,但在物体定位方面都还是使用比较简单、或者传统的算法。似乎并未广泛采用DL。

当然,这一块也不是没人在做。我们实验室的张博士也是在做这方面尝试。我这里简单介绍一下张博士之前调研的一偏论文的工作。

Doumanoglou, Andreas, et al. "Recovering 6d object pose and predicting next-best-view in the crowd."Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016.

这个工作大概是这样的:对于一个物体,取很多小块RGB-D数据;每小块有一个坐标(相对于物体坐标系);然后,首先用一个自编码器对数据进行降维;之后,用将降维后的特征用于训练Hough Forest。

这样,在实际物体检测的时候,我就可以通过在物体表面采样RGB-D数据,之后,估计出一个位姿。 

抓取姿态生成

这个之前在另一个问题(传统的RCNN可以大致框出定位物体在图片中的位置,但是如何将这个图片中的位置转化为物理世界的位置?)下有介绍过,放两个图

↑ Using Geometry to Detect Grasp Poses in 3DPoint Clouds

↑ High precision grasp pose detection in dense clutter 

控制/规划

这一块是我现在感兴趣的地方。

简单地说,我们知道强化学习可以用来做移动机器人的路径规划。所以,理论上将,结合DL的Function Approximation 与 Policy Gradient,是有可能用来做控制或规划的。当然,现在的几个工作离取代原来的传统方法还有很长的距离要走,但是也是很有趣的尝试。

放几个工作,具体可以看他们的paper。

1.Learning monocular reactive uav control in cluttered natural environments

↑ CMU 无人机穿越森林

2. From Perception to Decision: A Data-driven Approach to End-to-end Motion Planning for Autonomous Ground Robots

↑ ETH 室内导航

3.Learning Hand-Eye Coordination for Robotic Grasping with Deep Learning and Large-Scale Data Collection

↑ DeepMind 物体抓取

4. End-to-end training of deep visuomotor policies

↑ Berkeley 拧瓶盖等任务 

有哪些难点

1、在视觉领域,除了物体识别、还需要进行物体定位。这是一个 regression 问题,但是目前来看, regression 的精度还没办法直接用于物体操作,(可能是数据量还不够,或者说现在还没找到合适的网络结构),所以一般还需要采用ICP等算法进行最后一步匹配迭代。

2、机器人规划/控制等方面,可能存在的问题就比较多了。我之前在雷锋网『硬创公开课』直播(运动规划 | 视频篇)的时候有提到我碰到的一些问题,这里简单列在下面: 

可观性问题

简单地说,我们这些不做DL理论的人,都是先默认DL的收敛、泛化能力是足够的。我们应该关心的是,要给DL喂什么数据。也就是说,在DL能力足够强的前提下,哪些数据才能让我需要解决的问题变得可观。

当然,目前的几个工作都没有提到这点,Berkeley的那个论文里是直接做了一个强假设:在给定数据(当前图像、机器人关节状态)下,状态是可观的。

实际机器人操作中,系统状态可能跟环境有关(例如物体性质),所以这一个问题应该是未来DL用在机器人上所不能绕过的一个问题。 

数据量

一方面,我们不了解需要多少数据才能让问题收敛。另一方面,实际机器人进行一次操作需要耗费时间、可能会造成损害、会破坏实验条件(需要人工恢复)等,采集数据会比图像识别、语音识别难度大很多。 

是否可解决

直播的时候我举了个例子,黑色障碍物位置从左到右连续变化的时候,规划算法输出的最短路径会发生突变。(具体看视频可能会比较清楚)

这对应于DL中,就是网络输入连续变化、但输出则会在某一瞬间突变。而且,最短路径可能存在多解等问题。

DL的 Function Approximattion 是否能很好地处理这一状况?

是吧,这几件事想想都很有趣,大家跟我一起入坑吧~

网友评论
文明上网,理性发言,拒绝广告

相关资讯

  • 巨石神话:人工智能并非单一事物
    人工智能不仅仅是像 ChatGPT 这样的大型语言模型——它是一个庞大的领域,包含相互关联的技术、工具和功能,可在各个领域应用多种多样。将人工智能视为单一事物可能会掩盖能力、安全性和政策设计...

    2025-10-15 10:52

  • 【邀请函】马上预约!重磅亮相CeMAT ASIA,京东物流「智狼扩展版」重构仓储标尺
    从标准周转箱密集存储到多规格原箱周转箱混合共库“智狼扩展版”将在2025 CeMAT ASIA重磅亮相以智能革新之力突破仓储边界?2025 CeMAT ASIA?️10月28日-31日?上海新国际博览中心京东物流在N1...

    2025-10-15 10:37

  • 人工智能上车之后:智能叉车的系统化变革之路
    叉车,作为现代内部物流体系中最核心的搬运装备,承担着原材料、在制品与成品在生产各环节之间的高效转运任务。随着智能制造与智慧物流的深度融合,叉车的角色正从单一的作业工具,转变为数字化工...

    2025-10-14 10:39

  • 影响力创新:可能塑造我们未来的以色列初创企业
    近日,NoCamels 最近重点介绍了具有改变世界的潜力的 以色列医疗技术和绿色技术。但还有其他一些同样具有创新精神的公司,它们的业务范围不在上述两类,但却对我们的生活有着同样巨大的潜在影响。...

    2025-10-14 10:20

  • 身价 15 亿美元的工程师:Meta 的最新聘用表明 AI 人才竞争已变得多么昂贵
    扎克伯格对精英研究人员的不懈追求正在重新绘制科技的力量平衡,Thinking Machines 的 Andrew Tulloch 成为加入 Meta 人工智能运动的最新精英工程师。Meta 积极进取,在人工智能领域又迎来...

    2025-10-14 10:15

  • 为什么逆向物流是配送优化的下一个前沿?
    波动的关税和不断变化的全球贸易政策正在挤压本已微薄的零售利润。与此同时,消费者对快捷便捷服务的期望也达到了前所未有的高度。零售商面临着越来越大的压力,既要控制成本,又要确保顾客忠诚度...

    2025-10-13 10:13

  • IFR:全球工厂机器人需求十年内翻一番
    德国法兰克福,2025年9月25日——《世界机器人2025》工业机器人最新统计数据显示,2024年全球安装机器人数量将达到54.2万台,是十年前的两倍多。年安装量连续第四年超过50万台。2024年,亚洲占新增...

    2025-10-13 10:09

  • 《世界经济论坛》2025年的10项新兴技术
    刚刚发布:世界经济论坛关于未来三到五年可能产生影响的十大最重要的新技术的报告。与往年一样,世界经济论坛将于2025年发布一份关于十大重要新兴技术的报告:《2025年十大新兴技术报告》。该报告...

    2025-10-13 10:08

  • 迈向全球舞台:中国移动机器人厂商加速国际化浪潮
    近年来,中国移动机器人行业经历了惊人的成长,从电商物流驱动起步到如今面向全球扩张。国际行业调研机构《Interact Analysis》在其最新报告《中国移动机器人厂商的全球化进程》(The globalizat...

    2025-10-13 10:05

  • Z世代的工作正在消失:人工智能自动化如何重塑劳动力?
    (Z世代(Generation Z)通常指1997—2012年出生的人群(中文语境常与“00后”近似)。他们是移动互联网与社交平台的“原住民”,信息获取更碎片化、图像化,偏好短视频与高互动社区。价值观上更...

    2025-10-11 11:47

关注官方微信

手机扫码看新闻