发布询价单
您的位置:首页 > 资讯 > 企业动态 > 正文

CoRL 2025新作:从“看”到“触”,TA-VLA实现机器人触觉智能跃迁

2025-12-19 09:52 性质:转载 作者:松灵机器人 来源:松灵机器人
免责声明:AGV网(www.chinaagv.com)尊重合法版权,反对侵权盗版。(凡是我网所转载之文章,文中所有文字内容和图片视频之知识产权均系原作者和机构所有。文章内容观点,与本网无关。如有需要删除,敬请来电商榷!)
想象一个看似简单的任务:把充电头插进插座。对人类来说,我们不仅用眼睛看,还会用手感受阻力——插歪了会卡住,插到位会有“咔哒”感。这种力觉反馈是完成精细操作的关键。但在当前主流的视觉-语...

想象一个看似简单的任务:把充电头插进插座。对人类来说,我们不仅用眼睛看,还会用手感受阻力——插歪了会卡住,插到位会有“咔哒”感。这种力觉反馈是完成精细操作的关键。

但在当前主流的视觉-语言-动作(Vision-Language-Action, VLA)模型中,机器人只依赖摄像头和指令,完全忽略了来自关节的扭矩信号。这就导致它们在面对“接触密集型”任务(如按按钮、拧门把手、插拔接口)时,常常失败却不知为何。

使用产品松灵PiPER六轴机械臂

论文链接:https://arxiv.org/pdf/2509.07962v1

论文作者:Zongzheng Zhang, Haobo Xu, Zhuo Yang, Chenghao Yue, Zehao Lin, Huan-ang Gao, Ziwei Wang, Hao Zhao

项目主页:https://zzongzheng0918.github.io/Torque-Aware-VLA.github.io/(论文收录至CoRL 2025)

01

让扭矩成为机器人的“第六感”

传统VLA模型(如 π0、RDT、Octo)主要依赖视觉+语言+关节位置进行决策。但这些信号在接触发生时往往变化微弱,难以判断操作是否成功。

而关节扭矩(joint torque)——即电机输出的力矩——能直接反映末端执行器与环境的物理交互状态。例如,在“接充电头”任务中(见下图):

  • 未接触:扭矩平稳;

  • 接触但未接入(插歪):小幅波动;

  • 成功接入:出现明显、尖锐的扭矩峰值。

  • 研究团队发现:仅靠视觉,模型无法区分“接歪”和“接好”;但加入扭矩信号后,判别变得清晰可靠。

    02

    三大关键设计发现

    该工作不仅提出方法,更系统探索了扭矩信号如何有效融入VLA模型的设计空间,得出三条重要原则:

    扭矩应注入解码器,而非编码器

    原因:扭矩与关节角度同属本体感知信号(proprioception),在动作生成阶段(即解码器)融合,能更好利用其与动作的强相关性。

    验证:通过HSIC(希尔伯特-施密特独立性准则)分析,发现扭矩特征与关节角度高度对齐,远超与图像或文本的关联。

    历史扭矩比单帧更重要,但需压缩为单个Token

    真实数据的纹理、光照、视角等维度多样性有限,导致模型在新环境中易失效;

    预测未来扭矩,可构建物理感知的内部表征

    自动驾驶中“联合预测轨迹与意图”启发,团队提出动作-扭矩联合扩散模型:

    模型不仅预测未来动作序列,同时预测对应的扭矩序列;

    通过辅助损失监督扭矩预测,迫使模型理解“动作→力反馈”的因果关系;

    实验显示,模型能准确预测未来50步的扭矩变化(见下图),显著提升接触任务成功率。

    03

    实验结果:全面超越现有VLA模型

    团队使用AgileX PiPER Arm在10个真实世界任务(5个接触密集型 + 5个常规任务)上进行了测试,包括:

  • 充电器/USB插拔

  • 按钮按压

  • 门把手旋转

  • 瓶子抓取、倒水、叠积木等

  • 以当前最强VLA模型 π0为基线,TA-VLA(即 π0+obs+obj)在接触任务上的平均成功率从不足5% 提升至超80%

    方法按钮按压接充电器接USB开门把手
    π05/200/200/202/20
    TA-VLA18/1217/2017/2015/20

    更令人惊喜的是,即使在非接触任务中(如倒水、开抽屉),引入扭矩信号也能带来小幅提升,说明物理感知具有泛化价值

    此外,该方法在 RDT、ACT 等其他VLA架构上同样有效,并成功迁移到不同品牌机械臂(如ROKAE SR),展现出强大的跨模型、跨本体泛化能力。

    03

    意义与展望

    TA-VLA 的工作标志着VLA模型从“纯感知-决策”迈向“感知-力觉-决策”的新阶段。它证明了:

  • 无需昂贵外置传感器,仅利用机器人自带的关节扭矩即可实现高精度接触感知;

  • 预训练VLA模型具备良好扩展性,可高效融合新模态;

  • 物理信号不仅是输入,更是学习目标——通过预测扭矩,模型能内化物理规律。

松灵机器人成立于2016年,是全球领先的机器人底盘制造商和移动机器人系统解决方案服务商。目前,松灵机器人已经拥有多款适用于不同地形的室内外移动机器人底盘,在载重、续航、速度、运动模式等不同需求场景下实现全矩阵覆盖。同时,松灵机器人还推出了自动驾驶解决方案,平行驾驶解决方案,机器人科研教育套件等移动机器人底盘配套产品,帮助客户在自动驾驶、机械控制、计算机、车辆等领域完成实验验证。


凭借领先的研发技术,松灵机器人已经与包括阿里巴巴、华为、本田、中建三局在内的30多家行业领军企业,以及中科院、清华大学、南方科技大学、北京理工大学、新加坡国立大学、纽约大学等国内外50多所顶尖学府开展了深度合作。


关注官方微信

手机扫码看新闻