您的位置：首页 > 资讯 > 企业动态 > 正文

谷歌旗下DeepMind 推出“思考型机器人”新模型：迈向具身智能新时代

2025-10-11 11:52 性质：原创作者：Mulan 来源：AGV网

免责声明：AGV网（www.chinaagv.com)尊重合法版权，反对侵权盗版。（凡是我网所转载之文章，文中所有文字内容和图片视频之知识产权均系原作者和机构所有。文章内容观点，与本网无关。如有需要删除，敬请来电商榷！）

谷歌公司旗下DeepMind近日推出了全新的机器人智能系统——Gemini Robotics 1.5与Gemini Robotics-ER 1.5。这两款模型的发布，标志着机器人已从单步指令执行，迈入具备多步推理与主动学习能力的...

谷歌公司旗下DeepMind近日推出了全新的机器人智能系统——Gemini Robotics 1.5与Gemini Robotics-ER 1.5。这两款模型的发布，标志着机器人已从单步指令执行，迈入具备多步推理与主动学习能力的“思考型时代”，开启了人工智能与具身机器人融合的新阶段。

此次升级源于DeepMind在通用人工智能（AGI）方向的长期积累。Gemini Robotics系列建立在多模态基础模型Gemini 2.0之上，将视觉、语言、动作与环境理解融为一体，旨在让机器人真正具备理解世界、规划行为和执行任务的能力。过去的机器人模型往往只在特定任务中运行，而新的系统通过将“思考”和“执行”模块化分工，实现了推理与动作的分层协同。

在架构设计上，Gemini Robotics-ER 1.5扮演“思考中枢”，具备强大的视觉-语言理解和空间推理能力。它能够分析环境、制定计划，并在必要时访问网络工具以获取实时信息，从而完善任务决策。例如，机器人可主动查询伦敦或纽约的天气预报，根据气候状况为用户打包行李；或检索当地垃圾分类标准，自动进行可回收物与厨余垃圾的分类。这种自主推理与外部信息融合，使机器人具备了面向现实世界的知识更新能力。

作为执行层的Gemini Robotics 1.5则是“行动大脑”，负责将ER模型生成的目标计划转化为具体动作指令。其核心特征在于“先思考，再行动”：在执行前，模型会模拟动作路径、预测结果并动态调整策略，以确保复杂任务中的稳定性与高效性。该模型融合了视觉-语言-动作（VLA）学习框架，使机器人能够在连续任务中保持上下文记忆与执行一致性。

值得关注的是，DeepMind还在本次系统中引入了Motion Transfer（动作迁移）技术。不同于传统机器人只能在固定硬件上学习与执行，该技术允许模型在不同结构的机器人之间迁移技能。例如，一个为双臂机器人ALOHA2设计的任务，能够直接在双臂Franka或Apptronik的人形机器人Apollo上复现。通过跨形态迁移，机器人学习的“经验”得以共享，极大降低了重新训练的成本，为通用机器人生态的形成奠定了基础。

两款模型在开放策略上也有所区别。Gemini Robotics-ER 1.5 将通过Gemini AI Studio和Gemini API面向开发者开放，使研究人员和企业可在其上进行二次开发；而Gemini Robotics 1.5 由于涉及复杂控制与安全因素，目前仅向特定合作伙伴提供。此前，DeepMind还推出了“Gemini Robotics On-Device”版本，用于在离线或低延迟场景中运行，显示出在不同应用环境中的灵活适应能力。

在实验展示中，这一系统已能支持机器人完成多步、跨领域的综合任务。例如，机器人能够折叠衣物、按颜色分类洗衣，或根据不同国家的生活规范调整操作策略。这些案例展现出模型在环境理解、任务规划与自我校正方面的显著进步。尤其在“具身智能”概念下，机器人不再是被动执行者，而成为能理解语义、进行推理、并据此采取行动的智能体。

这一技术体系的突破意义重大。首先，它为机器人行业带来了真正的“思维—行动”闭环，让AI从虚拟语义空间走向物理世界。其次，跨设备动作迁移技术将显著降低机器人训练与部署成本，推动软硬件标准化。最后，通过API的开放，AI生态开发者将能更快速地构建新一代智能机器人系统。

未来，随着Gemini Robotics系列的持续演进，DeepMind正试图构建一个统一的“机器人智能底座”——让任何具备传感器与执行器的实体，都能通过同一智能框架进行学习、适应和决策。这意味着，机器人将逐步具备理解环境、做出判断并采取行动的能力，真正从“执行机器”转变为“具身智能体”。

关于英国DeepMind公司进入企业商铺

我们一直对人类智能着迷 - 它塑造了我们今天生活的现代世界。

智能使我们能够学习，想象，合作，创造，沟通等等。通过更好地理解智能的不同方面，我们可以利用这些知识作为灵感来构建新颖的计算机系统，这些系统学会自己找到解决难题的方法。

寻找答案

就像帮助我们更深入地观察太空的哈勃望远镜一样，这些工具已经在扩展人类知识并产生积极的全球影响。

我们的长期目标是解决智能问题，开发更通用和更有能力解决问题的系统，称为人工通用智能（AGI）。

在安全和道德的指导下，这项发明可以帮助社会找到世界上一些最紧迫和最基本的科学挑战的答案。