发布询价单
您的位置:首页 > 资讯 > 企业动态 > 正文

《Calcalistech》:认识新一代人形机器人,更智能、更快速,为现实世界做好准备

2025-09-03 10:36 性质:转载 作者:维基·奥斯兰德 来源:维基·奥斯兰德
免责声明:AGV网(www.chinaagv.com)尊重合法版权,反对侵权盗版。(凡是我网所转载之文章,文中所有文字内容和图片视频之知识产权均系原作者和机构所有。文章内容观点,与本网无关。如有需要删除,敬请来电商榷!)
“拿起达斯·维达光剑颜色的盒子,把它放在最高的那堆盒子上面,”敏捷的鸟腿绿色人形机器人迪吉特站在一个堆满各种高度和颜色的盒子的房间里,收到指令。迪吉特一动不动地站着,等待系统处理语音...

“拿起达斯·维达光剑颜色的盒子,把它放在最高的那堆盒子上面,”敏捷的鸟腿绿色人形机器人吉特站在一个堆满各种高度和颜色的盒子的房间里,收到指令。迪吉特一动不动地站着,等待系统处理语音指令。最后,他拿起红色的盒子,小心翼翼地把它放在最高的那堆盒子上面。

对于机器人来说,拿起一个盒子并将其整齐地堆放起来本身并不是什么了不起的动作;然而,理解人类的神秘命令、正确解读并执行它,却是一项意义非凡的创新。Digit 的进步部分归功于生成式人工智能革命,这场革命也已延伸到机器人领域,颠覆了人们的预期。“有人问我,除了语言建模之外,2024 年最大的热门是什么?答案是机器人技术。就是这样。” Nvidia 高级人工智能科学家 Jim Fan 在 12 月写道。“我们距离实体人工智能代理的 ChatGPT 时刻还有大约三年的时间。” 他解释道。

Nvidia 首席执行官黄仁勋与机器人 (图片:美联社)

自从范发表这番言论以来,似乎每个人都在谈论“机器人领域的ChatGPT时刻”,指的是预期中的技术突破,它可能会推动该领域的发展,最终让我们的家中充满智能人形机器人,帮助人们做家务,比如擦地、摆桌子或洗衣服(但不包括叠衣服)。“最近几个月发生的事情令人瞩目,”R-Go Robotics首席执行官阿米尔·布萨尼(Amir Bousani)解释道。该公司最近与英伟达(Nvidia)合作,为其正在开发的机器人配备空间感知能力。“现实世界比互联网更难理解,”艾伦人工智能研究所(Allen Institute for Artificial Intelligence)创始首席执行官奥伦·埃齐奥尼(Oren Etzioni)博士指出,“但如今,具有通用行为能力的机器人领域的发展速度要快得多。”

人们对范提到的人形机器人(或称类人机器人)的巨大兴趣,从该领域不断发布的公告中可见一斑:2月,初创公司Figure从杰夫·贝佐斯、英伟达和OpenAI筹集了6.75亿美元,用于开发类人机器人。3月,英伟达首席执行官在公司开发者大会上与来自不同公司的九位类人机器人一同亮相,并宣布为机器人构建模型是“人工智能领域最令人兴奋的难题之一”;4月,埃隆·马斯克承诺将于明年推出他正在开发的人形机器人——擎天柱(Optimus),并预测到2040年,我们身边将有10亿个类人机器人。不久之后,由阿姆农·沙舒亚(Amnon Shashua)两年前创立的、同样致力于开发类人机器人的Mentee Robotics公司也正式上市。与此同时,波士顿动力公司发布了一段视频,展示了其新款类人机器人Atlas,这次Atlas由电力驱动;Agility宣布预计将开始销售用于仓库工作的Digit。而在 5 月底,OpenAI 明确表示认为之前的投资不足,将重新建立于 2021 年 7 月关闭的机器人部门。总体而言,研究公司 Insights 估计,自 2020 年以来,已有 23 亿美元流入了制造人形机器人的初创公司。

“机器人”一词涵盖了各种自动化设备,从制造业使用的机械臂到无人机、自动驾驶汽车和吸尘器。它们大多融入了人工智能,并被编程为在受控环境或人工监督下执行特定任务。但其目标始终是打造最自主的设备,使其能够适应环境、独立学习新事物,并针对各种需求做出快速合理的决策。没有哪个机器人比人形机器人更能体现这一雄心壮志,如今人形机器人备受瞩目,主要原因有两个——一个是实用性,另一个是想象力。如果我们想让机器人做所有我们不想做的事情,无论是在家里、仓库还是工厂,就必须让机器人适应房屋,而不是让房屋适应机器人;通常情况下,腿部和人体结构最适合我们为自己构建的物理环境。另一方面,类人生物简直令人着迷,发人深省——这是艾萨克·阿西莫夫和菲利普·迪克几十年前为我们想象的事物,也是电影通过《星球大战》中的 C-3PO 或《星际迷航》中的 Data 等角色所展现的事物。

“机器人的外观预示着它能做什么以及它有多智能。它必须兑现甚至超越这个承诺,否则机器人将不会被接受,”麻省理工学院机器人专家、iRobot创始人罗德尼·布鲁克斯(Rodney Brooks)最近说道。布鲁克斯将这一原则称为“机器人学第一法则”,这是对阿西莫夫在1941年小说中概述的规则的诠释。该领域的公司深谙此道,他们通过精心剪辑的视频向我们展现了美好的未来:无论是双腿站立的阿特拉斯,还是正在浇灌植物的擎天柱,这些充满目标感的展示都激发了公众的想象力和投资者的兴趣。

实际上,这些演示仅仅是演示而已。“当你看到机器人技术走向实际应用时,你必须记住,必须有人对机器人的每个细节、每个极端情况以及所有可能发生的情况进行编码,”布萨尼指出。马斯克本人在今年一月在X上发布了一段名为“擎天柱叠衣服”的视频后,也提醒了我们这一点。这段帖子和视频或许会让人误以为,这个机器人终于能够自主完成枯燥的家务了!但眼尖的观众注意到,一只人手有时会出现在机器人的右上角,从远处控制着它,这迫使马斯克不得不补充说明:“重要提示:擎天柱目前还不能自主完成这项工作,但它肯定能够在任意环境下完全自主地完成。”当然,马斯克并非孤军奋战;七年多前,波士顿动力公司发布了其正在研发的人形机器人的第一段视频,但至今尚未向公众推出任何一款人形机器人。

多年来,由于开发人形机器人是一项极其复杂的任务,外观与预期之间的差距一直存在。但现在,该领域似乎正处于飞跃的边缘,人们普遍认为重大进展即将到来。点燃这种希望的是像ChatGPT这样的语言模型,它首次将人工智能变成了一项终端消费者可直接使用的技术。乘着这股热潮,企业家们如今承诺将同样的能力从虚拟世界带到现实世界,开发“用于一般任务的机器人”。想象一下现实世界中的ChatGPT:就像机器人可以在无需事先了解虚拟互动发起者的情况下执行各种各样的任务,从写诗、总结文章到转录对话一样,人形机器人也可以响应任何请求,即使它包含神秘的元素并且处于未知的环境中——例如将衣物放入大衣柜、为您送来一罐冷汽水、清空洗碗机,或者为“披萨”之夜摆好餐桌。

人工智能公司Figure AI的人形机器人 (图片:AI图)

制造商:Figure AI

国家: 美国

成立年份:2022年

身高:167厘米

重量:60公斤

速度:每秒1.2米

最新车型上市时间:2024年3月

估价:3万至15万美元

数字

Agility 的数字机器人 (图片:Agility)

制造商: Agility Robotics

国家: 美国

成立年份:2015年

身高:175厘米

体重:63公斤

速度:每秒1.5米

最新车型上市时间:2024年2月

以每小时 10-12 美元的价格租给亚马逊

MenteeBot

Mentee Robotics 的 MenteeBot 机器人 (图片:MenteeBot)

制造商:Mentee Robotics

国家: 以色列

成立年份:2022年

身高:175厘米

重量:70公斤

速度:每秒1.5米

公开时间:2024年4月

阿特拉斯

Atlas机器人 (图片:Boston Dynamics.com)

制造商:波士顿动力公司

国家: 美国

成立年份:1992年

身高:150厘米

体重:89公斤

速度:每秒2.5米

最新车型上市时间:2024年3月

擎天柱 -第二代

Optimus - Gen 2,特斯拉第二代擎天柱机器人 (图片:特斯拉)

制造商:特斯拉

国家: 美国

成立年份:2003年

身高:173厘米

重量:60公斤

速度:0.6米/秒

公开披露时间:2023年12月

估价:3万美元

宇树 H1

宇树 H1 (图片:Unitree

国家:中国

成立年份:2016年

身高:180厘米

重量:47公斤

速度:每秒3.3米

最新车型上市时间:2024年3月

估价:9万美元

新的训练方法

多年来,电动汽车和自动驾驶汽车领域的发展推动了机器人技术的进步。这些进步扩大了电池的续航里程,改进了计算机视觉,并极大地促进了理解如何让机器人执行诸如爬楼梯、识别物体或在滑倒时保持平衡等任务。然而,我们所看到的类人机器人所做的所有动作背后都隐藏着一个公开的秘密——每个动作都经过精心规划,并基于一长串具体的操作步骤。你所看到的只是实验室实验的成果,直到机器人能够完美地执行这些规划好的动作。

这种学习需要大量时间,而且难以适应机器人可能遇到的所有极端情况。在需要巨大行动自由的机器人系统中,构建一个能够在不受控制的环境中工作的类人机器人实在太复杂了。正因如此,那些能够在野外独立操作且物理能力非常有限的机器人——无人机、吸尘器和机器人服务员——正处于发展的前沿。类人机器人现在才刚刚能够在仓库或实验室等严格受控的环境中迈出第一步。

但近年来,新技术已进入机器人领域,有望带来重大变革,其中首当其冲的是“强化学习”。这是一种自主学习方法,机器人会尝试完成分配给它的任务,如果成功,系统会给予“奖励”,如果失败,则会遭受“损失”。同时,开发人员使用不同的训练方法,例如“模仿学习”,他们给人类穿上特殊的服装,然后学习人类执行的整套身体动作,并将训练结果传递给机器人。随着时间的推移,新的庞大数据库被建立起来,每个动作都被数字化,并用于训练未来的机器人。

然而,这些在海量数据库中积累经验的学习方法耗时长,应用范围有限。而这正是人工智能飞跃式发展的关键所在,它使机器即使在从未遇到过的情况下也能独立完成任务。背后的秘密隐藏在像 ChatGPT 这样的语言模型中,它们只不过是根据初始命令生成单词的引擎。它们无法理解单词的含义,也无法将积累的知识应用于现实世界。但推动它们发展的突破也适用于机器人领域。这主要体现在能够分析大量示例(在本例中是人类语音示例)的能力,以及借助学习算法理解上下文并对各种问题给出连贯的答案的能力。

现在,人工智能公司正试图利用这些能力在现实世界中训练机器人。要做到这一点,人工智能必须达到一定的理解水平,使其能够在现实世界中接受训练,就像学习人类语言一样。为此,它必须扫描大量现实世界的案例,捕捉其背后的含义,并理解物体和任务之间的差异。这将使它能够进行自我训练,并将知识传递给其他机器人。这项技术飞跃的目标并非让任何机器人都能执行任何任务,而是让机器人能够更快地移动和适应新环境,并相互训练以执行任务——例如ChatGPT能够与人类互动并理解对话上下文。如果这些能力能够用于人形机器人的开发,将带来重大的飞跃。这项技术突破已经在英伟达开发的机器人学习平台上得到了验证,该平台目前已被许多机器人公司使用,使机器人能够在虚拟世界中相互训练并获得更多技能。

然而,普通机器人要达到人类的期望并充分发挥类人机器人所蕴含的潜力,还有很长的路要走。“一些初创公司声称他们正在打造具有通用行为能力的类人机器人,”Etzioni 博士指出,“但事实是,我们距离目标还很远。” 要实现预期的突破,需要一系列目前尚不具备的能力和创新。例如,该领域的主要挑战仍然是提高能源和电池效率以支持长时间运行,开发柔性材料以实现更像人类的运动,以及开发更强大的传感器来模拟人类的触觉和听觉等感官。

真正能够自主执行复杂任务的人形机器人仍在研发中,但该领域的最新进展已使这一愿景更接近现实。人工智能、机器人技术和人机交互技术的协同发展,为未来铺平了道路,机器人将成为日常生活中不可或缺的一部分,协助完成日常和复杂的任务。

网友评论
文明上网,理性发言,拒绝广告

相关资讯

关注官方微信

手机扫码看新闻