本文聚焦2025中关村论坛年会的热点——具身智能,介绍了智源研究院发布的跨本体具身大小脑协作框架RoboOS与开源具身大脑RoboBrain,阐述了多模态大模型对具身智能的影响,探讨了人形机器人的发展现状与挑战,还对实现广泛意义上的AGI进行了预测。
在2025中关村论坛年会上,具身智能毫无疑问成为了最热门的话题之一。3月29日,智源研究院在“未来人工智能先锋论坛”这一重要平台上,有了令人瞩目的举动——发布了首个跨本体具身大小脑协作框架RoboOS以及开源具身大脑RoboBrain。
智源研究院院长王仲远在接受媒体采访时,深入剖析了多模态大模型技术给具身智能带来的变化。他指出,多模态大模型技术如同给具身智能注入了新的活力,能让机器人更快、更高效地拥有“大脑”,进而具备更强的智能。
多模态大模型让机器人具备更强智能
王仲远介绍道,大语言模型在理解和推理能力方面已经达到了相当高的水准,在某些领域甚至可以和硕士或博士的水平相媲美,并且已经从实验室走向了产业界。然而,随着互联网文本数据基本被挖掘殆尽,大语言基础模型的性能提升速度逐渐放缓。
在现实世界里,存在着海量的多模态数据,像流程图、医疗领域的X光片数据、CT数据以及各行业的传感器数据等。多模态大模型就像是给人工智能装上了“眼睛”和“感知器”,能让它真正看到、理解、感知世界,从数字世界迈向物理世界,与物理世界中的硬件紧密结合,这也就是具身智能的体现。
王仲远还提到,具身智能这一概念虽然出现较早,但传统研究者和从AI大模型领域转向具身智能的研究者,在技术路线上并未完全达成一致。传统机器人训练大量采用强化学习的方法,通过不断重复练习,教会机器人抓杯子、倒水、写毛笔字等技能。但这种方式训练出来的人形机器人,泛化性相对较弱。
而大模型技术,尤其是多模态大模型技术,为具身智能带来了新的转机。它有助于机器人更快、更高效地形成“大脑”,从而拥有更强的智能。
具身多模态大脑模型RoboBrain开源
当天下午,智源研究院正式发布了跨本体具身大小脑协作框架RoboOS与开源具身大脑RoboBrain。这一成果意义非凡,它能够实现跨场景多任务的轻量化快速部署以及跨本体协作,推动单机智能向群体智能迈进。王仲远解释说:“简单来讲,它可以支持不同构型、不同品牌的机器人。不管是单臂机器人、双臂机器人,还是轮式机器人、人形机器人,都可以使用我们的具身大脑。”
RoboBrain能够赋予这些硬件一定的泛化智能。作为面向具身智能应用领域的多模态大模型,它能帮助机器人真正“看到”这个世界,对人类发出的指令进行拆解、逻辑推理和规划决策,再分配给不同的小脑模型来执行。王仲远表示:“这是我们把多模态大模型向具身智能进行落地的一个尝试。”
目前,RoboBrain已经展现出了强大的适应性,它能够解读人类指令和视觉图像,生成基于实时图像反馈的行动计划和评估,预测每一步的轨迹并感知相应的可操作区域。它可以支持松灵双臂、睿尔曼单/双臂、智元人形、宇树人形等不同类型的具身本体。
为了推动整个行业的发展,智源研究院决定将具身多模态大脑模型RoboBrain开源。王仲远认为,开源一直是推动计算机行业乃至人工智能行业过去几十年快速发展的核心动力。“开源能够让我们的研究站在巨人的肩膀上,减少资源的浪费和无效的工作。不少商业化公司也探索出了开源与闭源结合的商业化模式。”他希望能够与本体的厂商、模型的厂商、应用的厂商一起协作,促进整个具身智能行业更好更快发展。
实现广泛意义上的AGI至少还需5 – 10年
针对当前人形机器人赛道扎堆的现象,王仲远进行了分析。他指出,行业内不少机器人公司选择迭代轮式构型的人形机器人,以此来避免双足机器人不稳定带来的能力局限。但从长远角度看,人形机器人具有独特的优势,其与人的构型相似,能更好地适应社会基础设施,还能从海量互联网数据中学习人类技能,有利于具身智能和具身大脑模型的迭代。
不过,短期内人形机器人在产业落地方面仍面临诸多挑战。很多机器人目前还仅仅处于“能走”的阶段,正朝着“走得快、走得稳”的目标努力。
王仲远预测,今年人工智能应用有望迎来大规模爆发,尤其是大语言模型的落地应用。中国拥有海量的应用场景,将加速这一进程。但多模态大模型目前仍处于相对早期的阶段,要实现广泛意义上的AGI(通用人工智能)可能还需要5 – 10年,甚至更长时间,这取决于本体能力、世界模型构建和数据等多方面因素。
当谈及实现AGI还有多久时,王仲远表示,让人工智能理解人类的语言、解决实际生活中的具体问题,如做饭、洗碗等,距离实现这种程度的AGI还有很长的路要走。在这个过程中,依赖于本体的能力、对世界模型构建的进展以及不同落地场景中数据的积累等。多模态大模型和世界模型是实现真正AGI的必经之路。
本文围绕2025中关村论坛上智源研究院的成果发布,深入探讨了具身智能的发展。多模态大模型为具身智能带来新机遇,开源具身大脑RoboBrain推动行业协作发展。人形机器人虽有长远优势,但短期落地面临挑战。实现广泛意义上的AGI尚需时日,取决于多方面因素。
原创文章,作者:甜雅mio,如若转载,请注明出处:https://www.xiaoyaoxin.com/archives/8886.html