本文围绕AI大模型与具身智能展开,智源研究院院长王仲远在接受采访时,分享了大模型幻觉问题解决路径、具身智能训练数据获取、算力走向、人形机器人投资泡沫等多个热点话题,探讨了相关技术的发展现状、挑战与未来趋势。
在AI浪潮席卷全球的当下,AI大模型与具身智能无疑成为了产业界和投资界最为关注的焦点。
论坛期间,智源研究院院长王仲远在接受21世纪经济报道记者的深入采访时,就多个热点话题进行了详细的分享,其中包括大模型幻觉问题的解决路径、具身智能训练数据的获取方式、算力的未来走向以及人形机器人投资泡沫等内容。
“幻觉”阻碍大模型从实验室走向产业落地
王仲远明确指出,尽管大模型技术已经取得了显著的进展,但是幻觉问题却成为了其从实验室迈向产业实际落地的一大阻碍。要解决这一难题,需要从提升基础模型与推理能力入手,借助通用向量、检索增强等一系列有效手段。
他特别提到,智源研究院在近两年推出的BGE模型,有效地针对了大模型幻觉问题。而且该模型采用了开源的形式,在hugingface上的下载量一直处于高位,这充分说明了其在行业内的受欢迎程度和实用性。
多模态大模型和世界模型是通往AGI的必经之路
在大模型的发展方向上,多模态大模型与世界模型被普遍视为未来的重要趋势。王仲远强调,在真实世界中,多模态数据极为丰富,仅仅依靠大语言模型来处理文字信息是远远不够的。
“目前大语言模型在理解和推理能力方面已经达到了非常高的水平,甚至在某些特定领域可以接近硕士或博士的水平。但是,它依然无法真正感知到这个世界的运行规律。”王仲远通过这样的例子进行了生动的说明。
他进一步表示,多模态大模型和世界模型是实现真正AGI(通用人工智能)的必经之路,只有通过它们,才能让人工智能更好地感知和理解这个世界。
具身智能:从数字世界迈向物理世界的桥梁
具身智能作为大模型从数字世界进入物理世界的关键方向,目前仍然面临着诸多挑战。
王仲远分析道,基础模型目前碰到了一些瓶颈。例如,当前文本数据逐渐耗尽,大语言基础模型的性能提升也开始放缓。在这种情况下,多模态大模型与物理世界硬件的结合就成为了必然的发展趋势。
他还提到,具身智能这一概念出现的时间比较早,但是传统研究者对于具身智能的理解,和从AI大模型领域转向具身智能的研究者,在技术路线上并没有完全达成共识。
传统机器人训练依然大量使用强化学习的方法,通过不断地重复练习,来教机器人完成抓杯子、倒水、写毛笔字等任务。然而,这种训练方式的泛化性相对较弱。
“但是大模型技术,尤其是多模态大模型技术,会给整个具身智能带来一些新的变量。”王仲远表示,这些技术有助于机器人更快、更高效地拥有“大脑”,从而具备更强的智能。
3月29日下午,智源研究院发布了跨本体具身大小脑协作框架RoboOS与开源具身大脑RoboBrain。这一成果可实现跨场景多任务的轻量化快速部署与跨本体协作,推动单机智能迈向群体智能,为具身智能的发展提供了底层技术支持。
机器人的“泡沫”与“人形必要性”
行业里有一种观点认为,当前70%的场景并不需要机器人具备“人形”,所以“机器人做成人形”的必要性似乎并不充分。此外,多家公司纷纷挤入人形机器人赛道,行业未来的走势也备受关注。
王仲远在一定程度上认同这一观点,他举例说明,行业内已经有不少机器人公司开始迭代轮式构型机器人,以克服双足机器人稳定性欠佳的问题。
“不过,从长远来看,人形机器人具有独特的优势。因为它与人的构型相似,能够更好地适应社会基础设施,并且可以从互联网数据中学习人类技能,推动具身智能和具身大脑模型的迭代。”王仲远进一步解释道。
然而,短期内,人形机器人在产业落地方面仍然面临着诸多挑战。目前,许多机器人还仅仅处于“能走”的阶段,要实现“走得快、走得稳”的目标,还需要花费不少时间。
数据与算力:AI产业发展的“双引擎”
数据获取与算力支撑是AI产业发展的核心要素。王仲远提到,随着文本数据的逐渐枯竭,可以通过后训练、合成数据、利用多模态数据等方式来解决数据问题。尽管获取高质量多模态数据和合成数据的成本较高,但是可以借助工程化技术和算力提升来降低成本。
提及近期对于算力的争议,王仲远认为,虽然DeepSeek技术有助于在有限算力下训练出与GPT4相当的大模型,但是算力依然不够用,大模型技术还远远没有发展到尽头。
工程优化为大规模参数模型的训练创造了条件,如果scaling law(缩放定律)有效,模型性能有望进一步提升。
产业落地与投资:短期挑战与长期机遇并存
对于具身智能产业的投资,部分投资人持悲观态度,认为存在泡沫。王仲远从研究机构的视角出发,对具身智能的长期发展充满信心。他预测,今年人工智能应用有望迎来大爆发,尤其是大语言模型的落地应用,中国海量的应用场景将加速这一进程。
然而,多模态大模型目前仍处于相对早期的阶段,要实现广泛意义上的AGI可能还需要5 – 10年甚至更长的时间,这取决于本体能力、世界模型构建和数据等多方面的因素。
在技术路线上,具身智能存在多种不同的观点,例如领域的端到端大模型和分模块解决方案。王仲远指出,具身智能的发展相对复杂,当前许多具身智能模型的泛化性有限,要实现完全端到端的具身智能可能需要较长的时间。
本文围绕AI大模型与具身智能展开,智源研究院院长王仲远就大模型幻觉、发展方向、具身智能挑战、人形机器人、数据算力以及产业投资等热点话题进行了深入探讨。虽目前面临诸多挑战,但长期来看,AI尤其是具身智能发展潜力巨大,有望在未来取得更大突破。
原创文章,作者:六合柯慧,如若转载,请注明出处:https://www.xiaoyaoxin.com/archives/8409.html