揭秘英伟达GTC 2025:AI算力、硬件、机器人生态全面升级,GTC 2025:黄仁勋引领AI迈向新高度,英伟达大招不断!

本文围绕英伟达GTC 2025开幕主题演讲展开,介绍了黄仁勋对GTC的定位,阐述了AI技术发展路径、Token需求变化、新黄氏定律曲线等概念,还介绍了英伟达在硬件、机器人领域的新成果和布局。

一直以来,「AI届春晚」都是GTC广为人知的外号之一。然而,在GTC 2025的开幕主题演讲中,英伟达创始人、那个爱穿皮衣的黄仁勋(大家亲切地称他为老黄),给了GTC一个新的定位。老黄说道:「我觉得GTC已经变成了AI界的超级碗。」他用这样形象的比喻,生动地描绘出了GTC如今在AI领域的重要地位和盛大场面。同时,他还满怀信心地表示:「但在这里,AI会让我们每个人都成为赢家。」

揭秘英伟达GTC 2025:AI算力、硬件、机器人生态全面升级,GTC 2025:黄仁勋引领AI迈向新高度,英伟达大招不断!

黄仁勋秀出了AI技术发展的路径|图片来源:英伟达

回顾AI技术的发展历程,我们会发现每一代AI技术的迁移,都会带来计算方式的改变。从早期的AlexNet到如今火爆全球的ChatGPT,计算方式已经从检索式转变为生成式。而当AI从ChatGPT这种靠预测下一个tokens、且大概率会出现幻觉的生成式AI,迈向Deep Research、Manus这样的agentic AI应用时,每一层的计算都发生了显著变化。在Agentic AI应用中,上一个token是下一个token生成时输入的上下文,涉及感知、规划、行动的一步步推理,所需要的tokens比想象的多100倍。这意味着,我们现在所处的Agentic AI时代,AI正经历着一个新的拐点,它变得越来越智能、应用也越来越广泛,但同时也对算力提出了更高的要求。

为了更直观地说明这一变化,老黄用同一段提示词,在代表两种技术范式的开源模型——Llama3.3和Deepseek – R1上所消耗的tokens举例。这段提示词是:「在我的婚宴上,需要7个人围着一张桌子坐,我的父母和岳父岳母不应该坐在一起。而且,我媳妇坚持说她坐在我左边照相时会更好看,但同时我需要坐在伴郎旁边。我们这一轮怎么坐?如果我们邀请牧师和我们坐在一起呢?」结果显示,以强化学习为主导的推理类应用,消耗的tokens越来越多,同时也让AI应用变得越来越可用。

揭秘英伟达GTC 2025:AI算力、硬件、机器人生态全面升级,GTC 2025:黄仁勋引领AI迈向新高度,英伟达大招不断!

长思考的模型对于Token的需求有数倍提升|图片来源:英伟达

老黄还指出,除了预训练和后训练(微调),测试时的Scaling Law才刚刚开始。这里的Scaling Law指的是在模型推理阶段,动态分配计算资源以提升性能。例如,根据问题复杂度自动延长「思考时间」,或通过多次推理生成多个候选答案并择优输出。在英伟达GTC的一篇官方博文中,Tokens(词元)被视为AI的语言与货币,它是AI在训练和推理过程中处理的数据单位,贯穿于预测、生成和推理的每一个场景。

在老黄看来,加速AI工作负载的新型数据中心「AI工厂」,其核心任务就是高效地处理这些tokens,将其从AI语言转换为AI货币——即智能。通过软硬一体优化,以更低的计算成本处理更多tokens。当更复杂、智能的推理模型需要更快、更多地吞吐tokens时,能否拥有一套软硬兼施的计算系统让其更加高效,就成为了AI应用能否盈利的关键。这就是Agentic AI下,新黄氏定律曲线。

揭秘英伟达GTC 2025:AI算力、硬件、机器人生态全面升级,GTC 2025:黄仁勋引领AI迈向新高度,英伟达大招不断!

黄仁勋讲解Dynamo如何实现pd分离 | 图片来源:英伟达

为了让一个更大的模型更高效地产出更多tokens,这本身已经成为了一个工程学问题。各家都在积极探索,拿出了不同的方案,比如合理利用流水线并行、张量并行、专家并行、在途批量化、pd分离、工作负载管理,以及管理KV cache等。英伟达此次也推出了自己的方案——Dynamo。黄仁勋把这个推理服务库比作新时代的VMware,它能够自动编排如何让AI在推理时代运行得更好,每秒能产生更多tokens。

接下来,黄仁勋直接对需要采购英伟达产品的数据中心喊话:「未来的每一个数据中心都会受到功耗的限制。你的营收也会受到功耗的限制,你能使用的电力就能推算出潜在营收。采用Blackwell,你在同样电力下,能收获更好的性能;再加上Dynamo,Blackwell将能进一步优化——Hopper也能优化,但是没那么多。」按照英伟达的说法,使用Dynamo优化推理,能让Blackwell上的DeepSeek – R1的吞吐量提升30倍,而且Dynamo完全开源。

揭秘英伟达GTC 2025:AI算力、硬件、机器人生态全面升级,GTC 2025:黄仁勋引领AI迈向新高度,英伟达大招不断!

100兆瓦数据中心算账题|图片来源:英伟达

在硬件领域,老黄还带来了新的惊喜。他宣布了其Blackwell AI工厂平台的下一个演进版本——Blackwell Ultra,旨在进一步提升AI推理能力。与现存的Blackwell不同,Blackwell Ultra是专为AI推理而设计的。在DeepSeek R1发布之后,目前OpenAI o1与Google Gemini 2.0 Flash Thinking都是已经上市的推理模型产品。

Blackwell Ultra具体包含GB300 NVL72和HGX B300 NVL16系统,其AI性能比其前代产品高出1.5倍。GB300 NVL72在一个机架规模设计中连接了72个Blackwell Ultra GPU和36个基于Arm Neoverse的NVIDIA Grace CPU。与Hopper一代相比,HGX B300 NVL16在大型语言模型上提供了快11倍的推理速度,多7倍的计算能力和4倍的内存,同样支持一道发布的NVIDIA Dynamo推理框架。

揭秘英伟达GTC 2025:AI算力、硬件、机器人生态全面升级,GTC 2025:黄仁勋引领AI迈向新高度,英伟达大招不断!

下一代AI芯片代号为Rubin | 图片来源:英伟达

Rubin NVL144机架,将与现有的Blackwell NVL72基础设施直接兼容。而Rubin Ultra的整个机架将被新的布局NVL576取代,一个机架最多可容纳576个GPU。

除了这些芯片迭代的消息,英伟达还第一次公开了其光芯片在AI计算领域的进展,老黄将其称之为「下一代人工智能的基础设施」。硅光芯片具有高运算速度、低功耗、低时延等特点,且不必追求工艺尺寸的极限缩小,在制造工艺上,也不必像电子芯片那样严苛,必须使用极紫外光刻机(也就是因为「芯片战争」,被大众所熟知的EUV)。

目前,英伟达并未直接将光芯片技术应用于AI芯片上,而是与台积电(TSMC)合作,采用台积电的硅光子平台Compact Universal Photonic Engine (COUPE),该平台使用台积电的SoIC – X封装技术,同时结合了电子集成电路(EIC)与光子集成电路(PIC),打造出两款名为Spectrum – X和Quantum – X采用硅光子技术的交换机。随着「人工智能工厂」在世界各地兴建,能耗与运营成本已经成为困扰巨型数据中心继续拓展的关键问题,因此英伟达也在用硅光子技术来尝试进一步优化现有的巨型数据中心。这些场景正是硅光子技术大显身手的地方,硅光子芯片有潜力彻底改变数据处理速度,同时加快推动量子计算技术的发展,还将为数据中心的GPU集群节省数兆瓦的能源。黄仁勋表示:「人工智能工厂是一种具有极端规模的新型数据中心,网络基础设施必须进行改造以跟上步伐。」

揭秘英伟达GTC 2025:AI算力、硬件、机器人生态全面升级,GTC 2025:黄仁勋引领AI迈向新高度,英伟达大招不断!

直到2028年的英伟达AI芯片硬件路线图 | 图片来源:英伟达

根据老黄公布的路线图,Feynman架构将于2028年登场,或许到那个时候,我们真的能看到量子计算技术出现重大突破。

英伟达在机器人领域的布局也在持续推进。去年老黄在GTC上伸出手臂和一排人形机器人站在一起的画面,已经成为经典一幕。而今年,仿真数据和机器人仍然出现在GTC的各个角落中。甚至在演讲的一开始,老黄的讲稿中就直接把物理AI放在了AI发展的最高点上。

揭秘英伟达GTC 2025:AI算力、硬件、机器人生态全面升级,GTC 2025:黄仁勋引领AI迈向新高度,英伟达大招不断!

揭秘英伟达GTC 2025:AI算力、硬件、机器人生态全面升级,GTC 2025:黄仁勋引领AI迈向新高度,英伟达大招不断!

Groot N1架构 | 图片来源:英伟达

需要指出的是,Groot N1本身并不是一个重大的技术突破,之前FigureAI的Helix等模型,都是采取了类似的双系统架构。英伟达明显希望通过将一套先进的模型开源,再加上完整的合成数据生成与机器人学习管道,让人形机器人开发者可以在全球各个行业的不同环境和任务场景中对Groot N1进行后期训练,就像DeepSeek对人工智能产业的带动一样。英伟达在机器人领域的进展十分迅速,一直在不断补齐产业链上的每一个空缺,似乎要让机器人开发变得像目前的AI应用开发一样容易才肯罢休。

专门针对机器人的研发,今年英伟达还与DeepMind、迪士尼研究院(Disney Research)共同合作,联合推出了一款新的物理引擎Newton。

揭秘英伟达GTC 2025:AI算力、硬件、机器人生态全面升级,GTC 2025:黄仁勋引领AI迈向新高度,英伟达大招不断!

演讲结束前的经典画面|图片来源:光轮智能创始人&CEO谢晨

在GTC主演讲结束之前,老黄在视频播放的间隙,摆了一个Pose。你可以说这很随性,但从某种意义上来看,这个经典画面明显是名画「创造亚当」的一个镜像,可能会在以后AI科技的历史中不断出现。

本文详细介绍了英伟达GTC 2025的相关情况,包括黄仁勋对GTC的新定位,AI技术发展路径及Token需求变化引出的新黄氏定律曲线,英伟达在硬件方面推出的新平台和芯片,光芯片的进展,以及在机器人领域的持续布局和成果。展现了英伟达在AI领域的全面发力和技术实力,预示着AI产业将迎来新的发展阶段。

原创文章,作者:东京迎荷,如若转载,请注明出处:https://www.xiaoyaoxin.com/archives/1223.html

(0)
东京迎荷东京迎荷
上一篇 2025年3月19日
下一篇 2025年3月19日

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注