虎嗅APP 昨天
GPU撑不起万亿野心,英伟达正在“格式化”数据中心
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

出品 | 虎嗅科技组

作者 | 梁卡尔

编辑 | 苗正卿

头图 | 视觉中国

身穿标志性黑色皮衣,英伟达首席执行官黄仁勋再次站在美国加州圣何塞 SAP 中心,这一次他要讲的是,对这家公司来说 GPU(图形处理器)不再是唯一主角。

北京时间 3 月 17 日凌晨 2 时,年度开发者大会 GTC2026 首日主题演讲环节,黄仁勋用了两个多小时时间向外界回答,英伟达如何在人工智能巨变中生存下去,并保持领先地位。

他预计,到 2027 年底,其 Blackwell 和 Rubin 芯片将至少创造 1 万亿美元收入。在此之前,该公司曾预计,到 2026 年底,这些芯片带来的收入是 5000 亿美元。也就是说,这个展望不仅向后延长了一年,总量也翻了一倍。

受此消息影响,该公司收盘时涨幅为 1.65%。这只是当天发布众多消息的冰山一角。

1993 年创立的英伟达曾长期偏安于 GPU 市场,这种平庸一直持续到黄仁勋决定每年豪掷 5 亿美元‘梭哈’ CUDA 架构。这笔钱相当于当时公司总营收的六分之一。随后,英伟达通过游说高校、赞助研究所以及向大厂科学家赠送测试卡,在硅谷工程师中催生出一套新的生态。

2012 年,当深度神经网络撞上 CPU 的算力天花板,早已卡位成功的英伟达瞬间完成了从 " 游戏配件商 " 到 "AI 基座 " 的权力交接,开启了随后业绩和股价一路狂奔。截至上述收盘时,英伟达市值已达 44522 亿美元,为全球市值最高的公司,超过第二名苹果近 1 万亿美元。

主题演讲的开端是一段长达十分钟对 CUDA 架构诞生 20 周年的回顾,黄仁勋将其定义为英伟达一切业务的 " 中心 "。他用一张图阐述了 CUDA 的飞轮效应,而其中最难实现的安装基数,如今已在全球建立起规模过亿级的计算系统,遍布各大云厂商和计算机公司的产品和服务。

但这些都只是过去,拐点已至。黄仁勋向外界展示了为 Agentic AI 打造的 Vera Rubin 平台,并宣布七款新芯片全面投产,由这些芯片协同工作将构成一台强大的 AI 超级计算机,从大模型预训练、后训练和测试时扩展,到实时智能推理,为 AI 的各个阶段提供支持。

尽管采用 3 纳米制程的 Rubin GPU 性能相比上一代也有大幅提升,但外界更加关注 CPU 的细节。这款 CPU 芯片的效率是传统机架式 CPU 的两倍,速度提升 50%,并且采用了 LPDDR5X 内存,拥有最高的单线程性能和单核带宽。

黄仁勋展示英伟达成立以来最有野心的产品组合。图片来源:视觉中国

黄仁勋称,这款 CPU 独立售卖的话,将会成为一个价值数十亿美元的业务。英伟达发布的新闻稿显示,阿里巴巴、CoreWeave、Meta 和甲骨文等云服务商,以及戴尔、惠普、联想和超威等全球系统制造商将与英伟达合作部署该芯片。

第七颗芯片 Groq 3 LPU 更是重头戏。2025 年 12 月,英伟达通过技术授权协议获得的 Groq 的技术和团队核心成员,而仅过去数个月,产品首次落地并已开始量产。对于其价值,黄仁勋的答案是,解决 GPU 在超高速 Token 生成的短板。

英伟达通过软件 Dynamo 把推理过程分成两个部分,Vera Rubin 解决前半段的预填充(Prefill)和注意力机制(Attention),后半段的解码(Decode)和 Token 生成则交由 Groq 负责。黄仁勋称其为 "Disaggregated Inference(解耦推理)",解决高吞吐和低延迟的物理矛盾。

至于能否成为黄仁勋所说的 " 致胜秘诀 ",仍需要交给时间去检验。身处大会现场的 Forrester 副总裁、首席分析师戴鲲告诉虎嗅,英伟达在 CPU 和 LPU 的布局并非简单扩展产品线,而是将竞争从单芯片性能上移到系统架构层面,客观上已正面进入 AMD 与英特尔在数据中心 CPU 与异构系统层的主战场。

英伟达要为龙虾补短板,推向企业级。图片来源:英伟达官网

在一些秀肌肉动作之后,黄仁勋再度炸场," 如今世界上的每一家公司都需要制定 OpenClaw 战略。这就是新一代计算机 ",甚至他将 OpenClaw 视为个人人工智能的操作系统,而每一家 SaaS(软件即服务)公司也将变成 AgaaS(智能体即服务)公司。

黄仁勋用操作系统的视角解读了 OpenClaw 的本质。事实上,OpenClaw 仅上线数周,却已超过了 Linux 三十年累积的下载量,并在 GitHub 星标数已突破 25 万,成为增长最快的开源项目。但他也指出了 OpenClaw 在企业场景存在致命的安全问题。

英伟达与 OpenClaw 的开发者 Peter Steinberger 合作,推出了 NemoClaw 软件工具包。通过安装 OpenShell,提供缺失的基础架构,通过沙箱、隐私和安全护栏,使其拥有高效运行所需的访问权,同时强制执行基于策略的安全、网络和隐私防护措施。黄仁勋称,其现在已具备企业级应用的条件了。

戴鲲表示,对英伟达而言,Agentic AI 时代,借助这一轮 OpenClaw 的全球热潮,抢占 Runtime(运行时)和操作系统级的关键标准位置。通过降低 Agent 部署门槛并推动其全天候运行,NemoClaw 将直接放大推理负载和算力消耗,从而反向强化 GPU、CPU 和 LPU 的长期需求,延续英伟达一贯的平台驱动算力的战略逻辑。

热度之外,英伟达并没有忘记最初的原点。黄仁勋称,GeForce 就是用来吸引未来用户的,在他们还买不起企业级产品时,游戏显卡是主要面向其销售的产品。

在主题演讲的开端,英伟达展示了一组最新产品改变游戏渲染的对比。其发布了 DLSS 5,这是该公司自 2018 年推出实时光线追踪技术以来在计算机图形领域取得的最重大的突破。

根据官方说法,DLSS 5 引入了一种实时神经渲染模型,能够为像素注入逼真的光照和材质效果。DLSS 5 缩减了渲染与现实之间的鸿沟,使游戏开发者能够打造出前所未有的逼真计算机图形,而这种效果以往只有在好莱坞视觉特效领域才能实现。

此外,在这场主题演讲中,黄仁勋还透露一系列新的变化:下一代计算架构 Feynman(费曼)取得核心突破,将联合开发部署在太空的数据中心计算机,自动驾驶平台新增比亚迪、吉利、五十铃、日产等 L4 级自动驾驶汽车伙伴,以及与 ABB、Universal Robots、库卡等企业在工业机器人领域的合作。

演讲尾声,由英伟达、DeepMind 和迪士尼合作设计的动画系列《冰雪奇缘》中雪宝机器人版本蹒跚地上舞台,和黄仁勋就英伟达旗下 Omniverse 部门展开了一段对话。这三家公司联合研发了一套物理仿真系统。黄仁勋说,未来迪士尼乐园所有角色都将拥有真正的智能,与游客展开真实的互动。

就像黄仁勋那件从不更换的黑色皮衣一样,英伟达现在的商业逻辑非常简单且确定,就是在绝对的算力与生态封锁面前,所有的后来者都只能在英伟达的阴影里缓慢前行。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

英伟达 gpu 黄仁勋 芯片 ai
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论