当前的英伟达面临挑战。在刚刚过去不久的美股 " 黑色星期一 " 上,美股 " 七姐妹 "(美国科技股七巨头)总市值单日缩水近 7600 亿美元(约合人民币 5.5 万亿元)。其中,英伟达跌幅超 5%,从年初至今股价下跌超过 20%,市值与高峰期相比缩水近万亿美元。DeepSeek 议题的持续发酵,服务器厂商的不断开发并推出专有 AI 芯片,以及大客户如微软等需求的不确定性,均是英伟达不得不面对的重要挑战。即使是英伟达在 AI 芯片领域占据的有利位置,也需要不断进行策略调整,以适应变化的市场形势。
3 月 19 日凌晨,英伟达 CEO 黄仁勋在 GTC 2025 上发表主题演讲,除发布新一代 Blackwell Ultra 架构 GB300 系列芯片外,还公布了四年三代 GPU 架构的技术路线图,此外还包括在人形机器人、自动驾驶、量子计算等方面的布局。可以看出英伟达希望通过推出高性能、低功耗的产品,保持其在通用 AI 芯片市场的优势,同时加大在芯片、网络等领域的全面布局,巩固了其在 AI 算力领域的领先地位。不过,资本市场似乎并没有买账,上述产品并未超出人们此前的预期,在其演讲期间,英伟达股价持续走低,最终收跌 3.43%。
Blackwell Ultra(GB300)正式登场
毫无疑问,英伟达新一代 Blackwell Ultra 架构的 GB300 系列芯片是本届 GTC 的最大热点。其将配备 8 组 12-Hi HBM3E 内存,提供高达 288GB 的板载内存,性能相比上一代产品提升 50%。
系统方面,其拥有 GB300 NVL72 机架级和 B300 NVL16 系统两个版本。GB300 NVL72 可连接 72 块 Blackwell Ultra GPU 和 36 块 Grace CPU,采用机架式设计,密集 FP4 推理算力达到 1.1EFLOPS,FP8 训练算力达到 0.36EFLOPS,是 GB200 NVL72 的 1.5 倍。而根据新闻稿,HGX B300 NVL16 在大型语言模型推理方面的速度比 Hopper 快 11 倍,提供 7 倍的算力和 4 倍的内存,能够为 AI 推理等最复杂的工作负载带来突破性的性能提升。
英伟达合作伙伴预计将从 2025 年下半年起提供基于 Blackwell Ultra 的产品。针对市场进行展望时,黄仁勋表示,Blackwell 芯片推出一年来,AI 行业取得了巨大进展,AI 功能越来越强大了。2024 年全球前四大云服务提供商共采购 130 万片 Hopper 架构芯片。2025 年,它们又购买了 360 万 Blackwell 芯片。黄仁勋预计,2028 年,建设数据中心投入的资本支出将超过 1 万亿美元。
不过,英伟达的 GB200 和 B200 芯片从设计到出货的过程经历波折,初期就因芯片设计缺陷问题导致出货延迟,后又因 CoWoS-L 制程良率较低,初期仅有约 60%,远低于 CoWoS-S 的 90% 以上水平,这进一步影响了产能。黄仁勋在去年 12 月确认,GB200 已进入满载生产阶段,并计划在今年第一季度实现大规模出货。但用户会不会跳过 GB200/B200,而转向下一代 GB300?这是一个值得观察的要点。
发布 " 四年三代 " 技术路线图
在演讲中,黄仁勋还公布了 Blackwell 之后下一代 GPU 架构 Rubin 的路线规划,包括 Vera Rubin 和 Rubin Ultra 两代产品。Vera Rubin 由 Rubin GPU 和 Vera CPU 组成,Vera CPU 拥有 88 个定制 Arm 核心、176 个线程;Rubin GPU 由两颗 GPU 裸 Die 拼接,拥有 288GB HBM4 内存,FP4 峰值推理能力可达 50PFLOPS。Rubin Ultra 系统由 Rubin Ultra GPU 和 Vera CPU 组成,Rubin Ultra GPU 将由 4 颗 GPU 裸 Die 拼接,拥有 1TB HBM4e 内存,FP4 峰值推理能力可达 100PFLOPS。
英伟达预计,Vera Rubin 的平台将于 2026 年下半年开始出货,机架方案分别为 Vera Rubin NVL144 和 Rubin Ultra NVL576。Vera Rubin NVLink 144 的性能将是 GB300 NVL 72 的 3.3 倍。Rubin Ultra NVL576 将于 2027 年下半年推出,能够进行 15EF 的 FP4 推理,5 EF 的 FP8 训练,其性能约为 GB300 NVL72 的 14 倍。
黄仁勋还介绍了 Rubin 之后再下一代芯片架构—— Feynman,根据路线图,Feynman 架构将于 2028 年登场。
CPO 网络交换机 2026 年将推出
数据交换是限制 AI 算力升级的关键指标。日前就有关于英伟达将在 GTC 2025 上推出 CPO 交换机新品的消息。英伟达也不负众望,本次推出了新的 Spectrum-X 硅光子以太网交换机,作为 Spectrum-X 光子以太网和 Quantum-X 光子 InfiniBand 平台一部分,包括 128 个 800Gb/s 端口或 512 个 200Gb/s 端口,总带宽可达到 100Tb/s,以及 512 个 800Gb/s 或 2048 个 200Gb/s 端口,总吞吐量可达 400Tb/s。
人工智能迭代加速,使得具备更高带宽潜力的光互联技术受到业界广泛关注。但是在实际应用过程中,如何进行成本优化,如何解决大规模部署中的兼容性和互操作性问题等,业界的讨论仍有很多。英伟达计划 Spectrum-X 光交换机将在 2026 年推出,届时能否掀起一轮光互联技术对传统铜缆的替代同样是一个观察点。
长期布局具身智能、量子计算
英伟达将机器人视作下一个数万亿美元产业,这些年来都在重点布局。GTC2025 上,英伟达推出首个开放、可定制的通用人形推理和技能基础模型 Isaac GR00T N1。英伟达还与谷歌 DeepMind 和迪士尼研究中心合作开发开源物理引擎 Newton,用于机器人学习,预计今年晚些时候完成开发。
黄仁勋表示,通用机器人时代已经到来。借助英伟达 Isaac GR00T N1 和新的数据生成以及机器人学习框架,世界各地的机器人开发人员将开辟 AI 时代的下一个前沿。
英伟达近年来也在长期布局量子计算。英伟达将于当地时间 3 月 20 日首次举办 " 量子日(Quantum Day)" 活动。黄仁勋将与来自十多家量子计算行业领导企业的顶尖高管共聚一堂,进行小组讨论,讨论话题涵盖量子计算中现在可能和可用的技术、量子技术的发展方向等。
算力与能耗始终是 AI 大模型的发展瓶颈,量子计算被认为是解决经典 AI 系统日益增长的局限性,实现更快训练、更少能源消耗的解决方案。英伟达将展示其在量子计算领域的最新进展,包括量子计算模拟器和相关软件开发工具,进一步推动量子计算与 AI 的结合。
写在最后
人工智能的发展瞬息万变,这让英伟达亦不免需求面临诸多挑战。从 GTC2025 的一系列发布与举措来看,针对微软、谷歌等客户需求的不确定性,以及谷歌 TPU、亚马逊 Trainium 等专有 AI 芯片的竞争,英伟达希望通过推出高性能、低功耗的产品,保持其在通用 AI 芯片市场的优势。同时加大在芯片、网络等领域的全面布局,巩固了其在 AI 算力领域的领导地位。并通过具身智能、量子计算等领域的布局,为未来的技术突破和市场扩展奠定基础,抢占未来市场的先机。
然而,英特尔近日宣布了委任半导体行业资深人士陈立武作为新一任的 CEO 人选,人工智能所带来的巨大市场机会是其所必须抓住的。AMD 董事长兼执行官苏姿丰亦于日前现身北京,其宣称 AI 将是未来几年非常重要的技术。而据最新报道,谷歌准备携手联发科开发下一代张量处理单元(TPU)。
2025 年的 AI 芯片领域不仅没有止歇,反而变得越来越热闹。如何保持领先位置将是英伟达面临的主要挑战。
登录后才可以发布评论哦
打开小程序可以发布评论哦