爱集微APP 03-19
GTC 2025大会无新意?看英伟达如何策略调整
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

当前的英伟达面临挑战。在刚刚过去不久的美股 " 黑色星期一 " 上,美股 " 七姐妹 "(美国科技股七巨头)总市值单日缩水近 7600 亿美元(约合人民币 5.5 万亿元)。其中,英伟达跌幅超 5%,从年初至今股价下跌超过 20%,市值与高峰期相比缩水近万亿美元。DeepSeek 议题的持续发酵,服务器厂商的不断开发并推出专有 AI 芯片,以及大客户如微软等需求的不确定性,均是英伟达不得不面对的重要挑战。即使是英伟达在 AI 芯片领域占据的有利位置,也需要不断进行策略调整,以适应变化的市场形势。

3 月 19 日凌晨,英伟达 CEO 黄仁勋在 GTC 2025 上发表主题演讲,除发布新一代 Blackwell Ultra 架构 GB300 系列芯片外,还公布了四年三代 GPU 架构的技术路线图,此外还包括在人形机器人、自动驾驶、量子计算等方面的布局。可以看出英伟达希望通过推出高性能、低功耗的产品,保持其在通用 AI 芯片市场的优势,同时加大在芯片、网络等领域的全面布局,巩固了其在 AI 算力领域的领先地位。不过,资本市场似乎并没有买账,上述产品并未超出人们此前的预期,在其演讲期间,英伟达股价持续走低,最终收跌 3.43%。

Blackwell Ultra(GB300)正式登场

毫无疑问,英伟达新一代 Blackwell Ultra 架构的 GB300 系列芯片是本届 GTC 的最大热点。其将配备 8 组 12-Hi HBM3E 内存,提供高达 288GB 的板载内存,性能相比上一代产品提升 50%。

系统方面,其拥有 GB300 NVL72 机架级和 B300 NVL16 系统两个版本。GB300 NVL72 可连接 72 块 Blackwell Ultra GPU 和 36 块 Grace CPU,采用机架式设计,密集 FP4 推理算力达到 1.1EFLOPS,FP8 训练算力达到 0.36EFLOPS,是 GB200 NVL72 的 1.5 倍。而根据新闻稿,HGX B300 NVL16 在大型语言模型推理方面的速度比 Hopper 快 11 倍,提供 7 倍的算力和 4 倍的内存,能够为 AI 推理等最复杂的工作负载带来突破性的性能提升。

英伟达合作伙伴预计将从 2025 年下半年起提供基于 Blackwell Ultra 的产品。针对市场进行展望时,黄仁勋表示,Blackwell 芯片推出一年来,AI 行业取得了巨大进展,AI 功能越来越强大了。2024 年全球前四大云服务提供商共采购 130 万片 Hopper 架构芯片。2025 年,它们又购买了 360 万 Blackwell 芯片。黄仁勋预计,2028 年,建设数据中心投入的资本支出将超过 1 万亿美元。

不过,英伟达的 GB200 和 B200 芯片从设计到出货的过程经历波折,初期就因芯片设计缺陷问题导致出货延迟,后又因 CoWoS-L 制程良率较低,初期仅有约 60%,远低于 CoWoS-S 的 90% 以上水平,这进一步影响了产能。黄仁勋在去年 12 月确认,GB200 已进入满载生产阶段,并计划在今年第一季度实现大规模出货。但用户会不会跳过 GB200/B200,而转向下一代 GB300?这是一个值得观察的要点。

发布 " 四年三代 " 技术路线图

在演讲中,黄仁勋还公布了 Blackwell 之后下一代 GPU 架构 Rubin 的路线规划,包括 Vera Rubin 和 Rubin Ultra 两代产品。Vera Rubin 由 Rubin GPU 和 Vera CPU 组成,Vera CPU 拥有 88 个定制 Arm 核心、176 个线程;Rubin GPU 由两颗 GPU 裸 Die 拼接,拥有 288GB HBM4 内存,FP4 峰值推理能力可达 50PFLOPS。Rubin Ultra 系统由 Rubin Ultra GPU 和 Vera CPU 组成,Rubin Ultra GPU 将由 4 颗 GPU 裸 Die 拼接,拥有 1TB HBM4e 内存,FP4 峰值推理能力可达 100PFLOPS。

英伟达预计,Vera Rubin 的平台将于 2026 年下半年开始出货,机架方案分别为 Vera Rubin NVL144 和 Rubin Ultra NVL576。Vera Rubin NVLink 144 的性能将是 GB300 NVL 72 的 3.3 倍。Rubin Ultra NVL576 将于 2027 年下半年推出,能够进行 15EF 的 FP4 推理,5 EF 的 FP8 训练,其性能约为 GB300 NVL72 的 14 倍。

黄仁勋还介绍了 Rubin 之后再下一代芯片架构—— Feynman,根据路线图,Feynman 架构将于 2028 年登场。

CPO 网络交换机 2026 年将推出

数据交换是限制 AI 算力升级的关键指标。日前就有关于英伟达将在 GTC 2025 上推出 CPO 交换机新品的消息。英伟达也不负众望,本次推出了新的 Spectrum-X 硅光子以太网交换机,作为 Spectrum-X 光子以太网和 Quantum-X 光子 InfiniBand 平台一部分,包括 128 个 800Gb/s 端口或 512 个 200Gb/s 端口,总带宽可达到 100Tb/s,以及 512 个 800Gb/s 或 2048 个 200Gb/s 端口,总吞吐量可达 400Tb/s。

人工智能迭代加速,使得具备更高带宽潜力的光互联技术受到业界广泛关注。但是在实际应用过程中,如何进行成本优化,如何解决大规模部署中的兼容性和互操作性问题等,业界的讨论仍有很多。英伟达计划 Spectrum-X 光交换机将在 2026 年推出,届时能否掀起一轮光互联技术对传统铜缆的替代同样是一个观察点。

长期布局具身智能、量子计算

英伟达将机器人视作下一个数万亿美元产业,这些年来都在重点布局。GTC2025 上,英伟达推出首个开放、可定制的通用人形推理和技能基础模型 Isaac GR00T N1。英伟达还与谷歌 DeepMind 和迪士尼研究中心合作开发开源物理引擎 Newton,用于机器人学习,预计今年晚些时候完成开发。

黄仁勋表示,通用机器人时代已经到来。借助英伟达 Isaac GR00T N1 和新的数据生成以及机器人学习框架,世界各地的机器人开发人员将开辟 AI 时代的下一个前沿。

英伟达近年来也在长期布局量子计算。英伟达将于当地时间 3 月 20 日首次举办 " 量子日(Quantum Day)" 活动。黄仁勋将与来自十多家量子计算行业领导企业的顶尖高管共聚一堂,进行小组讨论,讨论话题涵盖量子计算中现在可能和可用的技术、量子技术的发展方向等。

算力与能耗始终是 AI 大模型的发展瓶颈,量子计算被认为是解决经典 AI 系统日益增长的局限性,实现更快训练、更少能源消耗的解决方案。英伟达将展示其在量子计算领域的最新进展,包括量子计算模拟器和相关软件开发工具,进一步推动量子计算与 AI 的结合。

写在最后

人工智能的发展瞬息万变,这让英伟达亦不免需求面临诸多挑战。从 GTC2025 的一系列发布与举措来看,针对微软、谷歌等客户需求的不确定性,以及谷歌 TPU、亚马逊 Trainium 等专有 AI 芯片的竞争,英伟达希望通过推出高性能、低功耗的产品,保持其在通用 AI 芯片市场的优势。同时加大在芯片、网络等领域的全面布局,巩固了其在 AI 算力领域的领导地位。并通过具身智能、量子计算等领域的布局,为未来的技术突破和市场扩展奠定基础,抢占未来市场的先机。

然而,英特尔近日宣布了委任半导体行业资深人士陈立武作为新一任的 CEO 人选,人工智能所带来的巨大市场机会是其所必须抓住的。AMD 董事长兼执行官苏姿丰亦于日前现身北京,其宣称 AI 将是未来几年非常重要的技术。而据最新报道,谷歌准备携手联发科开发下一代张量处理单元(TPU)。

2025 年的 AI 芯片领域不仅没有止歇,反而变得越来越热闹。如何保持领先位置将是英伟达面临的主要挑战。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

英伟达 ai ai芯片 芯片 黄仁勋
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论