黄仁勋官宣：三大厂量产HBM4，英伟达Vera Rubin今秋出货

英伟达创始人兼 CEO 黄仁勋周五抵达首尔，释放了关于 AI 基础设施周期的明确信号：三星电子、SK 海力士和美光科技均已通过认证，进入高带宽内存 4（HBM4）的量产阶段，全力支援英伟达 Vera Rubin AI 服务器平台。首批系统计划于 2026 年第三季度正式出货。

" 所有三家供应商都已通过认证并投入生产。" 黄仁勋在结束 Computex 2026 行程后对记者表示。这一表态终结了市场长达数月的猜测，也是黄仁勋首次公开确认这三家巨头将在同一平台上交付 HBM4。

Vera Rubin 全面投产，产能下半年显著爬坡

继 6 月 1 日黄仁勋在 GTC 宣布发货计划后，Vera Rubin 已进入全面生产阶段。黄仁勋指出，2026 年下半年将是主要的产能爬坡期，产量将显著高于上半年，并为明年更大的规模做准备。这需要 DRAM 和 HBM 供应链之间的高度协同。

HBM4 架构突破：带宽翻倍，延迟降低

HBM4 并非简单的速度升级，而是结构性突破。根据 JEDEC 标准，HBM4 将内存接口宽度从 HBM3E 的 1,024 位翻倍至 2,048 位，独立数据通道从 16 个增至 32 个。这使得每个内存堆栈在基准规范下至少提供 2 TB/s 带宽。

三星量产的 HBM4 采用 4 纳米逻辑介子和 12 层 DRAM 堆叠，每引脚速度达 11.7 Gbps，总带宽高达 3.3 TB/s。该架构分离命令总线与数据总线，旨在降低大规模 AI 训练和推理中的延迟。每个 Vera Rubin NVL72 机架配备 20.7 TB HBM4 内存，聚合带宽达 1.6 PB/s，较 Grace Blackwell 系统的 8 TB/s 提升超过 2.7 倍。

制造工艺是主要瓶颈。HBM4 利用硅通孔（TSV）垂直堆叠 DRAM，12 层堆叠要求单层硅介子厚度减薄至约 50 微米。三星和 SK 海力士正竞相开发用于 2027 年 Vera Rubin Ultra 平台的 16 层堆叠技术，需将厚度进一步减至约 30 微米，同时保持封装高度符合标准。

专为 " 代理型 AI" 打造，能效提升十倍

Vera Rubin 并非 Grace Blackwell 的加速版，而是专为 " 代理型 AI"（agentic AI）构建的新类别系统，旨在处理触发数百甚至数千个自主推理步骤的复杂任务。

每个 NVL72 机架整合 72 个 Rubin GPU 和 36 个 Vera CPU，采用液冷设计。单个 Rubin GPU 拥有 3360 亿个晶体管，提供 50 PFLOPS 的 NVFP4 推理性能。通过 NVLink 6 互联，全对全扩展带宽达 3.6 TB/s，是 Blackwell 中 NVLink 5 的两倍以上。英伟达数据显示，相比 Grace Blackwell，Vera Rubin 每瓦推理吞吐量提高 10 倍，每个推理令牌成本降低 10 倍，训练大型混合专家模型所需 GPU 数量减少四分之三。对于年电费可能超 200 万美元的超大规模数据中心而言，这一效率提升至关重要。

黄仁勋确认，随着 Vera Rubin 产能提升，Grace Blackwell 也在成功部署，两代产品将在供应窗口上重叠，而非简单替代。

三方角逐：SK 海力士领跑，三星技术激进

行业分析师估计，在 Vera Rubin 的 HBM4 供应中，SK 海力士占据 60% 至 70% 份额，三星约占 25% 至 30%，美光供应剩余部分。SK 海力士凭借在前几代产品中的主导地位，截至 2025 年中已占据整体 HBM 市场约 62% 的份额。

三星率先实现 HBM4 大规模生产，并于 2026 年 2 月宣布商业出货，其 3.3 TB/s 的规格为目前最快。三星还首家交付了目标带宽 3.6 TB/s 的 HBM4E 样品。然而，三星采用的混合键合技术虽能降低电阻、提高信号密度，但早期面临良率挑战。相比之下，SK 海力士采用的大规模回流模制底部填充（Mass Reflow Molded Underfill）工艺更易于规模化，这解释了为何三星的技术优势未完全转化为市场份额。

美光作为关键的第三方供应商，承诺售尽其 2026 年的 HBM 生产能力，预计 HBM 年化收入运行率接近 80 亿美元。

布局韩国：研发中心与 RTX Spark 亮相

黄仁勋此行还宣布启动首尔研发中心的招聘，未来将建设实体站点，专注于物理 AI 和机器人研究。韩国先进的制造能力与 AI 结合，被视为物理 AI 时代的关键基石。英伟达的 Jetson Thor 机器人处理器已在现代汽车集团和 LG 得到应用。

在首尔期间，黄仁勋与 SK 集团、LG 集团和 Naver 的高层共进晚餐，并探访电竞咖啡馆 T1 Base Camp，会见《英雄联盟》传奇选手 Faker，赠送签名的 GeForce RTX 5090 显卡。此举旨在推广 RTX Spark ——英伟达新一代 AI 笔记本超级芯片。

RTX Spark 基于台积电 3 纳米工艺，集成 20 核 Grace Arm CPU 和 Blackwell GPU，拥有 700 亿晶体管，提供 1 PFLOPS 的 FP4 AI 性能。通过 NVLink-C2C 以 600 GB/s 速度连接 CPU 和 GPU，并配备 128 GB 统一 LPDDR5X 内存，消除了数据传输瓶颈，使笔记本能在本地运行大型 AI 代理。RTX Spark 笔记本电脑预计将于 2026 年秋季上市。

【星途科讯图文丨钟离寻】