快科技 5 月 19 日消息,NVIDIA 副总裁、CUDA 之父 Ian Buck 亲手将首批 Vera CPU 交付给 Anthropic、OpenAI、SpaceX、Oracle,标志着 NVIDIA 首款自研数据中心 CPU 正式离开实验室,进入客户部署阶段。
Vera CPU 是 Grace 处理器的继任者,专为智能体 AI 工作负载设计,但与 Grace 主要作为 GPU 的配套主机处理器不同,Vera 被赋予了更明确的独立角色,主要负责智能体工作负载中的编排调度、工具调用、强化学习训练、数据分析、智能体沙箱隔离和长上下文状态管理等任务。

芯片采用 NVIDIA 下一代定制 Arm 架构 Olympus,配备 88 核 176 线程,系统内存达 1.5TB(3 倍于 Grace),内存带宽 1.2TB/s,NVLink-C2C 互联带宽 1.8TB/s,支持机架级机密计算。
NVIDIA 称其单核满载性能较 Grace 提升 50%,数据处理、压缩和 CI/CD 性能达到 Grace 的 2 倍。
在内存方案上,Vera 是全球首款采用 LPDDR5 内存的数据中心 CPU,使用 SOCAMM 封装的 LPDDR5X 模组。
传统数据中心 CPU 普遍依赖 DDR5 或 HBM,而 LPDDR5 此前几乎只出现在移动设备和轻薄本中。

NVIDIA 选择这条路线的逻辑在于能效,LPDDR5 在提供高带宽的同时功耗明显低于 DDR5,NVIDIA 宣称 Vera 的每瓦性能处于行业领先水平。
不过,1.5TB 的内存容量也意味着单颗 Vera CPU 将消耗大量 LPDDR5X,随着 Vera 大规模出货,LPDDR5X DRAM 的需求预计将显著增长,供应链可能面临进一步收紧。
首批客户名单此前已有部分披露,上周报道称 CoreWeave、Meta 等将成为 Vera 早期采用者,Oracle 同样在列,加上此次实际交付的 Anthropic、OpenAI 和 SpaceX,Vera 的早期客户已覆盖当前 AI 行业最具影响力的几家公司。
Vera CPU 将以两种形态交付:独立的 LPX 服务器,以及作为 Vera Rubin NVL72 机架的主机处理器。
NVIDIA 不仅将 Vera 集成到 Vera Rubin 平台中,还将单独销售 Vera CPU,并预计这将开辟一个新的数十亿美元级业务线。






登录后才可以发布评论哦
打开小程序可以发布评论哦