NVIDIA 已经在 GTC 2025 上公布了下一代 Rubin GPU 的部分消息,不过现在看起来 AI 实在是太过于火爆,导致 NVIDIA 即使没有正式发布 Rubin GPU,但是产品先给大家安排上。就在今天,NVIDIA 发布了为 LLM 中上下文处理所打造的专用 GPU —— Rubin CPX,将会采用下一代的架构设计,能够实现数倍的性能提升,当然需要到 2026 年才能跟大家正式见面。
NVIDIA 表示在文本推理方面,包括了 AI 提示以及生成响应,其中随着提示词越来越多和复杂,导致 GPU 的算力有些跟不上,因此需要一款特别打造的专用 GPU 来专门负责提示词与上下文本的理解,而 Rubin CPX 就是这样一款产品。未来 Rubin CPX 将会成为下一代 Vera Rubin 平台的一部分,搭载 Vera CPU 以及 Rubin GPU,满血 Vera Rubin 平台最高拥有 8EFLOPS 的 AI 算力。
Rubin CPX 能够拥有 128GB 的 GDDR7 显存,在专注力性能上与上代相比提升 3 倍,同时 NVFP4 算力可以达到 30PFLOPS,当然 NVIDIA 还表示 Rubin CPX 除了硬件之外,还将获得 NVIDIA 打造的一整套软件栈,包括开放模型,专门为企业 AI 任务打造。
只不过虽然今天 NVIDIA 已经发布了这款产品,但是具体发售需要等到 2026 年,至于为什么这么早就发布这款产品,很显然 NVIDIA 希望尽早获得相关厂商的订单,毕竟现在 AI 硬件供不应求,早点给订单,NVIDIA 就可以早点去生产相关的产品。
登录后才可以发布评论哦
打开小程序可以发布评论哦