全天候科技 前天
英伟达争霸“推理时代”,新Rubin CPX GPU“1亿美元投入,50亿美元推理收入,50倍回报率”!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

本文作者:董静

来源:硬 AI

英伟达重磅推出专为长语境推理设计的全新 Rubin CPX GPU,承诺为客户带来前所未有的投资回报率!

9 月 9 日,花旗在最新研报中称,英伟达在 AI 基础设施峰会上推出专为长语境推理设计的全新 Rubin CPX GPU,承诺为客户带来前所未有的投资回报率——每投入 1 亿美元可获得 50 亿美元的推理收入,实现约 50 倍的投资回报率,远超 GB200 NVL72 的约 10 倍回报率。

英伟达超大规模与高性能计算副总裁 Ian Buck 在 AI 基础设施峰会上重申,公司致力于通过 GPU 驱动的数据中心加速生成式 AI 的采用。此次发布的 Rubin CPX 专门针对超大规模上下文处理的最高性能而设计,相比 GB300 NVL72 系统,在注意力机制方面性能提升高达 3 倍

除新 GPU 发布外,英伟达还宣布其 GB300 NVL72 机架级系统在最新的 MLPerf 推理基准测试中创造了新的推理基准记录。据花旗研究指出,通过在产品路线图中插入 Rubin CPX,英伟达正在 ASIC 竞争加剧的背景下加速其一年一度的产品发布节奏,这标志着 " 推理时代 " 已经到来

革命性的 Rubin CPX:专为推理时代打造的盈利引擎

英伟达 Rubin CPX 代表了 GPU 设计的全新类别,专门针对长语境推理进行优化。这款芯片能够处理百万级 tokens 的软件编程和生成式视频,在速度和效率方面实现突破性提升。

花旗在研报中指出,最引人注目的是其经济效益:

Rubin CPX 相比英伟达 GB300 NVL72 系统,注意力处理能力提升高达 3 倍。更重要的是,该芯片与英伟达 Vera CPU 和 Rubin GPU 紧密配合,构成全新的英伟达 Vera Rubin NVL144 CPX 平台,能够让企业以前所未有的规模实现投资变现——每投入 1 亿美元可产生 50 亿美元的推理收入,投资回报率约为 50 倍,远超 GB200 NVL72 的约 10 倍回报率

花旗称,英伟达通过在产品路线图中插入 Rubin CPX,正在加速其一年更新节奏,这一举措明显是为了应对日益激烈的 ASIC 竞争。

英伟达 GB300 NVL72 机架级系统在最新 MLPerf 推理基准测试中创下新的推理基准记录,相比 GB200 NVL72 系统,可提供高达 1.4 倍的 DeepSeek-R1 推理 throughput。

该平台还在 MLPerf Inference v5.1 套件新增的所有数据中心基准测试中创下性能记录,包括 DeepSeek-R1、Llama 3.1 405B Interactive、Llama 3.1 8B 和 Whisper。

花旗表示,这些系统级性能表现是在英伟达已经在 MLPerf 数据中心基准测试中创下单 GPU 记录基础上的进一步提升。

花旗分析师指出,这些发布表明推理时代已经到来,正如谷歌最近所说的其推理所处理的 Tokens 数量同比增长超过了 50 倍以上所反映的趋势。英伟达正通过 GPU 驱动的数据中心加速生成式 AI 的采用,这一战略定位使公司能够充分捕捉推理市场的爆发性增长机遇。

花旗研究维持英伟达 " 买入 " 评级,目标价 200 美元,基于 2026 财年预期每股收益的 30 倍市盈率。分析师指出,30 倍市盈率与公司 3-5 年平均水平一致,预期股价回报率为 17.1%。

分析师认为,英伟达通过发布 Rubin CPX 和创造 MLPerf 新纪录,展现了公司在 AI 基础设施领域的持续创新能力。随着 AI 推理需求的快速增长,特别是长语境推理需求的爆发,英伟达的新产品组合将为公司带来显著的收入增长机会

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

英伟达 花旗 ai 基础设施 芯片
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论