科创板日报 昨天
小摩:Token用量、GPU租赁和DRAM价格齐升 AI基建需求仍获支撑
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

财联社 7 月 3 日讯(编辑 夏军雄)摩根大通在其最新《数据中心观察》报告中指出,大模型调用量仍在快速扩张,Token 支出重新加速,非超大规模云厂商市场的 GPU 租赁价格继续上行,DRAM 现货价格维持强势。

该行认为,模型价格下降并未削弱 AI 需求,反而正在通过更低门槛和更广使用场景,推动推理需求进一步扩张。

Token 价格下降,但 AI 使用量正在更快扩张

摩根大通跟踪的 OpenRouter 数据显示,6 月 LLM Token 总量环比增长 70%,显著高于 5 月的 33% 和 4 月的 5%;同比增速达到 20 倍,高于 5 月的 12 倍和 4 月的 15 倍。Token 支出也同步回升,6 月环比增长 70%,同比增长 16 倍,结束了此前两个月增速放缓的状态。

(OpenRouter 数据显示,6 月全球周度 Token 用量跃升至约 45 万亿,其中非美国模型增速显著快于美国模型)

从商业逻辑看,这意味着模型价格下降并未导致市场收入缩减。平均 Token 价格在 6 月环比上涨 7%,但同比仍下降 5%;不过同比降幅已明显小于 5 月的 21% 和 4 月的 24%。换言之,行业仍处于长期单位价格下行阶段,但价格下滑速度正在收窄,而使用量的增长速度远快于价格调整速度。

(平均 Token 价格走势)

这也是 AI 商业化能否成立的关键。大模型服务本质上具有典型的软件和云服务特征:单次调用价格下降,可能降低客户使用门槛,并刺激更多开发者、企业和消费者将模型嵌入搜索、客服、编程、办公、广告和智能体应用中。只要调用量增长持续快于价格下降,模型供应商的总收入池仍然可以扩大。

摩根大通据此判断,在其样本和简化假设下,即使采用较保守的 Token 价格,模型提供商的单位经济性仍呈改善趋势。这并不代表所有模型公司已经实现稳定盈利,但至少说明市场需求端尚未出现 " 价格战压垮商业模式 " 的迹象。

美国模型份额下降,但仍掌握主要收入池

值得注意的是,Token 使用量与收入贡献之间出现了明显分化。

6 月,美国模型,包括 OpenAI、Anthropic、谷歌和 xAI 等,占 OpenRouter 总 Token 量的 35%,低于 5 月的 46% 和 4 月的 56%。其 Token 量环比增长 30%、同比增长 8 倍,增速依然很快,但弱于整体市场。

这意味着以 DeepSeek、MiniMax、MiMo、GLM 等为代表的中国模型和低成本模型,正在开发者、初创企业、代理式编程等对成本高度敏感的场景中,快速扩大使用份额。

按 Token 用量计算,6 月排名前五的模型分别为 DeepSeek V4 Flash、MiMo-V2.5、MiniMax M3、Hy3 preview 和 Claude Opus 4.7,合计占总 Token 量的 45%。

(Token 用量排名前 20 的大模型)

但如果看支出端,美国模型仍占据明显优势。美国模型贡献了 85% 以上的 Token 支出,6 月相关支出环比增长 65%、同比增长 14 倍。按 Token 支出计算,排名前五的模型依次为 Claude Opus 4.7、Claude Opus 4.8、GPT-5.5、Claude Sonnet 4.6 和 GLM 5.2,合计占总支出的 75%。

其中,Claude Opus 4.7 是唯一同时进入 Token 使用量和支出前五的模型。这一现象反映出市场正在形成双层结构:低成本、开源或中国模型更擅长扩大调用规模;高性能、闭源和企业级模型则仍掌握更多高价值应用和付费需求。

GPU 租赁价格上涨,非云巨头市场仍然缺算力

摩根大通跟踪的彭博数据表明,6 月非超大规模云厂商市场的 GPU 租赁价格继续上涨。A100 平均租赁价格为每 GPU 小时 1.63 美元,环比上涨 6.3%,已连续第五个月上涨;H100 平均价格为 2.72 美元,环比上涨 3.7%,连续第七个月上涨;B200 平均价格为 5.33 美元,环比上涨 2.7%。

三类 GPU 同步涨价的意义在于,AI 算力需求并未只集中于微软、亚马逊、谷歌和 Meta 等超大规模云厂商。大量模型初创公司、企业客户、GPU 云服务商和区域性数据中心,仍在争夺有限的高端计算资源

从价格结构看,A100 租价上涨最快,说明上一代 GPU 并未因新产品推出而迅速失去市场。对于大量推理任务、轻量训练任务和成本敏感型应用而言,A100 仍具有较高性价比。H100 则因其在大模型训练和推理中的通用性,需求持续坚挺。

不过,高端 GPU 之间的价格溢价正在收窄。H100 对 A100 的价格比从 4 月的 1.77 倍下降至 6 月的 1.67 倍;B200 对 H100 的价格比从 4 月的 2.04 倍下降至 1.96 倍,较 2025 年 9 月指数推出时的 2.58 倍明显回落。

这可能意味着,市场对最新一代 GPU 的绝对需求依然旺盛,但随着供给逐步增加、替代产品扩散,以及客户更多根据单位算力成本选择设备,B200 的稀缺溢价正在趋于理性。对英伟达而言,这并不必然意味着需求减弱,更多可能反映 AI 算力市场正从 " 只要最新产品 " 逐步走向更精细的性能和成本优化。

DRAM 继续飙升,NAND 先行进入分化阶段

6 月 DDR5 16Gb 现货价格升至 43.14 美元,环比上涨 10%,较去年同期的 5.13 美元上涨 740%,并且已连续第三个月上升。相比之下,NAND 1Tb 现货价格为 27.03 美元,环比仅下降 0.3%,但已经连续第三个月小幅回调;尽管如此,其价格仍较去年同期的 5.28 美元上涨 412%。

DRAM 和 NAND 走势分化,反映 AI 基础设施对不同存储品类的拉动并不均衡。

DRAM,尤其是高端 DDR 和 HBM 相关产品,直接受益于 AI 服务器配置升级。大模型训练和推理需要处理更大的参数量、更长的上下文窗口和更高的并发请求,对内存容量、带宽和稳定性的要求明显高于传统服务器。因此,AI 服务器对高端 DRAM 的需求增长,不仅提升了内存使用量,也挤压了部分常规 DRAM 供应

NAND 则更多关联企业级 SSD、数据存储和传统终端需求。虽然 AI 数据中心同样需要大量 SSD,但 NAND 产能弹性、库存调整和终端需求变化通常更快,因此其价格更容易在短期内出现波动。连续三个月小幅下跌,意味着 NAND 市场的紧张程度可能正在缓解,但同比超过 5 倍的价格涨幅仍表明行业并未回到供给宽松状态。

对于美光、SK 海力士、三星等 DRAM 和 HBM 供应商而言,DRAM 价格强势有利于盈利能力和产品结构改善;对西部数据、闪迪、希捷等存储相关公司而言,NAND 价格仍处于高位,但未来利润弹性可能弱于 DRAM。

对于服务器整机厂、云服务商和模型公司来说,内存成本上涨则意味着 AI 基础设施投资成本仍有上行压力。

(财联社 夏军雄)

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

摩根大通 ai 美国 gpu 编程
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论