小摩：Token用量、GPU租赁和DRAM价格齐升 AI基建需求仍获支撑

财联社 7 月 3 日讯（编辑夏军雄）摩根大通在其最新《数据中心观察》报告中指出，大模型调用量仍在快速扩张，Token 支出重新加速，非超大规模云厂商市场的 GPU 租赁价格继续上行，DRAM 现货价格维持强势。

该行认为，模型价格下降并未削弱 AI 需求，反而正在通过更低门槛和更广使用场景，推动推理需求进一步扩张。

Token 价格下降，但 AI 使用量正在更快扩张

摩根大通跟踪的 OpenRouter 数据显示，6 月 LLM Token 总量环比增长 70%，显著高于 5 月的 33% 和 4 月的 5%；同比增速达到 20 倍，高于 5 月的 12 倍和 4 月的 15 倍。Token 支出也同步回升，6 月环比增长 70%，同比增长 16 倍，结束了此前两个月增速放缓的状态。

（OpenRouter 数据显示，6 月全球周度 Token 用量跃升至约 45 万亿，其中非美国模型增速显著快于美国模型）

从商业逻辑看，这意味着模型价格下降并未导致市场收入缩减。平均 Token 价格在 6 月环比上涨 7%，但同比仍下降 5%；不过同比降幅已明显小于 5 月的 21% 和 4 月的 24%。换言之，行业仍处于长期单位价格下行阶段，但价格下滑速度正在收窄，而使用量的增长速度远快于价格调整速度。

（平均 Token 价格走势）

这也是 AI 商业化能否成立的关键。大模型服务本质上具有典型的软件和云服务特征：单次调用价格下降，可能降低客户使用门槛，并刺激更多开发者、企业和消费者将模型嵌入搜索、客服、编程、办公、广告和智能体应用中。只要调用量增长持续快于价格下降，模型供应商的总收入池仍然可以扩大。

摩根大通据此判断，在其样本和简化假设下，即使采用较保守的 Token 价格，模型提供商的单位经济性仍呈改善趋势。这并不代表所有模型公司已经实现稳定盈利，但至少说明市场需求端尚未出现 " 价格战压垮商业模式 " 的迹象。

美国模型份额下降，但仍掌握主要收入池

值得注意的是，Token 使用量与收入贡献之间出现了明显分化。

6 月，美国模型，包括 OpenAI、Anthropic、谷歌和 xAI 等，占 OpenRouter 总 Token 量的 35%，低于 5 月的 46% 和 4 月的 56%。其 Token 量环比增长 30%、同比增长 8 倍，增速依然很快，但弱于整体市场。

这意味着以 DeepSeek、MiniMax、MiMo、GLM 等为代表的中国模型和低成本模型，正在开发者、初创企业、代理式编程等对成本高度敏感的场景中，快速扩大使用份额。

按 Token 用量计算，6 月排名前五的模型分别为 DeepSeek V4 Flash、MiMo-V2.5、MiniMax M3、Hy3 preview 和 Claude Opus 4.7，合计占总 Token 量的 45%。

（Token 用量排名前 20 的大模型）

但如果看支出端，美国模型仍占据明显优势。美国模型贡献了 85% 以上的 Token 支出，6 月相关支出环比增长 65%、同比增长 14 倍。按 Token 支出计算，排名前五的模型依次为 Claude Opus 4.7、Claude Opus 4.8、GPT-5.5、Claude Sonnet 4.6 和 GLM 5.2，合计占总支出的 75%。

其中，Claude Opus 4.7 是唯一同时进入 Token 使用量和支出前五的模型。这一现象反映出市场正在形成双层结构：低成本、开源或中国模型更擅长扩大调用规模；高性能、闭源和企业级模型则仍掌握更多高价值应用和付费需求。

GPU 租赁价格上涨，非云巨头市场仍然缺算力

摩根大通跟踪的彭博数据表明，6 月非超大规模云厂商市场的 GPU 租赁价格继续上涨。A100 平均租赁价格为每 GPU 小时 1.63 美元，环比上涨 6.3%，已连续第五个月上涨；H100 平均价格为 2.72 美元，环比上涨 3.7%，连续第七个月上涨；B200 平均价格为 5.33 美元，环比上涨 2.7%。

三类 GPU 同步涨价的意义在于，AI 算力需求并未只集中于微软、亚马逊、谷歌和 Meta 等超大规模云厂商。大量模型初创公司、企业客户、GPU 云服务商和区域性数据中心，仍在争夺有限的高端计算资源。

从价格结构看，A100 租价上涨最快，说明上一代 GPU 并未因新产品推出而迅速失去市场。对于大量推理任务、轻量训练任务和成本敏感型应用而言，A100 仍具有较高性价比。H100 则因其在大模型训练和推理中的通用性，需求持续坚挺。

不过，高端 GPU 之间的价格溢价正在收窄。H100 对 A100 的价格比从 4 月的 1.77 倍下降至 6 月的 1.67 倍；B200 对 H100 的价格比从 4 月的 2.04 倍下降至 1.96 倍，较 2025 年 9 月指数推出时的 2.58 倍明显回落。

这可能意味着，市场对最新一代 GPU 的绝对需求依然旺盛，但随着供给逐步增加、替代产品扩散，以及客户更多根据单位算力成本选择设备，B200 的稀缺溢价正在趋于理性。对英伟达而言，这并不必然意味着需求减弱，更多可能反映 AI 算力市场正从 " 只要最新产品 " 逐步走向更精细的性能和成本优化。

DRAM 继续飙升，NAND 先行进入分化阶段

6 月 DDR5 16Gb 现货价格升至 43.14 美元，环比上涨 10%，较去年同期的 5.13 美元上涨 740%，并且已连续第三个月上升。相比之下，NAND 1Tb 现货价格为 27.03 美元，环比仅下降 0.3%，但已经连续第三个月小幅回调；尽管如此，其价格仍较去年同期的 5.28 美元上涨 412%。

DRAM 和 NAND 走势分化，反映 AI 基础设施对不同存储品类的拉动并不均衡。

DRAM，尤其是高端 DDR 和 HBM 相关产品，直接受益于 AI 服务器配置升级。大模型训练和推理需要处理更大的参数量、更长的上下文窗口和更高的并发请求，对内存容量、带宽和稳定性的要求明显高于传统服务器。因此，AI 服务器对高端 DRAM 的需求增长，不仅提升了内存使用量，也挤压了部分常规 DRAM 供应。

NAND 则更多关联企业级 SSD、数据存储和传统终端需求。虽然 AI 数据中心同样需要大量 SSD，但 NAND 产能弹性、库存调整和终端需求变化通常更快，因此其价格更容易在短期内出现波动。连续三个月小幅下跌，意味着 NAND 市场的紧张程度可能正在缓解，但同比超过 5 倍的价格涨幅仍表明行业并未回到供给宽松状态。

对于美光、SK 海力士、三星等 DRAM 和 HBM 供应商而言，DRAM 价格强势有利于盈利能力和产品结构改善；对西部数据、闪迪、希捷等存储相关公司而言，NAND 价格仍处于高位，但未来利润弹性可能弱于 DRAM。

对于服务器整机厂、云服务商和模型公司来说，内存成本上涨则意味着 AI 基础设施投资成本仍有上行压力。

（财联社夏军雄）

宙世代

一起剪

相关标签