AI 推理基础设施市场正面临一轮显著的成本与供给冲击。
在美国知名风投机构 Altimeter 近期举办的活动上,AI 推理基础设施服务商 Baseten 首席执行官 Tuhin Srivastava 透露,其云服务商已于今年 5 月提前通知,英伟达 B200 GPU 的每小时租赁单价将在 10 月合同续约时,从现行的 2.63 美元涨至 5.10 美元,涨幅约 94%。
他强调,这一数字的关键不在于绝对价格水平,而在于其所折射出的供需失衡程度——云服务商提前数月主动报价,本身即表明在算力持续紧缺的背景下,需求方已几无议价空间。
与此同时,供给端紧张态势同样未见缓和。据 Tuhin Srivastava 介绍,当前采购 1000 块 GPU 的交付排期已普遍延至明年第二季度,等待周期长达 12 至 15 个月。交付瓶颈与租赁价格上涨形成叠加效应,企业即便加大投入,短期内亦难以通过采购途径补足算力缺口。价格上行与供给瓶颈双重挤压下,AI 推理的成本正面临实质性抬升。
Baseten 成立于 2019 年,总部位于旧金山,定位为生产级 AI 推理基础设施服务商,业务涵盖模型部署、管理、扩展与监控,提供多集群、多云环境的弹性扩展支持,并辅以性能研究与嵌入式 AI 工程服务。截至 2026 年 1 月,公司已完成 D+ 轮融资,并获得英伟达战略投资。

Baseten 首席执行官 Tuhin Srivastava


登录后才可以发布评论哦
打开小程序可以发布评论哦