编辑丨李新江 张星
3 月 18 日,阿里云官网发布公告称,因全球 AI 需求爆发及供应链成本上涨,阿里云旗下 AI 算力、存储等产品将上调价格,涨幅最高达 34%。其中,平头哥真武 810E 等算力卡产品涨幅介于 5% 至 34% 之间,文件存储产品 CPFS(智算版)上涨 30%。
同日,百度智能云发布 AI 算力、存储等产品调价公告称,受全球人工智能应用快速发展影响,算力需求持续攀升。核心硬件及相关基础设施成本出现显著上涨。为保障平台长期稳定运行与服务质量,拟对部分产品价格进行结构性优化。
至此,国内外主流云服务商已基本加入涨价大军。

云服务涨价潮蔓延
2026 年初以来,全球云计算厂商已相继释放涨价信号。亚马逊 AWS 和谷歌云均于年初公布部分服务涨价,其中谷歌云对 CDN Interconnect、Direct Peering、Carrier Peering 等数据传输服务价格进行了大幅调整,北美地区涨幅达到 100%。
国内方面,腾讯云于 3 月 11 日宣布大模型服务涨价。腾讯云称,为持续提供稳定优质的服务,腾讯云智能体开发平台对部分模型的计费策略进行了调整。以 Tencent HY2.0 Instruct 模型为例,其输入价格由原先的 0.0008 元 / 千 Tokens 大幅上调至 0.004505 元 / 千 Tokens,涨幅高达 463.13%。
3 月 16 日,智谱宣布推出面向开源智能体框架 OpenClaw(即 " 龙虾 ")场景的基座模型 GLM-5-Turbo,这也是其近期推出的首个闭源模型,同时,智谱上调新模型 API 价格 20%,这也是智谱近期第二次涨价。粗略计算,GLM-5-Turbo 相对 GLM-4.7 平均上涨 83%,API 价格接近翻倍,量价双增趋势明显。
记者梳理还发现," 数据传输与网络 " 项目已成为本轮云服务涨价的重灾区,相关服务涨幅普遍集中在 10% 至 40% 之间。包括亚马逊 AWS、谷歌云、微软 Azure 以及腾讯云、网宿科技在内的头部厂商,都将数据传输或网络相关服务列入涨价范围。这一趋势表明,云厂商正将日益攀升的带宽与网络基础设施成本向用户端传导。
此外,调价潮中也不乏极端案例,例如谷歌云北美地区的特定网络服务价格直接翻番。从调价节奏来看,大厂们的调价步伐十分紧凑,几乎每个月都有一家头部厂商宣布涨价,呈现出明显的行业跟进效应。
算力紧张倒逼云厂商再定价
CDN 服务商网宿科技产品总监王志杰告诉记者,云计算价格战阶段已经结束,行业进入价值回归周期,标志着行业从 " 规模优先 " 转向 " 利润优先 " 的理性定价阶段。
他表示,此轮涨价并非简单的价格周期波动,而是 AI 算力供需失衡下的被动性市场应对。供给侧 GPU、存储、带宽、电力成本刚性上涨且迭代加速,需求侧 AI 训练和推理需求爆发,资源稀缺性凸显。
就需求结构而言,王志杰观察到,从 2025 年到今年一季度,市场整体呈现 " 训练需求平稳、推理需求指数级增长 " 的特征。行业数据显示,大模型 API 调用量月环比增速达 30%,视频生成、实时交互类应用则持续推动边缘推理算力需求激增。
" 传统云服务遵循‘摩尔定律 + 规模效应’的降本路径,但 AI 算力的边际成本会随着规模扩大而上升,这就导致厂商陷入‘卖得越多亏得越多’的倒挂困境。" 有云服务行业从业者表示,在生存压力倒逼下,行业通过结构性涨价修复利润率,是行业走向成熟表现。
与此同时,AI 应用对底层基础设施的要求也在迅速抬升。前述云服务行业从业者解释,当前平台面临的挑战已不只是有没有资源,更在于能否高效调度资源,例如如何实现 CPU、GPU、FPGA 等异构资源的混合调度,如何支持 AI 任务在边缘、中心和云之间无缝迁移,以及如何压缩大模型边缘加载时延、应对单机柜功率快速提升后带来的液冷和供电改造压力。
" 网络传输是云厂商第二大成本项,仅次于计算,CDN 跟进涨价也是大势所趋。" 王志杰告诉记者,在 AI 时代,低延迟的推理服务必须依赖边缘节点与中心云之间的智能互联,平台在内容合规、安全性、稳定性与弹性等方面也面临更高要求。在他看来,CDN 的角色已发生根本性转变—— " 从内容分发升级为集传输、算力、推理于一体的分布式算力调度网络 "。
Agent 热潮推波助澜
从阿里云本次涨价来看,此轮涨价的另一个重要驱动因素是 "Token 调用量暴涨 "。据知情人士透露,阿里云旗下 MaaS 业务平台百炼在今年 1 月至 3 月创下历史最高增速,阿里云正将紧缺的 AI 算力资源向 Token 推理业务倾斜。
从趋势上看,最新的 AI 模型正在进行更多 " 思考 ",尤其是在深度研究、AI Agent 和代码生成等领域。因此,虽然 Token 价格在持续下降,但完成多项任务所需的 Token 数量却在急剧增加。
观察来看,随着开源 AI Agent 框架 OpenClaw 在开发者社区迅速走红,AI 应用开始从聊天机器人形态转向能够长期运行、执行复杂任务的 Agent。
全球最大的 AI 模型 API 聚合平台 OpenRouter 平台数据显示,OpenClaw 的 Token 消耗量从 2026 年 2 月 3 日的 806 亿,在一个月内飙升至 3 月 4 日的 3580 亿,增长了约 3.4 倍;到 3 月 2 日当周,OpenRouter 平台周度 Token 调用量已达 14.8 万亿,两个月内增长约 160%,且 OpenClaw 贡献其中的绝大部分。根据 Anthropic 的数据,AI Agent 的 Token 消耗量最高可达普通聊天交互的 15 倍。
3 月 17 日,在 2026 年 GPU 技术大会(GTC)期间,英伟达 CEO 黄仁勋表示,AI Agent 工作时,一项任务往往需要多个模型与工具反复调用推理能力,从而带来数量级增长的 Token 消耗。
华泰证券指出,类 Claw 产品加快发布,或将推动 Agent 加速演进,也带动 Token 消耗、推理算力需求以及相关基础设施投入继续上行。
" 龙虾 " 的火爆进一步催化了云资源紧张。由于 " 龙虾 " 对 Token 的消耗呈指数级增长,对应传导到底层算力、带宽的消耗也将出现可预期的爆发式增长,这可能扩大行业内的涨价幅度,也可能提前涨价时点。
根据 IDC 预测,随着 AI Agent 处理任务日趋复杂,其推理深度与调用链路不断延伸,将驱动底层 Token 消耗呈数量级跃升。数据显示,年度 Token 消耗量预计将从 2025 年的 0.0005 Peta Tokens(1 Peta=1000 万亿)激增至 2030 年的 152667 Peta Tokens,年复合增长率高达 3418%。
" 面对 Token 消耗的指数级增长,成本与能耗将成为关键制约因素。企业需要在算力资源、模型选择和搭配上做前瞻规划。"IDC 中国高级研究经理孙振亚建议。


登录后才可以发布评论哦
打开小程序可以发布评论哦