全球云计算巨头集体涨价，有模型涨超460%

记者丨彭新

编辑丨李新江张星

云计算市场掀起涨价潮。继亚马逊 AWS、谷歌云、腾讯云相继释放涨价信号后，阿里云与百度云也在同一天内宣布上调价格。

3 月 18 日，阿里云官网发布公告称，因全球 AI 需求爆发及供应链成本上涨，阿里云旗下 AI 算力、存储等产品将上调价格，涨幅最高达 34%。其中，平头哥真武 810E 等算力卡产品涨幅介于 5% 至 34% 之间，文件存储产品 CPFS（智算版）上涨 30%。

同日，百度智能云发布 AI 算力、存储等产品调价公告称，受全球人工智能应用快速发展影响，算力需求持续攀升。核心硬件及相关基础设施成本出现显著上涨。为保障平台长期稳定运行与服务质量，拟对部分产品价格进行结构性优化。

至此，国内外主流云服务商已基本加入涨价大军。

云服务涨价潮蔓延

2026 年初以来，全球云计算厂商已相继释放涨价信号。亚马逊 AWS 和谷歌云均于年初公布部分服务涨价，其中谷歌云对 CDN Interconnect、Direct Peering、Carrier Peering 等数据传输服务价格进行了大幅调整，北美地区涨幅达到 100%。

国内方面，腾讯云于 3 月 11 日宣布大模型服务涨价。腾讯云称，为持续提供稳定优质的服务，腾讯云智能体开发平台对部分模型的计费策略进行了调整。以 Tencent HY2.0 Instruct 模型为例，其输入价格由原先的 0.0008 元 / 千 Tokens 大幅上调至 0.004505 元 / 千 Tokens，涨幅高达 463.13%。

3 月 16 日，智谱宣布推出面向开源智能体框架 OpenClaw（即 " 龙虾 "）场景的基座模型 GLM-5-Turbo，这也是其近期推出的首个闭源模型，同时，智谱上调新模型 API 价格 20%，这也是智谱近期第二次涨价。粗略计算，GLM-5-Turbo 相对 GLM-4.7 平均上涨 83%，API 价格接近翻倍，量价双增趋势明显。

记者梳理还发现，" 数据传输与网络 " 项目已成为本轮云服务涨价的重灾区，相关服务涨幅普遍集中在 10% 至 40% 之间。包括亚马逊 AWS、谷歌云、微软 Azure 以及腾讯云、网宿科技在内的头部厂商，都将数据传输或网络相关服务列入涨价范围。这一趋势表明，云厂商正将日益攀升的带宽与网络基础设施成本向用户端传导。

此外，调价潮中也不乏极端案例，例如谷歌云北美地区的特定网络服务价格直接翻番。从调价节奏来看，大厂们的调价步伐十分紧凑，几乎每个月都有一家头部厂商宣布涨价，呈现出明显的行业跟进效应。

算力紧张倒逼云厂商再定价

CDN 服务商网宿科技产品总监王志杰告诉记者，云计算价格战阶段已经结束，行业进入价值回归周期，标志着行业从 " 规模优先 " 转向 " 利润优先 " 的理性定价阶段。

他表示，此轮涨价并非简单的价格周期波动，而是 AI 算力供需失衡下的被动性市场应对。供给侧 GPU、存储、带宽、电力成本刚性上涨且迭代加速，需求侧 AI 训练和推理需求爆发，资源稀缺性凸显。

就需求结构而言，王志杰观察到，从 2025 年到今年一季度，市场整体呈现 " 训练需求平稳、推理需求指数级增长 " 的特征。行业数据显示，大模型 API 调用量月环比增速达 30%，视频生成、实时交互类应用则持续推动边缘推理算力需求激增。

" 传统云服务遵循‘摩尔定律 + 规模效应’的降本路径，但 AI 算力的边际成本会随着规模扩大而上升，这就导致厂商陷入‘卖得越多亏得越多’的倒挂困境。" 有云服务行业从业者表示，在生存压力倒逼下，行业通过结构性涨价修复利润率，是行业走向成熟表现。

与此同时，AI 应用对底层基础设施的要求也在迅速抬升。前述云服务行业从业者解释，当前平台面临的挑战已不只是有没有资源，更在于能否高效调度资源，例如如何实现 CPU、GPU、FPGA 等异构资源的混合调度，如何支持 AI 任务在边缘、中心和云之间无缝迁移，以及如何压缩大模型边缘加载时延、应对单机柜功率快速提升后带来的液冷和供电改造压力。

" 网络传输是云厂商第二大成本项，仅次于计算，CDN 跟进涨价也是大势所趋。" 王志杰告诉记者，在 AI 时代，低延迟的推理服务必须依赖边缘节点与中心云之间的智能互联，平台在内容合规、安全性、稳定性与弹性等方面也面临更高要求。在他看来，CDN 的角色已发生根本性转变—— " 从内容分发升级为集传输、算力、推理于一体的分布式算力调度网络 "。

Agent 热潮推波助澜

从阿里云本次涨价来看，此轮涨价的另一个重要驱动因素是 "Token 调用量暴涨 "。据知情人士透露，阿里云旗下 MaaS 业务平台百炼在今年 1 月至 3 月创下历史最高增速，阿里云正将紧缺的 AI 算力资源向 Token 推理业务倾斜。

从趋势上看，最新的 AI 模型正在进行更多 " 思考 "，尤其是在深度研究、AI Agent 和代码生成等领域。因此，虽然 Token 价格在持续下降，但完成多项任务所需的 Token 数量却在急剧增加。

观察来看，随着开源 AI Agent 框架 OpenClaw 在开发者社区迅速走红，AI 应用开始从聊天机器人形态转向能够长期运行、执行复杂任务的 Agent。

全球最大的 AI 模型 API 聚合平台 OpenRouter 平台数据显示，OpenClaw 的 Token 消耗量从 2026 年 2 月 3 日的 806 亿，在一个月内飙升至 3 月 4 日的 3580 亿，增长了约 3.4 倍；到 3 月 2 日当周，OpenRouter 平台周度 Token 调用量已达 14.8 万亿，两个月内增长约 160%，且 OpenClaw 贡献其中的绝大部分。根据 Anthropic 的数据，AI Agent 的 Token 消耗量最高可达普通聊天交互的 15 倍。

3 月 17 日，在 2026 年 GPU 技术大会（GTC）期间，英伟达 CEO 黄仁勋表示，AI Agent 工作时，一项任务往往需要多个模型与工具反复调用推理能力，从而带来数量级增长的 Token 消耗。

华泰证券指出，类 Claw 产品加快发布，或将推动 Agent 加速演进，也带动 Token 消耗、推理算力需求以及相关基础设施投入继续上行。

" 龙虾 " 的火爆进一步催化了云资源紧张。由于 " 龙虾 " 对 Token 的消耗呈指数级增长，对应传导到底层算力、带宽的消耗也将出现可预期的爆发式增长，这可能扩大行业内的涨价幅度，也可能提前涨价时点。

根据 IDC 预测，随着 AI Agent 处理任务日趋复杂，其推理深度与调用链路不断延伸，将驱动底层 Token 消耗呈数量级跃升。数据显示，年度 Token 消耗量预计将从 2025 年的 0.0005 Peta Tokens（1 Peta=1000 万亿）激增至 2030 年的 152667 Peta Tokens，年复合增长率高达 3418%。

" 面对 Token 消耗的指数级增长，成本与能耗将成为关键制约因素。企业需要在算力资源、模型选择和搭配上做前瞻规划。"IDC 中国高级研究经理孙振亚建议。

宙世代

一起剪

相关标签