全天候科技 4小时前
亚马逊AI翻身战:靠卖Claude Tokens,AWS利润率碾压微软和谷歌
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

AI 云业务普涨的时代,利润率成了真正的分水岭。AWS 凭借一套将 Claude token 需求转化为经营杠杆的独特结构,正在与 Azure、Google Cloud 拉开差距。

最新数据显示,AWS 在 2026 年一季度 EBIT 利润率环比提升 213 个基点,而同期 Azure 利润率走弱,Google Cloud 利润率改善有限且存在会计口径差异。亚马逊是唯一一家将代币即服务 ( TokenaaS ) 作为其人工智能业务主要组成部分的云服务提供商 ( CSP ) 。

研究机构 SemiAnalysis 分析师 Jeremie Eliahou Ontiveros 将这一分化归因于三点:"AWS 在第三方模型 API 支出中的更高份额、Anthropic/Bedrock 交易结构,以及 Anthropic 在 2026 年一季度 ARR 超预期。" 这不是 "AI 需求强,所以利润好 " 的简单逻辑,而是一套从算力出租商向模型分销平台跃迁的结构性转变。

关键信号在于:Bedrock 目前约为 55 亿美元 run-rate 规模,仅占 AWS 总收入约 4%,却贡献了 AWS 同比新增毛利额的 30%。只要 Anthropic 需求持续爆发,这一杠杆效应将继续放大。

结构差异:AI 占比低,利润率反而更高

云厂商都在吃 AI 需求,但分化发生在利润率,而非收入增速。

从 AI 收入占总收入比例来看,AWS 并不领先。测算显示,AWS 的 AI 收入占比从 2024 年一季度的 2% 升至 2026 年一季度的 10%,而同期 GCP 和 Azure 分别达到 36% 和 27%。

但高 AI 占比没有自动带来高利润率。Azure 和 GCP 的 AI 业务仍以 AI IaaS 为主,占各自 AI 业务组合超过 80%。AWS 的结构则在发生变化:Bedrock 占 AWS AI 收入的比例从 2025 年一季度的 9%,升至 2026 年一季度的 37%。

这解释了一个表面矛盾—— AWS 的 AI 收入占比远低于竞争对手,利润率却跑出来了。问题不在 "AI 多不多 ",而在 "AI 收入是哪一种 "。

Bedrock 模式:从卖算力到拿分销权益

Bedrock 是 AWS 的模型调用平台,客户可通过统一账单、安全合规框架接入 Claude 等前沿大模型。它的竞争对手包括 Microsoft Foundry、Google Gemini Enterprise Agent Platform,以及 TogetherAI、Fireworks 等偏开源模型的平台。

这类平台的核心差异不在模型数量或延迟指标,而在能否接入前沿模型。前沿大模型贡献了 AI API 行业的大部分收入,AWS、微软、谷歌相较其他 endpoint 平台的优势,正在于此。

但接入模型只是第一步。Bedrock 对 AWS 利润率的真正意义,在于其交易结构。在 AWS 通过 Bedrock 分销 Claude token 的安排下,Anthropic 作为 seller of record 确认完整的 token 销售收入;客户由 AWS 开票,模型部署在 AWS 基础设施上;AWS 则获得两部分收益:类似 EC2/IaaS 的基础设施费用,以及分销或收入分成。

相比五年期 take-or-pay 式的 IaaS 合同,这类 Token-as-a-Service(TaaS)业务收入锁定性更低,但利润率更厚。对 Anthropic/Bedrock 安排的测算显示,固定 IaaS 费用、收入分成与超量绩效门槛叠加,使 Bedrock 在 2026 年一季度实现了约 55% 的 EBIT 利润率。代价也很明确:若 Claude token 消费下滑,AWS 承担的需求风险高于传统 IaaS。

目前,亚马逊、微软、谷歌的 TaaS 业务 ARR 均已达到百亿美元以上量级,Oracle 和 neocloud 在这一层几乎没有规模——这是超大云厂商与其他 AI 算力提供商差距被拉大的关键所在。

Anthropic 爆发:AWS 利润杠杆的核心燃料

Bedrock 高度绑定 Anthropic 需求。测算显示,Bedrock 80% 至 90% 以上的客户使用 Anthropic 模型,Bedrock 实质上是一个由 Claude 需求驱动的业务。

Anthropic 自身的增长数据极为突出。其 2026 年一季度净新增 ARR 为 210 亿美元,总 ARR 达到 300 亿美元;API 收入同比约增长 13 倍,年底 ARR 有可能远超 1000 亿美元。Claude Code 在企业客户中的快速铺开是重要驱动,消费者侧流量也开始向 Claude 迁移。

利润率同样大幅改善。Anthropic 推理毛利率已升至 60% 中段,相比 2025 年的 38% 和 2024 年的 -94% 实现大幅修复。Anthropic 越快增长,Bedrock 上 Claude token 消费越大,AWS 拿到的基础设施费和分销分成也越多。

这种借力关系在财务数据上已有体现。2026 年二季度的路径假设更为激进:Bedrock 占 AWS AI 收入比例有望升至 53%,并为 AWS 总收入增长额外贡献 9 个百分点。

容量布局:提前锁电,才接得住 TaaS 需求

TaaS 要做大,前提是有足够的推理算力按时交付。AWS 在这一点上比多数同行更为激进。

数据中心模型显示,AWS 在 2025 年至 2027 年的新增容量上持续领先;微软在 2024 年至 2026 年节奏接近,但到 2027 年被明显拉开。更重要的是,微软内部 AI 项目消耗的算力高于亚马逊,且大量 AI 算力通过长期合同锁定给了 OpenAI ——仅 OpenAI 相关积压订单规模,就是 Azure 全年收入的 2.5 倍。

AWS 则更早将电力和容量当作市场份额问题处理,与 Talen、Vistra、NiSource 等独立电力生产商签下数十亿美元级 PPA,并在印第安纳和密西西比推进接近 2GW 规模的建设。微软此前曾经历约一年的数据中心建设暂停,拉低了 2027 年容量预测;威斯康星大型 AI 集群进展也慢于 AWS 同类项目。若要追赶,微软只能从 neocloud 购买更多容量,成本更高,利润率也将承压。

AWS 还在推进更高模块化和预制化比例的新数据中心设计。对 AI 推理业务而言,这直接关系到收入的交付能力。

自研芯片:在分销费之外压低底层成本

Bedrock 模式对自研芯片天然友好——客户购买的是 token,不关心底层跑的是英伟达 GPU 还是 Trainium。这给了 AWS 一个额外的成本杠杆。

Trainium 在高 batch 推理、强化学习等对内存带宽敏感的工作负载中具备较好的性能 / 总拥有成本表现。AWS CEO Matt Garman 在 2025 年 11 月披露,Trainium 已支撑超过 50% 的 Amazon Bedrock token 使用量。

CPU 侧同样值得关注。前沿大模型训练和推理对 CPU 需求上升,尤其在强化学习和 agentic 工作负载中。AWS 的 Graviton4、Graviton5 在性能 / 总拥有成本上具备优势,并将作为 Trn3 的 head node 集成,也可单独用于强化学习和 agentic 任务。AWS 已与 Anthropic、OpenAI、Meta 签下大型 CPU 及 Graviton 相关合作,Bedrock 客户基础越大,向其追加销售 Graviton 能力的摩擦越小。

同行落后:不是 AI 收入不够,而是结构没变

Azure 的核心问题是 AI 收入仍高度 IaaS 化,Microsoft 365 Copilot 和 GitHub 相关业务尚未形成同等规模的利润率拉动。

Google Cloud 的 Gemini API 表现尚可,但没有复制 Anthropic 在编码市场的强势。更重要的是,Google Cloud 存在会计口径差异—— DeepMind 的训练成本未计入 GCP 分部,导致其利润率与 AWS 不完全可比。

Oracle 和 neocloud 的处境更为直接:主要在 AI IaaS 和算力租赁层竞争,TaaS 几乎没有规模。一旦云业务利润低于预期,批发算力模式的脆弱性即刻暴露。

AWS 这轮跑赢,依赖几条线同时成立:Anthropic 需求爆发提供收入基础,Bedrock 交易结构提供利润率,电力与数据中心容量提供交付能力,Trainium 和 Graviton 压低底层成本。只要这几条线保持连接,AWS 的 AI 业务逻辑就不只是 " 资本开支换增长 ",而是 " 模型需求换经营杠杆 "。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai aws azure 亚马逊 云服务
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论