人工智能基础设施的供需矛盾正在全球顶级科技公司之间激化。据知情人士透露,谷歌约于今年 3 月告知 Meta,无法满足其全部 Gemini 算力需求,并对这家社交媒体巨头实施了使用上限——即便是全球最大的 AI 服务商,也难以应对汹涌而来的算力需求。
据英国《金融时报》报道,上述限制至今仍未解除,已导致 Meta 多个内部 AI 项目遭到干扰和延误。受此影响,Meta 已要求员工提高 AI 算力使用效率,在内部推行对 AI token 的精打细算。谷歌与 Meta 均拒绝就此置评。
这一局面迫使谷歌加快扩容步伐。谷歌本月早些时候与埃隆 · 马斯克旗下 SpaceX 签订了一份每月 9.2 亿美元的算力租赁协议。谷歌 CEO 桑达尔 · 皮查伊在今年一季度财报会议上坦言:" 近期我们在算力方面确实面临制约,如果能够满足需求,云业务收入将会更高。"
Meta 并非孤例。多位知情人士指出,其他谷歌企业客户同样受到程度不一的限制,而 Meta 因需求规模异常庞大受影响最深。这场风波折射出 AI 推理工作负载的爆炸式增长,已成为整个行业面临的最大挑战之一。
算力瓶颈持续承压,大客户首当其冲
尽管各大科技公司已在芯片、数据中心和电力供应上砸下数百亿美元,AI 算力供给仍难以追上需求增速。
谷歌一季度云业务收入首次突破 200 亿美元,已签署但尚未交付的云合同积压量环比几乎翻番,超过 4600 亿美元。皮查伊明确表示,算力制约在近期内仍将持续。
在此背景下,Meta 受到的冲击尤为突出。知情人士表示,正是 Meta 等大型企业客户的高强度需求,直接推动谷歌加速寻求外部算力来源。随着企业大规模部署聊天机器人、编程助手和 AI 智能体,推理工作负载——即模型训练完成后在实际应用中执行任务所消耗的算力——正成为行业的核心瓶颈。
Meta 内部项目受阻,加速转向自研模型
Meta 在内部广泛使用 Gemini,涵盖平台安全审核(包括识别诈骗内容、清除有害信息)、客服及广告辅助聊天机器人,以及部分内部工作流和代码开发,同时搭配使用 Anthropic 的 Claude 等其他模型。
据知情人士透露,Meta 最初选择 Gemini,是因为其表现优于公司自研的 Llama 开源模型。然而随着算力限制的收紧,Meta 正加快向自研模型迁移。多位知情人士表示,Meta 近期已开始优先推广其新推出的 Muse Spark 模型,该模型被认为在性能上已能与 Gemini 相抗衡,有助于降低对外部模型的依赖。
Meta CEO 马克 · 扎克伯格此前持续加大对 AI 人才和基础设施的投入,致力于打造其所称的 " 个人超级智能 "。与谷歌不同,Meta 没有云业务,正在加速自建数据中心体系,并承诺到 2028 年在美国累计投资 6000 亿美元。
谷歌借道 SpaceX 扩容,行业寻求破局
面对算力压力,谷歌本月与 SpaceX 签署每月 9.2 亿美元的算力租赁协议,以弥补基础设施缺口。AI 实验室 Anthropic 上月也与 SpaceX 达成了类似协议。
谷歌对 Meta 采取限制措施一事,为外界提供了一个罕见窗口,得以窥见全球顶级 AI 服务商在算力分配上所面临的真实压力。当前,整个 AI 行业的基础设施瓶颈正从训练侧蔓延至推理侧,供需矛盾的化解仍有赖于新一轮大规模资本投入的落地兑现。


