算力告急：谷歌悄然对Meta实施Gemini使用上限

人工智能基础设施的供需矛盾正在全球顶级科技公司之间激化。据知情人士透露，谷歌约于今年 3 月告知 Meta，无法满足其全部 Gemini 算力需求，并对这家社交媒体巨头实施了使用上限——即便是全球最大的 AI 服务商，也难以应对汹涌而来的算力需求。

据英国《金融时报》报道，上述限制至今仍未解除，已导致 Meta 多个内部 AI 项目遭到干扰和延误。受此影响，Meta 已要求员工提高 AI 算力使用效率，在内部推行对 AI token 的精打细算。谷歌与 Meta 均拒绝就此置评。

这一局面迫使谷歌加快扩容步伐。谷歌本月早些时候与埃隆 · 马斯克旗下 SpaceX 签订了一份每月 9.2 亿美元的算力租赁协议。谷歌 CEO 桑达尔 · 皮查伊在今年一季度财报会议上坦言：" 近期我们在算力方面确实面临制约，如果能够满足需求，云业务收入将会更高。"

Meta 并非孤例。多位知情人士指出，其他谷歌企业客户同样受到程度不一的限制，而 Meta 因需求规模异常庞大受影响最深。这场风波折射出 AI 推理工作负载的爆炸式增长，已成为整个行业面临的最大挑战之一。

算力瓶颈持续承压，大客户首当其冲

尽管各大科技公司已在芯片、数据中心和电力供应上砸下数百亿美元，AI 算力供给仍难以追上需求增速。

谷歌一季度云业务收入首次突破 200 亿美元，已签署但尚未交付的云合同积压量环比几乎翻番，超过 4600 亿美元。皮查伊明确表示，算力制约在近期内仍将持续。

在此背景下，Meta 受到的冲击尤为突出。知情人士表示，正是 Meta 等大型企业客户的高强度需求，直接推动谷歌加速寻求外部算力来源。随着企业大规模部署聊天机器人、编程助手和 AI 智能体，推理工作负载——即模型训练完成后在实际应用中执行任务所消耗的算力——正成为行业的核心瓶颈。

Meta 内部项目受阻，加速转向自研模型

Meta 在内部广泛使用 Gemini，涵盖平台安全审核（包括识别诈骗内容、清除有害信息）、客服及广告辅助聊天机器人，以及部分内部工作流和代码开发，同时搭配使用 Anthropic 的 Claude 等其他模型。

据知情人士透露，Meta 最初选择 Gemini，是因为其表现优于公司自研的 Llama 开源模型。然而随着算力限制的收紧，Meta 正加快向自研模型迁移。多位知情人士表示，Meta 近期已开始优先推广其新推出的 Muse Spark 模型，该模型被认为在性能上已能与 Gemini 相抗衡，有助于降低对外部模型的依赖。

Meta CEO 马克 · 扎克伯格此前持续加大对 AI 人才和基础设施的投入，致力于打造其所称的 " 个人超级智能 "。与谷歌不同，Meta 没有云业务，正在加速自建数据中心体系，并承诺到 2028 年在美国累计投资 6000 亿美元。

谷歌借道 SpaceX 扩容，行业寻求破局

面对算力压力，谷歌本月与 SpaceX 签署每月 9.2 亿美元的算力租赁协议，以弥补基础设施缺口。AI 实验室 Anthropic 上月也与 SpaceX 达成了类似协议。

谷歌对 Meta 采取限制措施一事，为外界提供了一个罕见窗口，得以窥见全球顶级 AI 服务商在算力分配上所面临的真实压力。当前，整个 AI 行业的基础设施瓶颈正从训练侧蔓延至推理侧，供需矛盾的化解仍有赖于新一轮大规模资本投入的落地兑现。