算力“阶级森严”？大厂优先内供、小厂无米下锅，硅谷掀起新一轮GPU“断供潮”

微软、亚马逊等云巨头正将英伟达 GPU 优先分配给内部团队及头部客户，中小 AI 初创企业陷入 " 一芯难求 " 困境，算力资源的争夺正在硅谷掀起新一轮结构性危机。

据 The Information 报道，此轮供应紧缺已波及多家获得红杉资本、Founders Fund、General Catalyst 及 Andreessen Horowitz 等顶级机构支持的 AI 初创公司。General Catalyst 管理合伙人 Hemant Taneja 已向其投资组合创始人发出调查问卷，询问算力获取情况，并在问卷中直言：

" 我们听到很多人反映，算力——尤其是 GPU 访问——是今年面临的最大瓶颈之一。"

供应收紧直接推高了租用价格，云服务商的利润率因此获得提振，但初创企业的运营成本随之大幅攀升。与此同时，微软 Azure 已向内部员工明确表示，客户应预期漫长的等待时间至少将持续至 2026 年底，算力格局的重塑正在深刻影响整个 AI 创业生态。

历史重演，但烈度更甚

此轮 GPU 短缺与 2023 年初的情形颇为相似——彼时云服务商同样从云服务中抽调算力，优先支持内部团队及 OpenAI 等核心客户，Andreessen Horowitz 和 Index Ventures 等风险机构最终不得不自行组建 GPU 资源池，以缓解投资组合公司的燃眉之急。

然而，当前局面的严峻程度有过之而无不及。The Information 指出，AI 编程工具的爆发式需求正在加剧这一短缺，Anthropic 等大型 AI 开发商对算力的需求激增，进一步挤压了留给中小客户的空间。

另一个加剧短缺的结构性因素在于：大量 AI 初创企业此前签订的两至三年云服务合同正陆续到期，云服务商借此机会向客户开出更高价格，或直接将算力重新分配给出价更高的买家。

微软 " 用进废退 "，分级制度明确排序

微软的算力分配机制已形成清晰的等级体系。据一名掌握内情的微软员工透露，Azure 将客户划分为三个层级：

Tier 1 为约 1000 家云支出最高的大客户，享有优先访问权；

Tier 2 为支出规模次之、但仍配有专属销售代表的客户；

Tier 3 则是规模较小的企业，其关系由 CDW 等微软经销商合作伙伴代为管理。

在芯片准入门槛上，微软近几个月开始要求希望获得英伟达 Blackwell 芯片的客户，至少承诺租用 1000 块芯片、期限不低于一年，合同金额至少达数千万美元。即便是租用旧一代英伟达芯片，客户也需等待数周乃至数月。

更值得关注的是微软的 " 用进废退 " 政策：对于按需付费获得 GPU 访问权限的客户，微软会追踪其使用率，一旦服务器闲置哪怕数小时，便可能撤销其访问权限。通过 " 微软初创企业计划 " 获得免费算力积分的初创公司同样面临这一规则——若未能充分利用芯片，将被取消 GPU 访问资格。

初创企业：涨价、被 " 鸽 "、抢不过大客户

图像生成 AI 初创公司 Krea 的遭遇颇具代表性。这家成立四年、已从 Andreessen Horowitz 和 Bain Capital Ventures 等机构融资 8300 万美元的公司，六个月前以每小时每块芯片 2.80 美元的价格签下了数百块英伟达 Blackwell 芯片的六个月合同。

然而当 Krea 近期寻求更多服务器以从头训练新模型时，局面急转直下。联合创始人兼 CEO Victor Perez 表示，部分云服务商的销售代表直接不接电话；等到对方回电，不仅告知价格大幅上涨，还要求签订三年期合同才愿意洽谈。" 有些直接消失，有些说没有货，还有些试图让我们接受极其苛刻的条款，"Perez 说。

最终，Krea 以每小时 3.70 美元的价格签下一年期合同，较上次合同价格上涨 32%。与此同时，另一位寻求租用近 1000 块 GPU 紧密集群的初创企业创始人表示，英伟达销售人员上周告知他，在大型云服务商处找到此类集群极为困难——该集群每日租金将超过 7 万美元。

GPU 云服务商 Lightning AI 的数据则从供需角度印证了这一紧张态势：该公司目前在线 GPU 约 4 万块，但来自约 40 家客户的待处理订单合计需求约 40 万块。CEO Will Falcon 表示，过去六个月价格已上涨逾 25%，从每小时约 1.60 美元涨至逾 2 美元，部分情况下还要更高。

部分创始人选择 " 脱云自建 "

面对漫长等待和不断攀升的租用成本，部分初创企业创始人开始考虑绕开云服务商，自行购买 GPU。

AI 代理初创公司 Collide 的创始人 Collin McLelland 表示，该公司正考虑花费约 50 万美元直接购买英伟达 GPU 自行运营。Collide 去年完成 1400 万美元种子轮融资，专注于为油气行业开发 AI 代理产品。McLelland 计划直接向数据中心或云服务商租用机房空间托管自购 GPU，以规避租用模式下的等待时间和不确定性。

" 对我们来说，在需要算力时却没有算力，是最大的风险，"McLelland 说，" 大多数人只是害怕硬件。我拥有过油井，所以对此已经麻木了。"

尽管短期内自购 GPU 的成本远高于租用，但他认为从多年维度来看，综合成本反而更低，且能彻底摆脱对云服务商的依赖。

云厂商利润受益，但生态隐忧浮现

对云服务商而言，此轮供应紧缺带来了久违的利润改善。此前部分云厂商在 GPU 业务上盈利承压，而当前的供需失衡使其得以提高租用价格，边际利润率随之回升。

然而，这一格局对 AI 创业生态的长期影响不容忽视。算力资源向头部客户高度集中，意味着中小初创企业在模型训练和产品迭代上将面临更高门槛和更大不确定性。General Catalyst 正在研究通过建立共享算力池或代表初创企业直接谈判等方式，帮助投资组合公司获取 GPU 资源——这与 2023 年风险机构自建 GPU 池的应对思路如出一辙，折射出算力获取已成为 AI 投资生态中不可回避的结构性挑战。

宙世代

一起剪

相关标签