量子位 昨天
微软机房大量英伟达GPU开始吃灰……
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

你敢想,微软堆成山的 GPU,只能在库房里吃灰

在最新播客节目 BG2 中,微软 CEO 纳德拉亲口承认公司正面临一个前所未有的尴尬:微软手上有成堆的 GPU,却因为缺电、缺空间,只能闲置在那儿。

但最大的问题不是算力过剩的现状——

最大的问题不是芯片供应,而是供电能力,以及我们能否足够快地建成靠近电源的数据中心。

如果做不到,你就会有一堆芯片只能躺在仓库。

微软缺电,大量 GPU 闲置

在微软内部,大量英伟达 AI 芯片被闲置。

不是因为算力已经足够或者 " 过剩 " 了,而是现在的基础设施不足以支撑这些芯片运行起来。

一是因为缺乏电力。

二是因为缺少可以立马投入使用的数据中心——也就是纳德拉口中的 "warm shells",即已经建好、具备足够供电与冷却能力的机房外壳。

这并不是他第一次对外谈及微软的烦恼。

去年,当被问及微软在 2024 年是否仍然受到英伟达芯片的供应限制时,纳德拉是这么说的:

我们受到的是电力限制,而不是芯片供应限制。

到了今年,这似乎成为了所有大模型巨头们共同面临的问题。

奥特曼也在同期讨论中提到,行业面临的总体挑战不仅仅是算力问题,更多还有能源和基础设施的匹配问题。

而奥特曼对这个问题的敏感,比多数科技公司来得早。

过去两年,他陆续投资了裂变能源公司 Oklo、聚变能源公司 Helion,以及太阳能创业公司 Exowatt。

只不过,这些新型能源技术离大规模商用还很远,短期内,数据中心仍得依赖燃气和可再生能源混合供电。

缺电之外:囤芯片也不再安全

过去五年,美国整体电力需求曲线突然被拉高。

随着 AI 和云计算带动的数据中心建设进入高峰期,用电需求开始以超出预期的速度增长,远远超过公用事业公司原本的新增发电规划

供给端反应明显滞后。

传统电厂从立项到并网通常需要数年周期,而 AI 产业扩张的节奏以季度计算。于是,为了追上算力扩张的步伐,越来越多的数据中心开发商不得不自己为 AI 发电。

因此,越来越多的数据中心开发商选择采用所谓的 " 计量表后 "(behind-the-meter)供电方式——直接将电力接入数据中心,绕过公共电网,以弥补供能缺口。

尽管如此,数据中心、电力与冷却系统的建设节奏还是远远跟不上现实需求。

光伏太阳能被视为目前建设周期最短、部署最灵活的能源形式,但在时间维度上,它与数据中心几乎同步——从选址、施工到并网动辄数月甚至一年。

而 AI 需求的变化往往只需要一次模型更新或一次产品发布。

举个具体点的例子来说吧:当算力曲线每季度刷新纪录时,能源系统还在审批表格上打转(无奈摊手 .jpg)。

部分业内人士担心,如果未来 AI 需求增速放缓,当前为了支撑 AI 算力而大规模投资的电厂和储能项目可能会出现闲置风险。

但奥特曼并不这么看。

奥特曼认为,AI 的用电需求不可能回落,只会持续增长。也就是说,更高效、更便宜的算力,只会激发出更多应用场景。

如此来看,奥特曼似乎是一个杰文斯悖论信徒。

该悖论认为,资源的更高效利用将导致更大规模的使用,从而增加整体需求。

如果算力成本明天下降 100 倍,用量会增长远超 100 倍。越便宜的计算力,只会带来更大的总体需求。

为此,奥特曼呼吁美国政府每年增加 100 吉瓦发电能力,并将其视为 "AI 战略资产 "。

与此同时,算力端的企业也在重新调整策略

纳德拉明确表态,微软不会再囤积单一代 GPU

理由很现实——

一台昂贵的英伟达芯片,如果暂时插不上电,两、三年后又被新架构取代,那等于在折旧周期内就提前贬值。

而根据微软经验,数据中心设备的折旧周期通常是六年,盲目囤货不仅占用现金,还会造成资源浪费。

网友建议:不如开发点能耗降低的芯片?

自 20 世纪 90 年代末以来,美国电力生产一直徘徊在约约 4 万亿千瓦时 / 年。

但这个世界变化太快了:

人口增长了 20%,部分物理电网老化,新的城市生活和科技进步都对电力需要提出了不断增长的需求。

如上所述,GPU 生产可以按季度迭代,但电力系统、数据中心冷却与输电网络的建设,却是以年为单位的工程。

AI 产业算力增长能否延续,关键已不在芯片产量,而在能源与基础设施是否能同步扩张。

这也让行业目光重新转向上游芯片厂商。

过去,英伟达等公司拼的是峰值性能:算力越强、速度越快越好。

但当限制从 " 算力短缺 " 变成 " 电力短缺 " 后,标准是否有可能开始反转?

reddit 相关讨论帖中,有网友表达了自己的建议:

如果你是受电力限制而不是芯片限制,你会想要每工作最节能的芯片,对吧?

如果你已经被能耗闲置,而英伟达推出一款速度提升 1.2 倍但能耗降低 25% 的芯片,那将非常有吸引力。

One More Thing

周一,微软在上宣布,相关部门已经批准它向阿联酋运送英伟达芯片,用来建设训练 AI 模型所需的数据中心。

微软还表示,未来四年将在海湾国家投资 80 亿美元用于数据中心、云计算和其他人工智能项目。

中东地区资金丰厚,能源丰富,外媒分析,这笔交易也标志着 AI 基础设施正在从硅谷迁往能源充足的新兴市场。

或许去了那里,微软买下的英伟达 GPU 可以不再吃灰吧……

参考链接:

[ 1 ] https://www.reddit.com/r/hardware/comments/1onawsk/microsoft_ceo_says_the_company_doesnt_have_enough/

[ 2 ] https://x.com/rohanpaul_ai/status/1985462248349766076

[ 3 ] https://finance.yahoo.com/news/microsoft-gets-u-approval-export-134300053.html

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

  年度科技风向标「2025 人工智能年度榜单」评选报名火热进行中!我们正在寻找 AI+ 时代领航者  点击了解详情

❤️‍   企业、产品、人物 3 大维度,共设立了 5 类奖项,欢迎企业报名参与   

一键关注 点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

微软 数据中心 英伟达 gpu 芯片
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论