新智元 2小时前
马斯克点火全球最大超算,首个1GW狂飙奇点!6万亿Grok 5在训
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

【新智元导读】全网震撼!马斯克官宣,全球首个吉瓦级超算 Colossus 2 正式上线,狂堆 55 万块 GPU,目标直指百万。下一代 Grok 5 已在训练,6 万亿参数将引爆智能奇点。

全球首个吉瓦级训练集群!

马斯克一早激动官宣,专为训下一代 Grok 打造的「超算巨兽」Colossus 2,今天正式上线。

它可是全球首个,达到吉瓦级的 AI 训练集群。这是什么概念?

Colossus 2 的用电,要比旧金山全市用电峰值还要高。

预计在今年 4 月,升级到 1.5GW,约等于一座大型核电站的输出。

OpenAI、Anthropic 在内的很多劲敌还在规划 2027 年路线图,xAI 这边直接把「城市级」算力搞定了。

更夸张的,是他们的执行速度:

Colossus 1:从零到全面上线,只用了 122 天

Colossus 2:刚突破 1GW 门槛,目标直接冲着总共 2GW 去

Epoch AI 此前一份报告称,Colossus 2 将拥有相当于 140 万块 H100 GPU 等效算力

暴力出奇迹,依旧是马斯克坚信的路线—— Scaling 算力对于快速逼近「奇点」那一刻至关重要。

毕竟,在马斯克的叙事中,未来全球最强的 AI 玩家中,只有谷歌和 xAI。

全球首个 GW 级超算:55 万 GPU

xAI 展现出的惊人速度,连老黄都为之惊叹。他曾这样高度评价道——

马斯克对工程学的理解是独一无二的。别人需要 1 年完成的事情,xAI 仅用 19 天就搞定了。

外界对于 Colossus 1 的了解,要比 Colossus 2 系统得多。

从 0 开始仅用 122 天就拔地而起,拥有大约 20 万张 H100/H200,以及约 3 万张 GB200 NVL72。

去年,SemiAnalysis 高级分析师一篇文章,曾深度分析了 Colossus 2 工程设计和所取得的成就。

接下来,就扒一下其背后的细节。

六个月,从 0 到 200MW

Colossus 2 项目,于 2025 年 3 月 7 日启动。

它将配备 55 万块芯片,由 GB200 和 GB300 GPU 组成,最终未来扩展到百万 GPU。

当时 xAI 在孟菲斯(Memphis)收购了一个 100 万平方英尺的仓库,以及两个总计 100 英亩的相邻地块。

不到六个月的时间,SemiAnalysis 统计了现场已部署 119 台风冷冷水机组,即大约 200MW 的冷却能力。

这就足以驱动,大约 11 万张 GB200 NVL72。

而且,这个巨大的超算,全部采用的是液冷设计。

马斯克一条推文显示,一些机架在 7 月份就已经安装好了

令人惊叹的是,xAI 只用了 6 个月就完成了甲骨文、OpenAI花了 15 个月才完成的工作

据介绍, Colossus 2 造价高达数百亿美元。而 xAI 现在基本没外部收入,主要靠母公司 X 输血。

而且,报告里特意提了一嘴——

马斯克跟中东几个「土豪」关系很铁,沙特、阿联酋、卡塔尔的主权基金,都是潜在的金主。

Grok 5 在训,奇点更近了

Colossus 2 的全面上线,也意味着「全球首个吉瓦级大模型」—— Grok 即将出世。

马斯克曾坚定地表示,xAI 有机会通过 Grok 5 实现 AGI。

此前,在一期采访中,马斯克还表示 Grok 5 拥有高达 6 万亿参数,而且智能密度更高,预计将在上半年发布。

不仅如此,它还原生支持视频理解。

可以预见,在首个吉瓦级超算上训出的 Grok 5,实力一定超乎想象。

爆冲 2GW,今年上线

去年 12 月底,马斯克斥资超 200 亿美元,买下了孟菲斯第三栋建筑,计划将 Colossus 总容量扩展至 2GW。

这栋新建筑—— MACROHARDRR,延续了 Macrohard 命名,位于 Colossus 2 旁,占地面积超 80 万平方英尺。

Grok 估计,在 2025 年中,按 AI 算力排名前 10 中,Colossus 2 和特斯拉 Dojo 位居第一和第 7:

在 AI 算力上,马斯克疯狂加码,甚至他「已经在规划 10GW 甚至更高的算力」。

狂飙吉瓦级超算,硅谷巨头乱战

如今,全世界 AI 巨头们,正掀起一场前所未有的算力军备赛。

除了马斯克 xAI 之外,OpenAI、Meta、Anthropic 也在纷纷加码,目标直指吉瓦(GW)级,甚至更大规模的 AI 超算。

2022 年 GPT 发布以来,OpenAI、xAI、Anthropic、Meta Superintelligence 等 AI 训练算力飙升

OpenAI:星际之门

「星际之门」,便是众所周知的典型代表之一。

2025 年 1 月初,OpenAI 联合软银、甲骨文等伙伴正式启动了名为「星际之门」(Stargate)的宏大计划。

这项「AI 曼哈顿计划」,要在未来 4 年砸 5000 亿美金,建设总容量达到 10GW 的集群。

首期立即部署 1000 亿美元,如今进展迅猛。

去年 9 月,OpenAI 公布了五个新站点,要在未来三年,实现 7GW 算力规模。

这样的规模相当于同时为数百万家庭供电,却全部用于驱动 AI 训练与推理。

Meta:普罗米修斯

Meta 同样在加速狂奔。

早在去年,小扎就公开了资金代号 Prometheus(普罗米修斯)的 GW 级 AI 超算项目,目标在 2026 年上半年上线。

不仅如此,Meta 正在建设多个吉瓦级集群:

Prometheus 预计 2026 年率先达到 1GW+

后续的 Hyperion 项目,计划逐步扩展到 5GW 规模,占地堪比曼哈顿相当一部分区域

几天前,小扎再次重磅宣布启动全新顶级计划—— Meta Compute。

计划明确表示,将在本十年内建设数十吉瓦 AI 超算,长期目标甚至指向数百吉瓦级别。

为此,Meta 内部已组建专责团队,并与核电企业签订长期协议,确保能源供应跟得上疯狂扩张的步伐。

Anthropic:百万 TPU 下单,GPU 也要

Anthropic 选择了一条更聚焦的路线:深度绑定 Google Cloud 的 TPU。

去年 10 月官宣,将把 Google Cloud TPU 扩展到最多 100 万颗 TPU,合同价值数百亿美元。

而且,预计在 2026 年上线远超 1GW 的容量。

而且,Anthropic 采用多平台策略,同时使用谷歌 TPU、亚马逊 Trainium 和英伟达 GPU。

如今,AI 竞赛的胜负手,正从模型参数本身向基础设施倾斜。

硅谷巨头们狂建超算,原因很简单:下一代前沿模型所需的算力远超想象。

这场吉瓦级超算的全球军备赛,才刚刚拉开帷幕。

6 千亿算力投资,AI 榨干美国人钱包?

网友直呼,马斯克的算力赌注「太疯狂了。AGI 最难的部分已不再是数学,而是字面意义上的能不能找到足够多的电源插座」。

2026 年,这一趋势只会愈演愈烈——

亚马逊 AWS、微软、谷歌、Meta、甲骨文(Oracle)等超级云计算巨头正加速扩张。

它们的资本支出预计将超过 6000 亿美元,重点已全面转向 AI 专用基础设施建设,边缘服务成为次要关注点。

独立的市场研究和分析公司 Dell ’ Oro 分析师 Baron Fung 指出:「预计在未来 2 至 3 年内,这些部署将新增数十 GW 总电力容量,反映出加速计算对算力规模和密度提出了极高要求。」

Baron Fung 是戴尔奥罗集团(Dell ’ Oro Group)的高级研究总监,负责数据中心 IT 资本支出、半导体与组件,以及以太网适配器与智能网卡研究项目

虽然整体趋势是「全面转向 AI」,但各家打法并不相同:

亚马逊与谷歌聚焦自研 AI 加速器,围绕内部芯片构建数据中心;

微软则持续重金押注 OpenAI 以及自己的 AI 平台战略;

Oracle借 Stargate 项目强势崛起,迅速构建新一代 AI 算力园区;

Meta正在打造当前全球最庞大的 AI 数据中心项目,代表作包括 Prometheus 与 Hyperion。

Baron Fung 表示,这类新一代数据中心将集成大规模 AI 集群、高密度加速卡机架、先进网络连接与支持型存储系统。

「预计未来 2 到 3 年内,数十 GW 级的新超级数据中心产能将陆续上线,服务对象既包括内部 AI 平台,也涵盖大客户的关键 AI 工作负载。」Fung 总结道。

但与此同时,电力短缺、设备交付周期拉长以及地方政府与社区的反对,也让扩张变得日益困难。

那些 AI 数据中心年入千万美元,而且零交通压力,零学区负担,看起来只会带来现金流。

这番说辞深得美国政界青睐——白宫如此,各州政府亦如此。

但对数据中心附近的居民而言,「根本没有好处可言」。

因为这些算力设施全天候 24 小时运转,内部部署着数以千计的服务器,而服务器需要大量电力与水来保持冷却。

一方面,数据中心建设热潮助推了 AI 革命;另一方面,AI 热潮可能耗尽美国电网资源、榨干普通人的钱包。

AI 正在推高电价,而没有人对此感到满意。甚至有媒体称:

美国对数据中心的「战争」即将到来。

2025 年 12 月 1 日,密歇根州塞林(Saline)的居民集会,反对一座耗资 70 亿美元的「星际之门」(Stargate)数据中心。

根据美国能源信息署(EIA)的数据,自 2022 年以来,全美几乎所有地区的居民零售电价涨幅均超过通胀率,且这一现象很可能持续至 2026 年。

比如,去年,新泽西州的电费账单上涨了约 20%。

美国电价飙升的深层矛盾源于积弊数十年的结构性问题:老化的基础设施亟待更新,而过时的商业模式与法规体系拖慢了电网升级的步伐。

而数据中心建设浪潮,给美国的电力供应体系前所未有的难题。

据《Data Center Watch》统计,反对数据中心建设的浪潮正在加速:

2025 年仅第二季度就有 980 亿美元的在建项目受到阻碍或严重拖延。

去年上半年,美国已有 36 个项目涉及投资高达 1620 亿美元的 AI 算力项目受到阻碍或严重拖延。

如果说 AI 热潮给全世界带来了硬件短缺,那给美国带来的更严重的问题将是电力短缺。

保算力,还是保电力,成了美国不得不考虑的问题。

要支持数十 GW 级的新超级数据中心产能,电力而非算力卡了美国 AI 的脖子。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

马斯克 谷歌 gpu 旧金山 芯片
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论