
【新智元导读】全网震撼!马斯克官宣,全球首个吉瓦级超算 Colossus 2 正式上线,狂堆 55 万块 GPU,目标直指百万。下一代 Grok 5 已在训练,6 万亿参数将引爆智能奇点。
全球首个吉瓦级训练集群!
马斯克一早激动官宣,专为训下一代 Grok 打造的「超算巨兽」Colossus 2,今天正式上线。

它可是全球首个,达到吉瓦级的 AI 训练集群。这是什么概念?

Colossus 2 的用电,要比旧金山全市用电峰值还要高。
预计在今年 4 月,升级到 1.5GW,约等于一座大型核电站的输出。

OpenAI、Anthropic 在内的很多劲敌还在规划 2027 年路线图,xAI 这边直接把「城市级」算力搞定了。
更夸张的,是他们的执行速度:
Colossus 1:从零到全面上线,只用了 122 天
Colossus 2:刚突破 1GW 门槛,目标直接冲着总共 2GW 去

Epoch AI 此前一份报告称,Colossus 2 将拥有相当于 140 万块 H100 GPU 等效算力
暴力出奇迹,依旧是马斯克坚信的路线—— Scaling 算力对于快速逼近「奇点」那一刻至关重要。
毕竟,在马斯克的叙事中,未来全球最强的 AI 玩家中,只有谷歌和 xAI。

全球首个 GW 级超算:55 万 GPU
xAI 展现出的惊人速度,连老黄都为之惊叹。他曾这样高度评价道——
马斯克对工程学的理解是独一无二的。别人需要 1 年完成的事情,xAI 仅用 19 天就搞定了。
外界对于 Colossus 1 的了解,要比 Colossus 2 系统得多。
从 0 开始仅用 122 天就拔地而起,拥有大约 20 万张 H100/H200,以及约 3 万张 GB200 NVL72。
去年,SemiAnalysis 高级分析师一篇文章,曾深度分析了 Colossus 2 工程设计和所取得的成就。
接下来,就扒一下其背后的细节。

六个月,从 0 到 200MW
Colossus 2 项目,于 2025 年 3 月 7 日启动。
它将配备 55 万块芯片,由 GB200 和 GB300 GPU 组成,最终未来扩展到百万 GPU。
当时 xAI 在孟菲斯(Memphis)收购了一个 100 万平方英尺的仓库,以及两个总计 100 英亩的相邻地块。

不到六个月的时间,SemiAnalysis 统计了现场已部署 119 台风冷冷水机组,即大约 200MW 的冷却能力。
这就足以驱动,大约 11 万张 GB200 NVL72。
而且,这个巨大的超算,全部采用的是液冷设计。

马斯克一条推文显示,一些机架在 7 月份就已经安装好了
令人惊叹的是,xAI 只用了 6 个月就完成了甲骨文、OpenAI花了 15 个月才完成的工作!
据介绍, Colossus 2 造价高达数百亿美元。而 xAI 现在基本没外部收入,主要靠母公司 X 输血。
而且,报告里特意提了一嘴——
马斯克跟中东几个「土豪」关系很铁,沙特、阿联酋、卡塔尔的主权基金,都是潜在的金主。

Grok 5 在训,奇点更近了
Colossus 2 的全面上线,也意味着「全球首个吉瓦级大模型」—— Grok 即将出世。
马斯克曾坚定地表示,xAI 有机会通过 Grok 5 实现 AGI。


此前,在一期采访中,马斯克还表示 Grok 5 拥有高达 6 万亿参数,而且智能密度更高,预计将在上半年发布。
不仅如此,它还原生支持视频理解。

可以预见,在首个吉瓦级超算上训出的 Grok 5,实力一定超乎想象。
爆冲 2GW,今年上线
去年 12 月底,马斯克斥资超 200 亿美元,买下了孟菲斯第三栋建筑,计划将 Colossus 总容量扩展至 2GW。
这栋新建筑—— MACROHARDRR,延续了 Macrohard 命名,位于 Colossus 2 旁,占地面积超 80 万平方英尺。


Grok 估计,在 2025 年中,按 AI 算力排名前 10 中,Colossus 2 和特斯拉 Dojo 位居第一和第 7:

在 AI 算力上,马斯克疯狂加码,甚至他「已经在规划 10GW 甚至更高的算力」。

狂飙吉瓦级超算,硅谷巨头乱战
如今,全世界 AI 巨头们,正掀起一场前所未有的算力军备赛。
除了马斯克 xAI 之外,OpenAI、Meta、Anthropic 也在纷纷加码,目标直指吉瓦(GW)级,甚至更大规模的 AI 超算。

2022 年 GPT 发布以来,OpenAI、xAI、Anthropic、Meta Superintelligence 等 AI 训练算力飙升
OpenAI:星际之门
「星际之门」,便是众所周知的典型代表之一。
2025 年 1 月初,OpenAI 联合软银、甲骨文等伙伴正式启动了名为「星际之门」(Stargate)的宏大计划。
这项「AI 曼哈顿计划」,要在未来 4 年砸 5000 亿美金,建设总容量达到 10GW 的集群。
首期立即部署 1000 亿美元,如今进展迅猛。


去年 9 月,OpenAI 公布了五个新站点,要在未来三年,实现 7GW 算力规模。
这样的规模相当于同时为数百万家庭供电,却全部用于驱动 AI 训练与推理。

Meta:普罗米修斯
Meta 同样在加速狂奔。
早在去年,小扎就公开了资金代号 Prometheus(普罗米修斯)的 GW 级 AI 超算项目,目标在 2026 年上半年上线。

不仅如此,Meta 正在建设多个吉瓦级集群:
Prometheus 预计 2026 年率先达到 1GW+
后续的 Hyperion 项目,计划逐步扩展到 5GW 规模,占地堪比曼哈顿相当一部分区域

几天前,小扎再次重磅宣布启动全新顶级计划—— Meta Compute。
计划明确表示,将在本十年内建设数十吉瓦 AI 超算,长期目标甚至指向数百吉瓦级别。

为此,Meta 内部已组建专责团队,并与核电企业签订长期协议,确保能源供应跟得上疯狂扩张的步伐。
Anthropic:百万 TPU 下单,GPU 也要
Anthropic 选择了一条更聚焦的路线:深度绑定 Google Cloud 的 TPU。
去年 10 月官宣,将把 Google Cloud TPU 扩展到最多 100 万颗 TPU,合同价值数百亿美元。

而且,预计在 2026 年上线远超 1GW 的容量。

而且,Anthropic 采用多平台策略,同时使用谷歌 TPU、亚马逊 Trainium 和英伟达 GPU。
如今,AI 竞赛的胜负手,正从模型参数本身向基础设施倾斜。
硅谷巨头们狂建超算,原因很简单:下一代前沿模型所需的算力远超想象。
这场吉瓦级超算的全球军备赛,才刚刚拉开帷幕。
6 千亿算力投资,AI 榨干美国人钱包?
网友直呼,马斯克的算力赌注「太疯狂了。AGI 最难的部分已不再是数学,而是字面意义上的能不能找到足够多的电源插座」。

2026 年,这一趋势只会愈演愈烈——
亚马逊 AWS、微软、谷歌、Meta、甲骨文(Oracle)等超级云计算巨头正加速扩张。

它们的资本支出预计将超过 6000 亿美元,重点已全面转向 AI 专用基础设施建设,边缘服务成为次要关注点。
独立的市场研究和分析公司 Dell ’ Oro 分析师 Baron Fung 指出:「预计在未来 2 至 3 年内,这些部署将新增数十 GW 总电力容量,反映出加速计算对算力规模和密度提出了极高要求。」

Baron Fung 是戴尔奥罗集团(Dell ’ Oro Group)的高级研究总监,负责数据中心 IT 资本支出、半导体与组件,以及以太网适配器与智能网卡研究项目
虽然整体趋势是「全面转向 AI」,但各家打法并不相同:
亚马逊与谷歌聚焦自研 AI 加速器,围绕内部芯片构建数据中心;
微软则持续重金押注 OpenAI 以及自己的 AI 平台战略;
Oracle借 Stargate 项目强势崛起,迅速构建新一代 AI 算力园区;
Meta正在打造当前全球最庞大的 AI 数据中心项目,代表作包括 Prometheus 与 Hyperion。
Baron Fung 表示,这类新一代数据中心将集成大规模 AI 集群、高密度加速卡机架、先进网络连接与支持型存储系统。
「预计未来 2 到 3 年内,数十 GW 级的新超级数据中心产能将陆续上线,服务对象既包括内部 AI 平台,也涵盖大客户的关键 AI 工作负载。」Fung 总结道。
但与此同时,电力短缺、设备交付周期拉长以及地方政府与社区的反对,也让扩张变得日益困难。
那些 AI 数据中心年入千万美元,而且零交通压力,零学区负担,看起来只会带来现金流。
这番说辞深得美国政界青睐——白宫如此,各州政府亦如此。
但对数据中心附近的居民而言,「根本没有好处可言」。
因为这些算力设施全天候 24 小时运转,内部部署着数以千计的服务器,而服务器需要大量电力与水来保持冷却。
一方面,数据中心建设热潮助推了 AI 革命;另一方面,AI 热潮可能耗尽美国电网资源、榨干普通人的钱包。

AI 正在推高电价,而没有人对此感到满意。甚至有媒体称:
美国对数据中心的「战争」即将到来。

2025 年 12 月 1 日,密歇根州塞林(Saline)的居民集会,反对一座耗资 70 亿美元的「星际之门」(Stargate)数据中心。
根据美国能源信息署(EIA)的数据,自 2022 年以来,全美几乎所有地区的居民零售电价涨幅均超过通胀率,且这一现象很可能持续至 2026 年。
比如,去年,新泽西州的电费账单上涨了约 20%。

美国电价飙升的深层矛盾源于积弊数十年的结构性问题:老化的基础设施亟待更新,而过时的商业模式与法规体系拖慢了电网升级的步伐。
而数据中心建设浪潮,给美国的电力供应体系前所未有的难题。
据《Data Center Watch》统计,反对数据中心建设的浪潮正在加速:
2025 年仅第二季度就有 980 亿美元的在建项目受到阻碍或严重拖延。
去年上半年,美国已有 36 个项目涉及投资高达 1620 亿美元的 AI 算力项目受到阻碍或严重拖延。

如果说 AI 热潮给全世界带来了硬件短缺,那给美国带来的更严重的问题将是电力短缺。
保算力,还是保电力,成了美国不得不考虑的问题。
要支持数十 GW 级的新超级数据中心产能,电力而非算力卡了美国 AI 的脖子。


登录后才可以发布评论哦
打开小程序可以发布评论哦