OpenAI博通联手发芯片，黄仁勋还能保持松弛吗？

文 | 字母 AI

黄仁勋近年来的变化，就是头发比以前白了。

有人说白头发是因为基因、岁数，也有一部分人认为，是因为焦虑、压力。

2026 年 5 月，黄仁勋在斯坦福大学面向在校学生的公开演讲中说到，" 我 90％的工作都是硬撑，但任何工作，我都努力做到最好。"

实际上早在 33 年前，黄仁勋在采访中就曾表示过他自己的压力，黄仁勋说 " 英伟达距离倒闭只有 30 天。"

最近黄仁勋又多了一个头发变白的理由，那就是 OpenAI 和博通一起发布了 Jalape ñ o 芯片。

这是 OpenAI 第一颗自研的推理芯片。从设计到流片只用了九个月，目标部署 10GW，而且这颗芯片已经可以跑 GPT-5.3 了。

OpenAI 跟 Anthropic 不一样，后者又有谷歌的 TPU，又有亚马逊的 Trainium。OpenAI 此前一直是坚定的英伟达用户，现在有了 Cerebras 还不够，又和博通混到了一起。

英伟达还在狂奔，但英伟达有敌人了

5 月 20 日，英伟达公布了最新一个季度的财报。单季营收 816 亿美元，毛利率是 74.9%，自由现金流接近 490 亿美元。数据中心收入 752 亿美元，同比增长 92%。

显然，英伟达仍然在春风得意。

但现在的局面就是，英伟达正在被围攻。

就拿博通来说吧，他们最近的财报就很亮眼。在最新一个季度里，公司 AI 半导体业务收入达到 108 亿美元，同比增长 143%。

而博通预计，2026 财年这块业务的收入将达到约 560 亿美元，而上一个财年约为 200 亿美元。

博通跟英伟达不一样，博通做的是 ASIC，也就是 " 按客户需求定做的 AI 芯片 "。客户想要什么芯片，它就帮客户专门做什么芯片。

现在的 AI 算力不是一颗芯片在工作，而是几万、几十万颗芯片组成一个集群一起工作。模型训练时，芯片要不断交换参数；推理时，尤其是专家模型和长上下文任务，芯片之间也要频繁传数据。

也就是说你芯片算得再快，如果网络跟不上，整个算力集群就会被最慢的通信环节拖住。

这就是博通的优势了，博通本质上是一个通信公司。它除了做 ASIC 以外，还给它的客户做连接这些芯片的高速以太网交换芯片。

比如博通最新的 Tomahawk 6 交换芯片，单颗交换能力达到 102.4Tbps，面向的就是超大规模 AI 集群。OpenAI 与博通的 10GW 合作公告里就明确写到，合作内容也不只包括定制 AI 加速器，还明确包括配套的 Ethernet 网络方案。

还有一点，博通足够 " 中立 "。

这是很多人都会忽略的地方。无论是 OpenAI 也好，还是 Anthropic 也好，他们都不希望把自己的核心芯片计划交给另一家也在做大模型、做云服务的公司。

而博通刚好不做模型、不卖云，它也不和客户抢最终用户。就是因为这层身份在，所以 OpenAI 和 Anthropic 才会都选择它。

英伟达现在的对手可不只有博通，还有亚马逊。

AWS 虽然不单独披露 Trainium 的收入，但亚马逊 CEO 安迪 · 杰西（Andy Jassy）在今年 4 月的股东信里表示，包括 Trainium、Graviton 和 Nitro 在内，亚马逊的自研芯片业务，年化收入已经突破 200 亿美元。

关键后面他还补了一刀，说如果把这个芯片部门当成独立公司，让亚马逊在 2026 年生产的所有芯片，按市场价卖给 AWS 和外部客户，那么年收入大约是 500 亿美元。

其实亚马逊的 Trainium 芯片，正在成为亚马逊第二大生意。

谷歌这边，情况也是一样的。

Anthropic 在去年 10 月拿到了最多 100 万颗谷歌 TPU 的使用权，超过 1GW 的算力容量在 2026 年上线。今年 4 月，Anthropic 又跟谷歌和博通签了新的协议，锁定了约 3.5GW 的下一代 TPU 算力，2027 年开始交付。

与此同时，谷歌云的单季收入在 2026 年第一季度首破 200 亿美元，同比增长 63%，谷歌还披露其 AI Agent 相关收入同比增长了 800%。

OpenAI 和 Anthropic 正在脱离英伟达的管控

英伟达除了要面对四面八方围过来的友商，还得去应付 OpenAI 和 Anthropic 这两个小弟。

OpenAI 现在把算力分成了两条路线，一条还是英伟达，另一条线是 Cerebras 和博通。

Cerebras 做的东西跟市面上所有 AI 芯片都不一样，它用的是晶圆级芯片，一整片晶圆就是一个处理器，上面有几十万个计算核心。这种架构的核心优势是数据移动极少，延迟极低。

对推理来说，延迟低意味着模型输出更快。

今年 1 月，OpenAI 跟 Cerebras 签了一份价值超过 200 亿美元的多年期协议，承诺部署 750MW 的 Cerebras 推理算力，交付时间横跨到 2028 年。

基于这笔合同，Cerebras 拿到了 OpenAI 给的 10 亿美元运营资金贷款，随后在 5 月完成了 64 亿美元的 IPO。

Cerebras 的年收入指引还不到 9 亿美元，但一份 OpenAI 的合同就给这家公司带来了超过 200 亿美元的收入。

甚至我可以断言，Cerebras 现在就是 OpenAI 的硬件部门。

博通跟 Cerebras 不同的地方在于，后者签的订单是算力合同。要在规定的时间内，给 OpenAI 提供一定规模的推理服务。

而前者的订单内容，是 OpenAI 自己主导设计芯片。OpenAI 最清楚自家模型推理时，算力、内存、KV Cache、网络通信分别卡在哪里。

这就跟买车一样，你只开公路，那就没必要选配越野轮胎、四驱和底盘护板，这些配置只有越野的时候才有用，公路完全用不上。你就能把这钱省下来去升级别的地方。

这是 OpenAI 的第一颗自研推理芯片，从架构设计到流片只用了九个月。

博通说这是先进半导体历史上最快的 ASIC 开发周期。Jalape ñ o 从一张白纸开始，完全围绕 ChatGPT 的推理进行设计。

GPT-5.3-Codex-Spark 已经在实验室里跑在 Jalape ñ o 工程样片上，跑的是生产环境的目标频率和功耗。OpenAI 的说法是，每瓦性能 " 远超当前最先进水平 "。

Jalape ñ o 的目标部署规模是 10GW，相当于 10 座大型核电站。

虽然在训练端，OpenAI 仍然离不开英伟达 GPU。因为前沿大模型训练对算力密度和互联带宽的要求非常高，目前只有英伟达的 GPU 能够满足 OpenAI 的标准。

但推理不同。推理是稳定、海量、重复的工作负载。每天几亿人问 ChatGPT 同样类型的问题，模型结构不变，计算模式高度可预测。

这种负载最适合被专用化，把通用 GPU 里那些用不上的电路全都砍掉，只保留大模型推理需要的部分，便宜而且高效。

Anthropic 走的是另一条路。

它把推理和训练一起押在了 AWS Trainium 上。Trainium 是 AWS 自己的 AI 芯片，兼顾训练和推理。

今年 4 月，亚马逊又向 Anthropic 投了 50 亿美元，累计投资达到 130 亿美元，并保留了追加至多 200 亿美元的权利。

礼尚往来，Anthropic 承诺未来十年在 AWS 上花费超过 1000 亿美元，锁定 5GW 的 Trainium 算力，覆盖 Trainium2 到 Trainium4 三代芯片、数千万颗 Graviton CPU。

围绕这个超级大合同，亚马逊在印第安纳州建了两个巨型数据中心园区，名为 "Rainier 项目 "，规划总容量约 4.7GW。

我简单算了算，如果 OpenAI 和 Anthropic 两个大型园区全天运行，一年要消耗掉 1288 亿度电，相当于 15 座大型核电站。

这个数字可能看着有点虚，我换成热量你就能看懂了。14.7GW 功率下，每秒消耗是 147 亿焦耳（14.7 × 10 ⁹ J），那么每天就是 1.27 × 10 ¹ ⁵焦耳。相当于 30.4 万吨 TNT。

然而，就是这么大一笔订单，却全然和英伟达一毛钱关系都没有。

博通突然上位

最后回过头来看博通。

你有没有想过这么一个问题，为什么 OpenAI、Anthropic 的 " 去英伟达 " 路线，最后都得经过博通？

就拿 OpenAI 来说，明明它可以仰仗微软，毕竟 OpenAI 本来就有很大一部分算力是从微软的 Azure 买来的。但现实就是，OpenAI 正在远离微软。

这里面的核心逻辑是，OpenAI 和 Anthropic 都想要芯片的 " 定义权 "。

看似 OpenAI 跟博通开发 Jalape ñ o 芯片的整个过程中付出了很多，设计了整个芯片。可如果你了解芯片行业你就清楚，设计芯片其实是行业内最简单的部分，难的是后面的工程化、量产和网络系统。而这些部分，全都掌握在博通手里。

一颗 AI 芯片，真正跟模型推理直接相关的计算逻辑，可能只占整个芯片面积的一半不到。

剩下这些用来搬运数据、串行接口、主机通信的模块，每一块都极其复杂，从头设计任何一块都要几十个工程师干大半年。

博通做了几十年通信芯片，这些 IP 全是现成的。之所以 Jalape ñ o 九个月能从图纸到流片，其实跟新闻稿中提到的 OpenAI 用 AI 设计芯片关系不大，真正靠的是博通丰富的基础设施。

2023 年 AI 刚火起来的时候，所有人的眼睛都盯着英伟达。GPU 是稀缺品，H100 一卡难求，英伟达的市值从几千亿一路冲到几万亿。博通那阵子反而没什么声音。

随着行业的发展，博通开始意识到，想自己造芯片的 AI 公司越来越多。不过大家都不想从头开始研究芯片，又累又苦又费时间精力。

所以就催生出了一个新词，叫做 " 芯片自主权外包 "。

博通的位置刚好卡在这里，我能帮你设计，我帮你找代工厂，我帮你管供应链，我帮你做网络。最后芯片是你的，你想怎么用怎么用，不用跟我分成。

博通赚的不是产品的钱，是服务的钱。这就导致博通的客户越成功，博通的生意就越大。

而这件事，英伟达做不了。不是技术上做不了，是商业模式上做不了，因为英伟达卖的是成品，它只懂成品那套逻辑。

博通是把整套链路全都铺满了，你任何一个环节有需求，博通都能给你找到对应的价码。

还有一层。英伟达的客户之间是竞争关系。

它如果帮 OpenAI 设计芯片，Anthropic 会怎么想？谷歌会怎么想？Meta 会怎么想？

而且英伟达现在还需要面对一个问题：造芯片的钱，很大一部分根本不是它赚的。

一颗 GPU，最贵的部分不是核心，是旁边堆的那几层 HBM。HBM 是一种堆叠式高带宽内存，模型参数越大，需要的 HBM 越多。

全球能大规模量产 HBM 的，就那么几家。比如三星和 SK 海力士，这两家几乎平分了这个市场。

换句话说，英伟达卖一颗 GPU，里面相当一部分收入转手就交给了韩国人。更何况 HBM 的产能本身就紧张，扩产周期极长。一座 HBM 工厂从规划到量产要好几年，比建 GPU 的先进封装产线还慢。

所以这就是今天的黄仁勋，前有狼后有虎，手里牵着的两个娃还不老实。

宙世代

一起剪

相关标签