GPT设计GPT_ZAKER新闻

文 | 版面之外，作者｜画画

OpenAI 终于做芯片了。

很多人看到这条新闻，第一反应是：英伟达麻烦了。

但我看到的恰恰相反。

首款芯片 Jalapeño 最重要的意义，并非直奔着英伟达而来。

这是 OpenAI 第一次公开承认，自己不满足于做一家模型公司了。

它想控制的，是生产智能的整个过程。

从模型，到芯片。从数据中心，到能源。从训练，到推理。从生产 Token，到销售 Token。

Jalapeño 表面是一颗芯片，实际上更像一张路线图。

OpenAI 终于把自己的野心摆到了桌面上。

一、模型差距在缩小，计算差距在扩大

自从大模型爆发以来，AI 行业几乎所有注意力都在模型。

GPT-4 出来行业被震一次，Claude 追上来，Gemini 追上来，DeepSeek 把性价比打出来，Meta 推开源。每次发布大家盯着同一组东西：参数、榜单、代码能力、数学能力、长上下文、多模态。

模型当然重要。但一个变化已经出现，模型领先的窗口正在变短。今天一个模型刚发布，几个月后开源社区、竞争对手、云厂商就会跟上。能力差距仍然存在，但越来越难独立构成长期壁垒。

真正拉开差距的东西，开始往更底层走。算力供应、推理成本、系统吞吐、网络能力、数据中心建设、能源获取。没有模型发布那么好看，也不会立刻刷屏。但它们决定一家 AI 公司能不能长期跑下去。

黄仁勋最近说了一句话：英伟达系统也许不是采购价格最低的，但能生成成本最低的 Token、最高的 Token 吞吐量，最终带来最高收入。

老黄这段话很直接。行业一直抱怨英伟达贵，黄仁勋没在采购价上辩解，而是把问题换到另一个维度：别看买机器花多少钱，要看每个 Token 的生产成本。

这就是 AI 时代新的账本。服务器和 GPU 不是最终单位，Token 才是。

OpenAI 恰好站在这个问题最中心。

ChatGPT 每天处理海量请求，Codex 要消耗更多推理步骤，未来还有 Agent、视频生成、机器人、长推理链。模型越有用，Token 消耗越大。产品越成功，推理账单越厚。

残酷的地方在这里，OpenAI 用户越多，英伟达越赚钱。OpenAI 产品越强，底层算力税越重。

如果每一个 Token 都要经过外部硬件平台收一道税，OpenAI 就很难拥有完整的护城河。它可以有最强模型，有超级入口，有开发者生态。但最核心的生产成本始终卡在别人手里。

Jalapeño 的本质就在这里。OpenAI 开始自己造 Token 工厂。

二、GPT 开始设计 GPT

Jalapeño 这款芯片最容易被低估的细节，是九个月流片。

传统高性能 ASIC 项目，周期通常 18 个月到 36 个月。先进工艺更麻烦，架构、验证、物理实现、封装、软件栈、调试，任何一环出问题成本迅速放大。OpenAI 和博通把周期压到了九个月。

这不能理解成芯片行业突然变简单。OpenAI 没有凭空长出一条半导体产业链。博通在定制芯片和网络基础设施上经验深厚，Celestica 负责板卡、机架和系统工程。

OpenAI 真正贡献的是更稀缺的东西，它知道未来模型要怎么跑。

很多芯片公司做 AI 加速器，难点在于猜负载。模型结构会变，推理方式会变，服务模式会变。芯片一旦流片，物理世界没有软件世界那么好回滚。

OpenAI 不用完全靠猜。每天运行 ChatGPT、Codex 和 API，知道哪些内核最常用，哪些内存搬运最浪费，哪些网络瓶颈最影响集群效率，哪些延迟会直接伤害产品体验。它还知道未来 Agent 产品会怎么消耗推理资源。

这些经验以前只是后台工程知识，现在被写进芯片架构。

在 OpenAI 的官方新闻稿里有一句话很关键：OpenAI 使用自己的模型加速了部分设计和优化流程。还说，提供给用户的模型也在帮助改进运行未来模型的基础设施。

GPT 开始参与设计下一代 GPT 的机器。

过去几十年芯片的链条是，先设计芯片，芯片运行软件，软件运行 AI。现在链条开始回头，AI 帮助人类设计芯片，芯片再运行下一代 AI。

一旦这个闭环成立，九个月可能只是开始。未来可能是六个月、三个月，甚至更密集的迭代。

芯片行业过去有自己的节奏，模型行业有自己的节奏。前者慢后者快。Jalapeño 把两个节奏往一起拉。

这一步如果走通，OpenAI 的飞轮会变得很吓人。更好的模型帮助设计更好的芯片，更好的芯片降低下一代模型运行成本，更低成本支撑更多用户和产品，更多用户和产品带来更多真实负载数据，这些数据再反过来定义下一代芯片。

这才是 OpenAI 真正想要的循环。

三、削减推理税，控制现金流

Jalapeño 不是训练芯片，它面向的是大语言模型推理。这点很关键。

训练像造航母。一次投入巨大，需要极强的通用能力，需要不断适配新模型新架构新实验。训练市场仍然高度依赖英伟达，不只是 GPU，而是 CUDA、网络、系统、软件库、开发者生态整套平台。

推理更像出租车队。每天跑，每小时跑，每分钟跑。用户每提一个问题，API 每响应一次，Agent 每推进一步，都要发生推理。它更在意低延迟、低成本、高吞吐、高利用率。

训练烧阶段性大钱，推理烧日常现金流。

这也是 AI 公司走到商业化阶段后最头疼的问题。GPT 训练一次很贵，但推理每天都在发生。Agent 时代会继续放大这个问题，一次任务可能包含几十次甚至几百次模型调用。长上下文、链式推理、多模态生成、代码执行，都在继续推高 Token 消耗。

Jalapeño 瞄准的就是这笔推理税。它更像 OpenAI 自己的 TPU。Google、亚马逊、Meta、微软都走过类似路线，只要负载足够大，自研 ASIC 就有高性价比的经济意义。

OpenAI 现在具备这个条件。有真实请求、有产品路线、有模型团队、有博通这样的产业伙伴，还有巨大的成本压力。

Jalapeño 不需要对外出售也能证明价值。只要它让 ChatGPT 回答更便宜、让 Codex 跑得更快、让 API 毛利更高，它就有意义。

OpenAI 还提到，Jalapeño 会减少数据传输，平衡计算、内存和网络资源，让实际利用率更接近理论峰值。算力贵很多时候贵在没被充分用起来，GPU 等待网络，内存搬运拖慢计算，调度不佳造成空转，所有浪费最后都变成电费和资本开支。

采购价只是第一层，系统效率才是最后的账。

四、OpenAI 越来越像苹果

很多人会把 Jalapeño 理解成 OpenAI 挑战英伟达，但我觉得 OpenAI 并不想成为下一家英伟达，更像是在学苹果。

苹果最厉害的地方从来不是某一个单点。iPhone 强，iOS 强，A 系列和 M 系列芯片强，App Store 强。但苹果真正难打的地方，是这些东西被放在同一个闭环里。

芯片为系统优化，系统为应用优化，应用体验再反过来定义下一代芯片。这套闭环让苹果可以在同样电池、同样体积、同样散热约束下，做出别人很难复制的体验。

OpenAI 正在搭类似的东西。模型是智能内核，ChatGPT 是超级入口，Codex 是开发工具，API 是生态分发层，Jalapeño 是自研芯片，数据中心是 AI 工厂。

OpenAI CEO Altman 这两年反复谈芯片、能源、核聚变、数据中心，现在看可能压根不是在追概念，他已经不再用 AI 创业公司的方式规划 OpenAI 了。

如果说英伟达卖铲子，那么 OpenAI 想拥有矿山。

英伟达要做所有 AI 公司的工厂设备供应商，卖 GPU、卖网络、卖系统、卖软件生态、卖 AI 工厂方案，理想客户是每一个需要生产 Token 的公司。

OpenAI 想给自己建一套工厂，卖的不是设备，是最终生成出来的智能。

短期看，OpenAI 离不开英伟达。训练和通用计算仍然需要 GPU 平台，Jalapeño 也不可能很快覆盖全部负载。它大概率先进入 OpenAI 最确定、规模最大、优化收益最高的推理场景。

长期看，裂缝已经出现。当模型公司开始拥有自己的芯片路线图，英伟达的客户就不再只是客户。它们也会成为 AI 基础设施的另一类玩家。

【版面之外】的话：

过去二十年，互联网最重要的资产是流量。谁掌握用户，谁掌握价值。

今天，AI 时代正在出现新的规律。

模型越来越像流量，而计算越来越像土地。

模型会迭代，产品会变化，排行榜会不断刷新。但那些生产智能的工厂，芯片、网络、数据中心、能源，会越来越集中在少数玩家手里。

GPT 开始设计 GPT，看起来只是一次流片。

但它真正宣告的事情是：

OpenAI 已经不满足于成为最聪明的公司，它想成为控制智能生产的公司。

宙世代

一起剪