
OpenAI 的财务命运正日益被基础设施成本所绑定,这一现实直接催生了其首款定制芯片 "OpenAI Jalape ñ o" 的诞生。这款由 OpenAI 与博通(Broadcom)联合研发的专用集成电路(ASIC),旨在通过摆脱对第三方硬件的高度依赖,缓解惊人的资本支出压力。
当前的 AI 算力市场格局中,英伟达在高端处理器上享有约 75% 的利润率,而 OpenAI 的盈利空间则显得捉襟见肘。扣除庞大的运营费用后,OpenAI 每产生 1 美元收入仅能保留约 33 美分利润。随着 ChatGPT 周活跃用户达到 9 亿,维持服务器响应的成本去年已高达 84 亿美元,预计今年将攀升至 140 亿美元。更为严峻的是,OpenAI 已承诺在未来八年内投入约 1.4 万亿美元用于计算能力建设,这对于一家年营收 250 亿美元的公司而言,是一场关乎生死的技术赌注。
专为大模型推理打造的 " 智能处理器 "
Jalape ñ o 并非通用 AI 加速器,而是专门为大型语言模型(LLM)推理任务构建的 " 智能处理器 "。OpenAI 提供了基于其模型路线图的核心架构设计,博通则负责硅工程与高性能网络集成,台积电承担物理制造,Celestica 负责主板及机架系统组装。
OpenAI 硬件项目主管 Richard Ho 表示,该架构通过最小化数据移动,使实际利用率更接近理论峰值性能。与从传统负载改编的通用加速器不同,Jalape ñ o 专门平衡了计算、内存和网络资源,以解决交互式 LLM 服务中原生的数据移动瓶颈。此外,平台集成了博通的 Tomahawk 网络硅片,确保定制处理器能在庞大的集群数据中心环境中高效通信。目前,早期实验室样品已在目标频率和功耗下成功运行包括未发布的 GPT-5.3-Codex-Spark 在内的前沿工作负载。
垂直整合:构建基础设施飞轮
推出自有芯片标志着 OpenAI 从纯软件层向垂直整合基础设施公司的转型。这种全栈策略覆盖了芯片架构、软件内核、内存系统、网络调度及应用层。正如苹果将专有硬件与 iOS 深度耦合,OpenAI 现在可以围绕其内部确切的模型路线图优化基础设施。
这种整合正在形成一个运营飞轮:基础设施效率提升降低了训练和服务成本,更低廉的成本带来更优质、响应更快的产品,进而推动用户量和收入增长,收益再被重新投入下一代定制基础设施的研发。
9 个月极速流片,弥补后发劣势
在专有硬件领域,OpenAI 面临谷歌、亚马逊等巨头近十年的先发优势。谷歌 TPU 已控制全球约四分之一的非英伟达 AI 算力,亚马逊定制芯片出货量超百万颗,Meta 和微软也在持续扩张自有设施。
为弥补时间差距,OpenAI 加速了开发进程。Jalape ñ o 从空白设计到制造流片仅用时九个月。工程团队利用 OpenAI 自身的语言模型自动化和优化部分硬件设计流程,创造了独特的反馈循环:服务于用户的模型,正被用于构建运行未来迭代版本的物理基础设施。
OpenAI 总裁兼联合创始人 Greg Brockman 指出,Jalape ñ o 是长期全栈基础设施战略的一部分,旨在通过自行设计更多技术栈,使计算资源更加充裕,从而更高效地提供智能服务。首批硬件部署定于 2026 年底开始。博通首席执行官陈福阳确认,随着微软等合作伙伴的加入, rollout 规模将扩大,以准备千兆瓦级数据中心的集成。
【星途科讯 图文丨 Patrick 首发于 ZAKER 科技,转载请注明出处】


