OpenAI自研芯片Jalapeño曝光：9个月极速流片，剑指万亿算力成本

OpenAI 的财务命运正日益被基础设施成本所绑定，这一现实直接催生了其首款定制芯片 "OpenAI Jalape ñ o" 的诞生。这款由 OpenAI 与博通（Broadcom）联合研发的专用集成电路（ASIC），旨在通过摆脱对第三方硬件的高度依赖，缓解惊人的资本支出压力。

当前的 AI 算力市场格局中，英伟达在高端处理器上享有约 75% 的利润率，而 OpenAI 的盈利空间则显得捉襟见肘。扣除庞大的运营费用后，OpenAI 每产生 1 美元收入仅能保留约 33 美分利润。随着 ChatGPT 周活跃用户达到 9 亿，维持服务器响应的成本去年已高达 84 亿美元，预计今年将攀升至 140 亿美元。更为严峻的是，OpenAI 已承诺在未来八年内投入约 1.4 万亿美元用于计算能力建设，这对于一家年营收 250 亿美元的公司而言，是一场关乎生死的技术赌注。

专为大模型推理打造的 " 智能处理器 "

Jalape ñ o 并非通用 AI 加速器，而是专门为大型语言模型（LLM）推理任务构建的 " 智能处理器 "。OpenAI 提供了基于其模型路线图的核心架构设计，博通则负责硅工程与高性能网络集成，台积电承担物理制造，Celestica 负责主板及机架系统组装。

OpenAI 硬件项目主管 Richard Ho 表示，该架构通过最小化数据移动，使实际利用率更接近理论峰值性能。与从传统负载改编的通用加速器不同，Jalape ñ o 专门平衡了计算、内存和网络资源，以解决交互式 LLM 服务中原生的数据移动瓶颈。此外，平台集成了博通的 Tomahawk 网络硅片，确保定制处理器能在庞大的集群数据中心环境中高效通信。目前，早期实验室样品已在目标频率和功耗下成功运行包括未发布的 GPT-5.3-Codex-Spark 在内的前沿工作负载。

垂直整合：构建基础设施飞轮

推出自有芯片标志着 OpenAI 从纯软件层向垂直整合基础设施公司的转型。这种全栈策略覆盖了芯片架构、软件内核、内存系统、网络调度及应用层。正如苹果将专有硬件与 iOS 深度耦合，OpenAI 现在可以围绕其内部确切的模型路线图优化基础设施。

这种整合正在形成一个运营飞轮：基础设施效率提升降低了训练和服务成本，更低廉的成本带来更优质、响应更快的产品，进而推动用户量和收入增长，收益再被重新投入下一代定制基础设施的研发。

9 个月极速流片，弥补后发劣势

在专有硬件领域，OpenAI 面临谷歌、亚马逊等巨头近十年的先发优势。谷歌 TPU 已控制全球约四分之一的非英伟达 AI 算力，亚马逊定制芯片出货量超百万颗，Meta 和微软也在持续扩张自有设施。

为弥补时间差距，OpenAI 加速了开发进程。Jalape ñ o 从空白设计到制造流片仅用时九个月。工程团队利用 OpenAI 自身的语言模型自动化和优化部分硬件设计流程，创造了独特的反馈循环：服务于用户的模型，正被用于构建运行未来迭代版本的物理基础设施。

OpenAI 总裁兼联合创始人 Greg Brockman 指出，Jalape ñ o 是长期全栈基础设施战略的一部分，旨在通过自行设计更多技术栈，使计算资源更加充裕，从而更高效地提供智能服务。首批硬件部署定于 2026 年底开始。博通首席执行官陈福阳确认，随着微软等合作伙伴的加入， rollout 规模将扩大，以准备千兆瓦级数据中心的集成。

【星途科讯图文丨 Patrick 首发于 ZAKER 科技，转载请注明出处】

宙世代

一起剪

相关标签