星途科讯 1小时前
OpenAI自研芯片Jalapeño曝光:9个月极速流片,剑指万亿算力成本
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

OpenAI 的财务命运正日益被基础设施成本所绑定,这一现实直接催生了其首款定制芯片 "OpenAI Jalape ñ o" 的诞生。这款由 OpenAI 与博通(Broadcom)联合研发的专用集成电路(ASIC),旨在通过摆脱对第三方硬件的高度依赖,缓解惊人的资本支出压力。

当前的 AI 算力市场格局中,英伟达在高端处理器上享有约 75% 的利润率,而 OpenAI 的盈利空间则显得捉襟见肘。扣除庞大的运营费用后,OpenAI 每产生 1 美元收入仅能保留约 33 美分利润。随着 ChatGPT 周活跃用户达到 9 亿,维持服务器响应的成本去年已高达 84 亿美元,预计今年将攀升至 140 亿美元。更为严峻的是,OpenAI 已承诺在未来八年内投入约 1.4 万亿美元用于计算能力建设,这对于一家年营收 250 亿美元的公司而言,是一场关乎生死的技术赌注。

专为大模型推理打造的 " 智能处理器 "

Jalape ñ o 并非通用 AI 加速器,而是专门为大型语言模型(LLM)推理任务构建的 " 智能处理器 "。OpenAI 提供了基于其模型路线图的核心架构设计,博通则负责硅工程与高性能网络集成,台积电承担物理制造,Celestica 负责主板及机架系统组装。

OpenAI 硬件项目主管 Richard Ho 表示,该架构通过最小化数据移动,使实际利用率更接近理论峰值性能。与从传统负载改编的通用加速器不同,Jalape ñ o 专门平衡了计算、内存和网络资源,以解决交互式 LLM 服务中原生的数据移动瓶颈。此外,平台集成了博通的 Tomahawk 网络硅片,确保定制处理器能在庞大的集群数据中心环境中高效通信。目前,早期实验室样品已在目标频率和功耗下成功运行包括未发布的 GPT-5.3-Codex-Spark 在内的前沿工作负载。

垂直整合:构建基础设施飞轮

推出自有芯片标志着 OpenAI 从纯软件层向垂直整合基础设施公司的转型。这种全栈策略覆盖了芯片架构、软件内核、内存系统、网络调度及应用层。正如苹果将专有硬件与 iOS 深度耦合,OpenAI 现在可以围绕其内部确切的模型路线图优化基础设施。

这种整合正在形成一个运营飞轮:基础设施效率提升降低了训练和服务成本,更低廉的成本带来更优质、响应更快的产品,进而推动用户量和收入增长,收益再被重新投入下一代定制基础设施的研发。

9 个月极速流片,弥补后发劣势

在专有硬件领域,OpenAI 面临谷歌、亚马逊等巨头近十年的先发优势。谷歌 TPU 已控制全球约四分之一的非英伟达 AI 算力,亚马逊定制芯片出货量超百万颗,Meta 和微软也在持续扩张自有设施。

为弥补时间差距,OpenAI 加速了开发进程。Jalape ñ o 从空白设计到制造流片仅用时九个月。工程团队利用 OpenAI 自身的语言模型自动化和优化部分硬件设计流程,创造了独特的反馈循环:服务于用户的模型,正被用于构建运行未来迭代版本的物理基础设施。

OpenAI 总裁兼联合创始人 Greg Brockman 指出,Jalape ñ o 是长期全栈基础设施战略的一部分,旨在通过自行设计更多技术栈,使计算资源更加充裕,从而更高效地提供智能服务。首批硬件部署定于 2026 年底开始。博通首席执行官陈福阳确认,随着微软等合作伙伴的加入, rollout 规模将扩大,以准备千兆瓦级数据中心的集成。

【星途科讯 图文丨 Patrick 首发于 ZAKER 科技,转载请注明出处】

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

谷歌 亚马逊 芯片 基础设施 博通
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论