OpenAI发布定制Jalapeno推理加速器：与博通合作，专为LLM与代理型AI设计

OpenAI 宣布，推出定制 Jalape ñ o 推理加速器，这是其内部专门开发，与博通合作，针对大型语言模型（LLM）推理加速及代理型人工智能（AI）设计的芯片，标志着 OpenAI 构建自身模型和产品背后全栈战略的重要一步。

Jalape ñ o 推理加速器配备了固定功能和可编程计算硬件，旨在加速 OpenAI 大语言模型堆栈的推理过程，为 ChatGPT、Codex、OpenAI API、以及其未来基于代理型 AI 产品提供支持。从概念上讲，Jalape ñ o 推理加速器与谷歌的 TPU 相似，只不过针对的设计对象换成了 OpenAI 技术栈。虽然 TPU 既用于训练也用于推理，但是 Jalape ñ o 似乎仅限于推理，训练工作可能仍然由 GPU 来完成。

OpenAI 表示，Jalape ñ o 是与博通共同打造的多代计算平台中的首个 AI 加速器，旨在让先进 AI 更快、更可靠、更易被更多人使用。其围绕 OpenAI 未来 LLM 推理愿景设计，从零开始起步，为行业当前及未来的 LLM 打造，从设计到生产仅用了九个月的时间就已完成，其中由 OpenAI 的模型加速。初步测试显示，Jalape ñ o 作为第一代加速器，每瓦性能远优于现有最先进的设备。

未来 Jalape ñ o 将与数据中心合作伙伴以千兆瓦规模、跨越多代部署，并扩展至 OpenAI 的全栈平台，从产品到模型，再扩展到芯片。

超能网公众号

扫码关注我们，浏览热门硬件评测

随时查看最新天梯榜

宙世代

一起剪

相关标签