OpenAI 宣布,推出定制 Jalape ñ o 推理加速器,这是其内部专门开发,与博通合作,针对大型语言模型(LLM)推理加速及代理型人工智能(AI)设计的芯片,标志着 OpenAI 构建自身模型和产品背后全栈战略的重要一步。

Jalape ñ o 推理加速器配备了固定功能和可编程计算硬件,旨在加速 OpenAI 大语言模型堆栈的推理过程,为 ChatGPT、Codex、OpenAI API、以及其未来基于代理型 AI 产品提供支持。从概念上讲,Jalape ñ o 推理加速器与谷歌的 TPU 相似,只不过针对的设计对象换成了 OpenAI 技术栈。虽然 TPU 既用于训练也用于推理,但是 Jalape ñ o 似乎仅限于推理,训练工作可能仍然由 GPU 来完成。
OpenAI 表示,Jalape ñ o 是与博通共同打造的多代计算平台中的首个 AI 加速器,旨在让先进 AI 更快、更可靠、更易被更多人使用。其围绕 OpenAI 未来 LLM 推理愿景设计,从零开始起步,为行业当前及未来的 LLM 打造,从设计到生产仅用了九个月的时间就已完成,其中由 OpenAI 的模型加速。初步测试显示,Jalape ñ o 作为第一代加速器,每瓦性能远优于现有最先进的设备。
未来 Jalape ñ o 将与数据中心合作伙伴以千兆瓦规模、跨越多代部署,并扩展至 OpenAI 的全栈平台,从产品到模型,再扩展到芯片。
超能网公众号
扫码关注我们,浏览热门硬件评测
随时查看最新天梯榜


登录后才可以发布评论哦
打开小程序可以发布评论哦