驱动之家 昨天
OpenAI研发高效推理方案:模型运行成本降低50%
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

2026-07-01 00:26:55    出处:快科技 作者:鹿角 编辑:鹿角      评论 ( ) 复制纠错

关闭

AI 摘要

内容由 AI 生成,仅供参考

快科技 7 月 1 日消息,据 The Information,知情人士透露,OpenAI 工程师本月早些时候向团队内部表示,依托多项全新研发的优化技术,已成功找到一套可将模型推理成本削减一半以上的方案。

在将该技术应用于无免费或付费账户的访客 ChatGPT 使用场景后,所需英伟达 GPU 数量一度被压缩至仅数百个,效率提升显著。

此前有消息称,OpenAI 与博通联合研发的 ASIC 芯片项目——代号 " 墨西哥胡椒 "。

该芯片完全针对大模型推理从零开始设计,当专用芯片摆脱通用 GPU 架构的束缚后,硬件突破带来的不再是温和升级,而是实质性的重构,推理成本最高可直接降低一半。

随着头部 AI 厂商掌握自主算力源头,对英伟达 GPU 的依赖逐步减少,通用硬件的产能与定价权将不再构成制约,也意味着整个 AI 生态话语权正在发生转移。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:鹿角

支持打赏

支持 0 人

打赏

文章价值打分

当前文章打分 0 分,共有 0 人打分

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

芯片 gpu 英伟达 the 墨西哥
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论