财联社 8 月 6 日讯(编辑 史正丞)OpenAI 首席执行官山姆 · 奥尔特曼周二宣布,公司将在未来几天里带来许多新东西,其中周二会迎来一项 " 小而重磅 " 的更新——预热已久的开源模型 GPT-OSS。
简单而言,OpenAI 周二共发布两款开放权重 AI 推理模型。其中参数量达到 1170 亿的 gpt-oss-120b 能力更强,可以由单个英伟达专业数据中心 GPU 驱动;参数量 210 亿的 gpt-oss-20b 模型,则能够在配备 16GB 内存的消费级笔记本电脑上运行。
虽然公司名字叫 OpenAI,但这已经是 2019 年的 GPT-2 后,这家 AI 初创公司时隔 6 年首度推出开源模型。在今年 1 月 DeepSeek 引爆开源 AI 风暴后,奥尔特曼曾认错称 OpenAI 在开源技术方面 " 站在了历史的错误一边 ",这正是 OpenAI 重新推出开源模型的原因。
两款模型都以宽松的 Apache 2.0 许可证发布,企业在商用前无需付费或获得许可。
就模型性能而言,GPT-OSS 大致位于开源模型的第一梯队,但整体略逊于自家的 GPT-o3 和 o4-mini。
例如在 Codeforces(带工具)的编程测试中,gpt-oss-120b 和 gpt-oss-20b 的 " 跑分 " 分别为 2622 和 2516 分,虽然高于一些头部开源模型,但依然比不过头部闭源推理模型。
类似的情况也发生在 " 人类最后的考试 " 测试中,两款开源模型的得分分别为 19% 和 17.3%,同样比不过 o3。
与闭源模型类似,两款开放模型都采用了混合专家(MoE)技术,处理问题时只会激活较少的参数。对于 1170 亿参数量的 gpt-oss-120b,处理每一个 token 时仅激活 51 亿个参数。
值得注意的是,相较 o3 和 o4-mini 模型,两款开放模型也会出现更多的幻觉。OpenAI 解释称,由于较小的模型拥有的世界知识比大型前沿模型少,所以更容易产生幻觉也在意料之中。在 OpenAI 内部用于衡量模型对人物知识准确性的 PersonQA 基准测试中,gpt-oss-120b 和 gpt-oss-20b 分别对 49% 和 53% 的问题产生幻觉,达到 o1 模型的 3 倍多,也高于 o4-mini 模型的 36%。
顺便一提,作为毫无惊喜的预告,奥尔特曼同时强调本周晚些时候会有一项 " 重大更新 "。鉴于公司这段日子不断吊业界胃口的举动,市场普遍预期 OpenAI 下一个重磅更新将是推出 GPT-5。
登录后才可以发布评论哦
打开小程序可以发布评论哦