三易生活 昨天
时隔六年,OpenAI方面日前发布两款开源模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

日前,OpenAI 方面正式发布并开源两款推理模型 gpt-oss-120b、gpt-oss-20b。据悉,oss 是 Open Source Series 的缩写,意为开源系列。

对此 OpenAI CEO 山姆 · 奥尔特曼表示,这是该公司耗资数十亿美元的研究成果,"gpt-oss 是一个重大突破……我们相信这是全球最佳且最实用的开放模型 "。

据了解,这也是继 2019 年的 GPT-2 后,OpenAI 时隔 6 年再次推出开源模型。目前这两款模型均以 Apache 2.0 许可证发布,企业在商用前无需付费或获得许可。

而对于推出开源模型的原因,OpenAI 方面表示," 开放模型与我们的托管模型相辅相成,为开发者提供了更广泛的工具,以加速前沿研究、促进创新,并在广泛的用例中实现更安全、更透明的 AI 开发。这些开源模型还降低了新兴市场、资源受限行业以及中小型组织进入 AI 的门槛 "

据悉,gpt-oss-120b、gpt-oss-20b 均基于 MoE(混合专家)架构,并采用预训练和后训练技术进行训练,特别关注推理、效率和在广泛部署环境中的实际可用性。在训练数据方面,OpenAI 方面在一个主要为英文的纯文本数据集上训练了这两款模型,训练内容特别强调 STEM 领域知识、编码能力和通用知识。

其中,gpt-oss-120b 总参数量为 1170 亿、激活参数量为 51 亿,可在单张 80GB GPU 上运行,在核心推理基准测试中的表现与 OpenAI o4-mini 几乎持平。gpt-oss-20b 的总参数量为 210 亿、激活参数为 36 亿,可在 16GB 内存的消费级设备上运行,在常见基准测试中表现与 OpenAI o3-mini 相似。

据 OpenAI 方面介绍,这两款模型在工具使用、少样本函数调用、链式思考推理以及 HealthBench 上表现强劲,甚至超越了包括 OpenAI o1 和 GPT ‑ 4o 在内的专有模型。,

此外 OpenAI 方面强调,安全性是该公司发布所有模型的前提,尤其对开源模型至关重要。据悉,除全面的安全训练和评估测试外,OpenAI 方面还基于自身的准备框架(Preparedness Framework)对 gpt-oss-120b 的对抗性微调版本进行了测试。相关结果显示,gpt-oss 在内部安全基准测试中的表现与 OpenAI 的前沿模型相当,并提供与其近期专有模型相同的安全标准。

值得一提的是,日前山姆 · 奥尔特曼还预告本周晚些时候 OpenAI 将会发布一项 " 重大更新 "。对此有观点认为,鉴于 OpenAI 方面近期曾多次披露 GPT-5 相关信息,这一 " 重大更新 " 或与其有关。

【本文图片来自网络】

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

开源 托管 gpu
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论