时隔六年，OpenAI方面日前发布两款开源模型

日前，OpenAI 方面正式发布并开源两款推理模型 gpt-oss-120b、gpt-oss-20b。据悉，oss 是 Open Source Series 的缩写，意为开源系列。

对此 OpenAI CEO 山姆 · 奥尔特曼表示，这是该公司耗资数十亿美元的研究成果，"gpt-oss 是一个重大突破……我们相信这是全球最佳且最实用的开放模型 "。

据了解，这也是继 2019 年的 GPT-2 后，OpenAI 时隔 6 年再次推出开源模型。目前这两款模型均以 Apache 2.0 许可证发布，企业在商用前无需付费或获得许可。

而对于推出开源模型的原因，OpenAI 方面表示，" 开放模型与我们的托管模型相辅相成，为开发者提供了更广泛的工具，以加速前沿研究、促进创新，并在广泛的用例中实现更安全、更透明的 AI 开发。这些开源模型还降低了新兴市场、资源受限行业以及中小型组织进入 AI 的门槛 "

据悉，gpt-oss-120b、gpt-oss-20b 均基于 MoE（混合专家）架构，并采用预训练和后训练技术进行训练，特别关注推理、效率和在广泛部署环境中的实际可用性。在训练数据方面，OpenAI 方面在一个主要为英文的纯文本数据集上训练了这两款模型，训练内容特别强调 STEM 领域知识、编码能力和通用知识。

其中，gpt-oss-120b 总参数量为 1170 亿、激活参数量为 51 亿，可在单张 80GB GPU 上运行，在核心推理基准测试中的表现与 OpenAI o4-mini 几乎持平。gpt-oss-20b 的总参数量为 210 亿、激活参数为 36 亿，可在 16GB 内存的消费级设备上运行，在常见基准测试中表现与 OpenAI o3-mini 相似。

据 OpenAI 方面介绍，这两款模型在工具使用、少样本函数调用、链式思考推理以及 HealthBench 上表现强劲，甚至超越了包括 OpenAI o1 和 GPT ‑ 4o 在内的专有模型。，

此外 OpenAI 方面强调，安全性是该公司发布所有模型的前提，尤其对开源模型至关重要。据悉，除全面的安全训练和评估测试外，OpenAI 方面还基于自身的准备框架（Preparedness Framework）对 gpt-oss-120b 的对抗性微调版本进行了测试。相关结果显示，gpt-oss 在内部安全基准测试中的表现与 OpenAI 的前沿模型相当，并提供与其近期专有模型相同的安全标准。

值得一提的是，日前山姆 · 奥尔特曼还预告本周晚些时候 OpenAI 将会发布一项 " 重大更新 "。对此有观点认为，鉴于 OpenAI 方面近期曾多次披露 GPT-5 相关信息，这一 " 重大更新 " 或与其有关。

【本文图片来自网络】

宙世代

一起剪

相关标签