【TechWeb】8 月 6 日消息,没等到 GPT-5,先等来了 OpenAI 的 " 开源 "。
今日,OpenAI 宣布,推出了两款全新的开放权重(open ‑ weight)AI 推理模型:gpt-oss-120b 和 gpt-oss-20b 纯文本模型,不支持图像或视频,能力与此前推出的 o 系列模型相近。
这两款模型均以 Apache 2.0 授权发布,允许免费下载、商业使用及二次开发,用户可通过知名开发平台 Hugging Face 进行下载。
OpenAI 称,这两款模型在多个公开基准测试中表现出了 " 顶尖水平 "。
与此同时,有意思的是,亚马逊云科技宣布,OpenAI 的开放权重模型首次可通过 Amazon Bedrock 和 Amazon SageMaker AI 访问,帮助客户快速构建生成式人工智能(生成式 AI)应用。
至此,亚马逊云科技算终于集齐了包含 OpenAI 大模型在内的行业顶尖主流大模型。
在此之前,OpenAI 的相关模型主要和微软等合作,并未上架亚马逊云科技。亚马逊曾两年 80 亿美元投资 OpenAI 强劲竞争对手 Anthropic,Anthropic 的 Claude 最新系列模型都会第一时间上架亚马逊云科技。
现在随着 OpenAI 大模型也上线亚马逊云科技这一全球最大云平台,大模型领域的竞争或将迎来新的变化。
6 年来再 " 开源 "
尽管业内认为,OpenAI 此次发布的这两个模型均为开放权重(open ‑ weight)类型,类似于 Meta 的 Llama 模型。这里所说的 " 权重 " 是指 AI 模型的参数。OpenAI 公开了训练过程中模型获取并调校的众多数值参数,以便开发人员更好地定制模型。不过,OpenAI 没有公开强化学习的技术细节、用于训练模型的数据,数据来源等信息,让开源社区难以从中借鉴,因此并未达到真正意义上的开源 AI 模型。
但这已是 OpenAI 自 2019 年发布开源 GPT-2 以来,首次推出新的 " 开源 " 大语言模型。
近年来 OpenAI 逐渐转向闭源策略,通过 API 向企业和开发者出售访问权,建立了商业模式。
不过,今年一月,OpenAI CEO 山姆•奥特曼(Sam Altman)曾表示,在开源问题上,OpenAI 可能 " 站错了历史的一边 "。当前,中国的 DeepSeek、阿里巴巴的通义千问、Moonshot AI 等开源模型迅速崛起,逐渐占据主导地位。
有外媒认为,特朗普政府在 7 月呼吁美国 AI 开发商更多地开源技术,推动全球采用符合美国价值观的 AI 技术。通过推出 gpt-oss,OpenAI 希望同时赢得开发者和特朗普政府的认可,以应对来自中国 AI 实验室的竞争压力。
对于这次开源 2 款大模型,奥特曼表示:" 回到我们 2015 年创办公司的初衷,OpenAI 的使命始终是确保通用人工智能(AGI)惠及全人类。因此,我们十分期待全球开发者基于美国创造的、基于民主价值观的开源 AI 堆栈构建技术,让所有人免费使用,造福大众。"
性能比肩 o4 ‑ mini 和 o3 ‑ mini
gpt ‑ oss ‑ 120b 适用于需要高推理能力的生产级和通用型场景,拥有约 1170 亿参数,每个 token 启用 51 亿参数,推理性能接近 o4 ‑ mini,能在单张 80GB 显存的 GPU 上高效运行(如 Nvidia H100)。
gpt ‑ oss ‑ 20b 适用于低延迟、本地或专业化场景,约 210 亿参数、可在拥有 16GB 内存的普通笔记本电脑上运行,表现与 o3 ‑ mini 相当 。
具体来看,gpt-oss-120b 在编程竞赛(Codeforces)、通用问题解决(MMLU 和 HLE)以及工具调用(TauBench)方面超越了 o3-mini,达到甚至超越 o4-mini 的水平。
除此之外,两款模型在工具使用、少样本函数调用、CoT 推理以及 HealthBench 评测中也表现强劲,甚至比 OpenAI o1 和 GPT-4o 等专有模型还要更强。
其他亮点包括:
• 宽松的 Apache 2.0 许可证:可自由用于构建,无 copyleft 限制或专利风险——是实验、定制和商业化部署的理想选择。
• 可配置的推理投入:可根据用户的具体用例和延迟需求,轻松调整推理投入(低、中、高)。
• 完整的思维链:可完整访问模型的推理过程,从而简化调试并提升输出结果的可信度。
• 支持微调:支持参数级微调,可根据您的特定用例对模型进行完全定制。
• 智能体能力:两款模型已经与 OpenAI 的 Responses API 兼容,可用于 Agent 工作流,具备较好的指令遵循能力、网页搜索或 Python 代码执行等工具使用能力以及推理能力,还支持调整模型推理长度。
• 原生 MXFP4 量化:在训练时,模型的混合专家(MoE)层便采用了原生的 MXFP4 精度,使得 gpt-oss-120b 在单张 H100 GPU 上即可运行,而 gpt-oss-20b 仅需 16GB 内存。
OpenAI 还特地准备了一个 playground 网站供用户在线体验。
已上架亚马逊云科技,性价比是 DeepSeek-R1 的 5 倍
随着 OpenAI 开放权重模型的发布,亚马逊云科技也第一时间宣布,OpenAI 的开放权重模型首次可通过 Amazon Bedrock 和 Amazon SageMaker AI 访问,帮助客户快速构建生成式人工智能(生成式 AI)应用,借助全球覆盖最广、被客户广泛采用的亚马逊云科技服务,将 OpenAI 的影响力扩展至亚马逊云科技数百万客户。
亚马逊云科技产品总监 Atul Deo 表示:" 开放权重模型将在生成式 AI 的未来发展中扮演重要作用,我们致力于将亚马逊云科技打造为运行模型的最佳平台,这是我们此次推出 OpenAI 模型的原因。OpenAI 成为我们最新的开放权重模型提供方,这是亚马逊云科技持续将前沿 AI 带给全球各个组织的自然延伸。亚马逊云科技广泛的客户基础也将为 OpenAI 先进技术的获取方式带来变革性的转变。"
据介绍,在 Amazon Bedrock 上运行的两个开放权重模型中的大尺寸模型,在性价比方面是同类 Gemini 模型的 3 倍、DeepSeek-R1 的 5 倍以及 OpenAI o4 模型的 2 倍。
亚马逊云科技称,此次发布进一步体现了其在模型选择上对客户的承诺,不仅拓展了 Amazon Bedrock 已支持的广泛的托管模型,也通过 Amazon SageMaker JumpStart 为客户提供更多接入选择,进一步体现了亚马逊云科技在生成式 AI 技术领域的持续创新,以满足客户需求。
亚马逊云科技还特别谈到,OpenAI 的开放权重模型具备先进的推理能力,非常适合用于 AI Agent 场景,重塑企业的业务运营方式。借助 Amazon Bedrock AgentCore,客户可部署并运行高效 Agent,并借助在 Amazon Bedrock 上的 OpenAI 模型,为企业提供符合生产级需求的扩展性与安全性。客户还可将 gpt-oss-120b 与 gpt-oss-20b 无缝集成至 Amazon Bedrock 企业级安全架构中,利用如 Guardrails(通过可配置安全策略可拦截高达 88% 的有害内容)等强大工具,未来还将支持自定义模型导入、知识库与个性化定制等功能。在 Amazon SageMaker AI 中,客户可结合 OpenAI 开放权重模型与完善的工具链,实现模型的预训练、评估、微调与部署。(果青)
登录后才可以发布评论哦
打开小程序可以发布评论哦