图片来源:视觉中国
蓝鲸新闻 8 月 6 日讯(记者 朱俊熹)OpenAI 终于变得 "Open" 了起来。当地时间 8 月 5 日,OpenAI 推出了两款开放权重的 AI 模型 gpt-oss-120b、gpt-oss-20b,可在开源技术平台 Hugging Face 上免费下载。这也是 OpenAI 自 2019 年发布 GPT-2 以来,时隔六年再次开放语言模型权重。
据 OpenAI 介绍,gpt-oss 的两款模型在推理任务上表现优于同级别开源模型,能够适配消费级硬件。其中,gpt-oss-120b 的推理能力几乎与 o4-mini 模型持平,可在一张 80GB 的 GPU 上运行。而 gpt-oss-20b 的通用表现接近 o3-mini,可以直接在配备了 16GB 内存的笔记本电脑上运行。
严格来说,OpenAI 此次发布的开放权重模型并不等同于开源模型。因为 gpt-oss 系列公开了其训练参数,让开发者能够基于这些权重对模型进行定制,但未公布训练数据、训练流程等核心细节。开放权重是当前开源模型社区采用的主流方式,包括 Meta 的 Llama 模型、DeepSeek、阿里 Qwen 系列等模型。
在解释开放模型的重要性时,OpenAI 表示,gpt-oss 模型不仅为开发者提供了更广泛的工具选择,也降低了新兴市场、资源受限行业、预算或灵活性有限的小型组织使用 AI 的门槛。" 一个健康的开放模型生态,是实现 AI 广泛可及、惠及所有人的重要一环。"
然而,此前 OpenAI 发布的绝大多数模型都是闭源模型。马斯克也曾多次讽刺称,OpenAI 应更名为 "ClosedAI"。DeepSeek 的开源模型引发全球关注后,OpenAI CEO Sam Altman 罕见表态称,需要重新思考开源策略," 我个人认为我们在这个问题上一直站在历史的错误一边。"
闭源模型阵营中,OpenAI 不是第一家出现转向的公司。在今年 2 月的财报电话会上,百度联合创始人、首席执行官李彦宏坦言,百度从 DeepSeek 学到的一点是:开源最好的模型可以极大地帮助推广,人们自然会出于好奇去尝试它。就在去年,他还曾多次公开表示," 开源模型会越来越落后 "。6 月,百度也正式开源了其文心大模型 4.5 系列。
当开源的呼声越来越高时,一向倡导开源的 Meta 却似乎在态度上出现了微妙的转变。在 7 月 30 日发布的公开信中,Meta 创始人兼 CEO 马克 · 扎克伯格表示,需要以严谨的态度来应对超级智能可能带来的风险," 并谨慎选择开源内容 "。
不过一年前,扎克伯格发表的公开信主题还是 " 开源 AI 是前进的道路 "。他在其中提到,开源模型正在迅速缩小与闭源模型间的差距,预计 Llama 模型将从 2025 年起成为业内最先进的。然而今年以来,Meta 一度陷入低潮。先是 DeepSeek 带来的冲击,随后 4 月亮相的 Llama 4 系列模型,在实测效果上也未能达到外界预期。
前后追击下,扎克伯格选择了大手笔撒钱的 " 翻牌 " 策略。先是向数据标注公司 Scale AI 投资 143 亿美元,并招来其创办人兼 CEO。之后又斥资数十亿美元招揽 OpenAI 等其他公司的顶尖 AI 人才,在硅谷掀起一场疯狂的 " 抢人大战 "。这些人才被汇聚到新设立的 Meta Superintelligence Labs 部门中,剑指人人可用的个人超级智能,并确保 Meta 在这一进程中保持引领地位。
Meta 发言人强调,公司对开源 AI 的立场没有改变。" 我们计划继续发布领先的开源模型。" 其称," 我们过去开发的成果还没有全部发布,未来也预计会继续训练开源和闭源模型的混合版本。"
登录后才可以发布评论哦
打开小程序可以发布评论哦