日前,OpenAI 方面发布全新推理模型 o3 和 o4-mini,并表示这是其迄今为止最智能、功能最强大的模型," 代表着 ChatGPT 能力的一次重大飞跃 "。OpenAI 首席执行官 Sam Altman 透露,o3 和 o4-mini 已接近、或达到天才水平。
据了解,o3 和 o4-mini 不仅首次将图像融入思维链过程,实现 " 用图像思考 ",还能自主调用工具,解决复杂编程和视觉任务的推理。对此 OpenAI 方面表示," 这是我们首次推出能够独立使用全部 ChatGPT 工具的推理模型——包括网页浏览、Python 编程、图像理解和图像生成能力。这使得它们在解决复杂的多步骤问题时更加高效,并朝着自主执行任务的方向迈出了真正一步 "。
性能方面,根据 OpenAI 公布的相关数据显示,o3 在 Codeforces、SWE-bench、MMMU 等基准测试中刷新 SOTA,这意味着其在编程、数学、科学、视觉感知等领域都树立了新标杆。而在外部专家的评估中,o3 在处理真实世界任务时严重错误率比 o1 降低 20%,尤其是在编程、商业 / 咨询和创意构思等领域表现出色。
o4-mini 则专为快速、经济高效的推理需求而优化,在数学、编程和视觉任务方面表现出色。其中以数学能力为例,o4-mini 是 AIME 2024 和 AIME 2025 基准测试中表现最佳的模型。此外,o4-mini 支持远超 o3 的使用额度,被 OpenAI 称为高并发场景最优选。
而在安全性方面,据悉 OpenAI 为 o3 和 o4-mini 重建了安全训练数据集,新增生物威胁、恶意软件生成和越狱攻击的拒绝提示。
目前,o3 和 o4-mini 已通过 Chat Completions API 和 Responses API 向开发者开放。同时,ChatGPT Plus、ChatGPT Pro 和 ChatGPT Team 的用户也可以使用 o3、o4-mini。而 ChatGPT 企业和教育用户将在约一周后获得访问权限,免费用户可在提交查询前选择 " 思考 " 来尝试 o4-mini。
值得一提的是,日前 OpenAI 方面透露,未来几周内将会推出 o3-pro。据了解,这是 o3 的一个升级版本,将使用更多计算资源生成回答,但仅向 ChatGPT Pro 订阅用户开放。
此外需要注意的是,近期 OpenAI 方面宣布推出并开源 AI 代理 Codex CLI。据悉,这是一款旨在与如 o3 等模型协同工作的 AI 代理,可帮助用户完成编程任务,并支持在端侧部署。
【本文图片来自网络】
登录后才可以发布评论哦
打开小程序可以发布评论哦