三易生活 04-17
OpenAI发布两款新模型,可实现“用图像思考”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

日前,OpenAI 方面发布全新推理模型 o3 和 o4-mini,并表示这是其迄今为止最智能、功能最强大的模型," 代表着 ChatGPT 能力的一次重大飞跃 "。OpenAI 首席执行官 Sam Altman 透露,o3 和 o4-mini 已接近、或达到天才水平。

据了解,o3 和 o4-mini 不仅首次将图像融入思维链过程,实现 " 用图像思考 ",还能自主调用工具,解决复杂编程和视觉任务的推理。对此 OpenAI 方面表示," 这是我们首次推出能够独立使用全部 ChatGPT 工具的推理模型——包括网页浏览、Python 编程、图像理解和图像生成能力。这使得它们在解决复杂的多步骤问题时更加高效,并朝着自主执行任务的方向迈出了真正一步 "。

性能方面,根据 OpenAI 公布的相关数据显示,o3 在 Codeforces、SWE-bench、MMMU 等基准测试中刷新 SOTA,这意味着其在编程、数学、科学、视觉感知等领域都树立了新标杆。而在外部专家的评估中,o3 在处理真实世界任务时严重错误率比 o1 降低 20%,尤其是在编程、商业 / 咨询和创意构思等领域表现出色。

o4-mini 则专为快速、经济高效的推理需求而优化,在数学、编程和视觉任务方面表现出色。其中以数学能力为例,o4-mini 是 AIME 2024 和 AIME 2025 基准测试中表现最佳的模型。此外,o4-mini 支持远超 o3 的使用额度,被 OpenAI 称为高并发场景最优选。

而在安全性方面,据悉 OpenAI 为 o3 和 o4-mini 重建了安全训练数据集,新增生物威胁、恶意软件生成和越狱攻击的拒绝提示。

目前,o3 和 o4-mini 已通过 Chat Completions API 和 Responses API 向开发者开放。同时,ChatGPT Plus、ChatGPT Pro 和 ChatGPT Team 的用户也可以使用 o3、o4-mini。而 ChatGPT 企业和教育用户将在约一周后获得访问权限,免费用户可在提交查询前选择 " 思考 " 来尝试 o4-mini。

值得一提的是,日前 OpenAI 方面透露,未来几周内将会推出 o3-pro。据了解,这是 o3 的一个升级版本,将使用更多计算资源生成回答,但仅向 ChatGPT Pro 订阅用户开放。

此外需要注意的是,近期 OpenAI 方面宣布推出并开源 AI 代理 Codex CLI。据悉,这是一款旨在与如 o3 等模型协同工作的 AI 代理,可帮助用户完成编程任务,并支持在端侧部署。

【本文图片来自网络】

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

编程 数学 python 首席执行官 生物
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论