全天候科技 前天
OpenAI发布GPT-5.4 mini与nano,以更低成本逼近旗舰模型性能
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

OpenAI 周二推出旗下迄今能力最强的两款小型模型 GPT-5.4 mini 与 GPT-5.4 nano,以更低延迟和更低成本大幅缩小与旗舰模型的性能差距。

GPT-5.4 mini 在编程、推理、多模态理解及工具调用等核心维度全面超越上一代 GPT-5 mini,运行速度提升逾 2 倍,并在 SWE-Bench Pro 等基准测试中接近体量更大的 GPT-5.4。

GPT-5.4 nano 则定位成本最低、延迟最短的轻量选项,仅通过 API 向开发者开放,专为数据分类、提取及简单编程子任务设计。

两款模型的推出,意在填补大模型在实时交互场景中因延迟过高而难以落地的空白,直接影响覆盖编程助手、AI 代理系统及多模态应用等快速增长的商业市场。

mini 面向消费端,nano 专属 API

GPT-5.4 mini 今日起在 OpenAI API、Codex 平台及 ChatGPT 三大渠道同步上线。

GPT-5.4 mini 的 API 定价为每百万输入 token 0.75 美元、每百万输出 token 4.50 美元,支持文本与图像输入、工具调用、函数调用、网页搜索、文件检索、计算机操控及技能扩展,上下文窗口达 40 万 token。

在 Codex 平台,GPT-5.4 mini 仅消耗 GPT-5.4 配额的 30%,开发者处理简单编程任务的成本约降至旗舰模型的三分之一。Codex 还支持将工作量委派给以 GPT-5.4 mini 运行的子智能体,使推理密度较低的任务自动落入更廉价的模型。

在 ChatGPT 端,Free 与 Go 用户可通过 "+" 菜单选择 "Thinking" 功能使用 GPT-5.4 mini;其余付费用户在 GPT-5.4 Thinking 触达速率上限后,该模型将作为自动降级备选项启用。

GPT-5.4 nano 目前仅通过 API 供开发者调用,定价为每百万输入 token 0.20 美元、每百万输出 token 1.25 美元,为两款新模型中定价最低者。OpenAI 表示,nano 适合由高阶模型统筹调度、负责处理次要支撑任务的子智能体场景。

mini 逼近旗舰,nano 超越前代

从 OpenAI 公布的评测数据来看,GPT-5.4 mini 在编程及多模态任务上的表现尤为突出。

在编程基准 SWE-bench Pro 上,mini 得分 54.4%,与 GPT-5.4 的 57.7% 差距收窄至 3.3 个百分点,远高于 GPT-5 mini 的 45.7%。

在计算机操控基准OSWorld-Verified 上,mini 以 72.1% 逼近 GPT-5.4 的 75.0%,并大幅领先 GPT-5 mini 的 42.0%。

工具调用能力方面,GPT-5.4 mini 在 τ 2-bench 电信测试中得分 93.4%,较 GPT-5 mini 的 74.1% 提升显著。在通用智能测试 GPQA Diamond 中,mini 得分 88.0%,nano 亦达 82.8%,均超越 GPT-5 mini 的 81.6%。

值得关注的是,GPT-5.4 nano 在部分视觉任务中表现落后于 GPT-5 mini,OSWorld-Verified 得分 39.0% 低于后者的 42.0%。但在编程及工具调用类任务上,nano 仍较前代实现明显提升。

OpenAI 表示,nano 的设计优先级在于低延迟与低成本,而非全面性能,开发者在选型时需结合具体任务权衡取舍。

子智能体架构,多模型协作成产品设计新范式

OpenAI 在发布材料中着重强调了两款新模型在多模型分层系统中的位置。

以其自研编程助手 Codex 为例,GPT-5.4 负责规划、协调与最终判断,而 GPT-5.4 mini 子智能体则并行处理代码库检索、大文件审阅及辅助文档处理等粒度更细的子任务。

OpenAI 表示,随着小型模型速度更快、功能更强大,开发者无需使用单一模型处理所有任务,而是可以构建系统,由大型模型负责决策,小型模型则快速大规模地执行任务。OpenAI 称:

GPT-5.4 mini 是我们迄今为止针对这种工作流程最强大的小型模型。

这一架构对高并发的工作尤为关键,在编程助手、截图解析及实时图像理解等场景中,响应延迟直接影响产品体感,最优选择往往不是能力最强的模型,而是能够在速度、工具可靠性与任务表现之间取得最佳平衡的模型。

对开发者而言,GPT-5.4 mini 与 nano 的发布意味着在不牺牲系统整体智能水平的前提下,大幅压降推理成本的路径进一步清晰。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

mini nano 编程 计算机 技能
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论