日前,OpenAI 方面发布新模型 GPT-5-Codex。据了解,这是一个专门针对智能体编程任务进行优化的新版本 GPT-5。
根据 OpenAI 公布的信息介绍,GPT-5-Codex 的训练侧重于实际的软件工程工作,例如从头构建完整项目、添加功能和测试、调试、执行大规模重构以及进行代码审查等。相比 GPT-5,该模型更易于控制,可以更好的遵循 AGENTS.md 指令,并生成更高质量的代码。
据悉,在 SWE-bench Verified(软件工程)和 Code refactoring tasks(代码重构)两个基准上,GPT-5-Codex 的准确度表现都优于 GPT-5 ( high ) 。
同时 GPT-5-Codex 还可以根据任务复杂度动态调整思考时间,实现在低负载请求中更高效,在复杂任务中更深入。 具体而言,该模型结合了编程智能体的两项基本技能,包括与开发者配合的交互式会话,以及对长任务的持久自主执行。这就意味着在处理简单查询或小型任务时,GPT-5-Codex 可快速响应,而在处理复杂任务时,其可自主迭代长达 7 小时以上,直至完成实施、并修复测试失败。
对此 OpenAI Codex 产品负责人 Alexander Embiricos 指出,"GPT-5-Codex 的动态思考能力带来了显著提升。它不依赖固定路由,而是能在任务中途判断需要增加工作时间,这在复杂问题上尤其有优势 "。
此外 GPT-5-Codex 也专门训练了代码审查能力,可以主动发现关键漏洞。据了解,OpenAI 方面用热门开源项目的最新提交(commit)做了评估,并让经验丰富的工程师进行了验证,结果发现 GPT-5-Codex 的审查意见更少出现错误或无关内容,更能把注意力集中在关键问题上。
目前,GPT-5-Codex 已经在 Codex 的所有使用场景中上线,包括 Codex CLI、IDE 扩展、网页端、移动设备,以及 GitHub 中的代码审查,而 Codex 已包含在 ChatGPT 的 Plus、Pro、Business、Edu 和 Enterprise 订阅中。此外 OpenAI 方面透露,还计划在未来向 API 客户开放该模型。
据了解,在 GPT-5-Codex 上线约两个小时后,OpenAICEO 萨姆 · 阿尔特曼发文称,GPT-5-Codex 的流量占比已达到 Codex 总流量的 40% 左右,并预计即将会占到大多数。
【本文图片来自网络】
登录后才可以发布评论哦
打开小程序可以发布评论哦