Gemini 3 力压全场,OpenAI 坐不住了。
发布 Codex 新版本——GPT-5.1-Codex-Max,突破上下文窗口限制,实现跨越数百万 token 的长时间连续工作,最长超过 24 小时的那种。

新模型任务效率也更高。它做的太阳系引力沙盒和上一代 GPT-5.1-Codex 的对比是这样的(多加了几个 " 太阳 " 看引力效果):


△上:GPT-5.1-Codex-Max 下:GPT-5.1-Codex
资源消耗是这样的:

于是,奥特曼昨天刚夸完 Gemini 3,今天又赶来给自家 GPT-5.1-Codex-Max 站台,咱说这也太忙了(doge)。

新版本在 METR 达到新 SOTA。这个指标衡量的是,用人类做任务的时间当参照,看 AI 有一半概率能搞定同款任务的能力。
其实就是先看人类做某类软件工程任务得花 X 小时,然后看 AI 模型能不能有 50% 的概率,把这项任务给完成了。
上面数据说明,在这种情况下,GPT-5-Codex-Max 有 50% 的概率能够成功完成一项原本需要人类 2 小时 42 分钟完成的软件工程任务。
这比 GPT-5 对标的时间还多了 25 分钟。
超长待机
AI 编程现在这么火,各家也都在奋力加码自家模型。
在这个前沿赛道,模型处理复杂任务的推理能力、持久力与稳定性,始终是衡量效能的关键指标。
而 GPT-5.1-Codex-Max 这次也是做了大升级。
首先,它在 PR 创建、代码审查等实际软件工程任务中训练,推理变得更快更有效。也是 OpenAI 首个能在 Windows 环境中的模型。

在 SWE-bench Verified 测试中,同样 medium 推理力度下,它比之前的 GPT ‑ 5.1-Codex 性能更好,且思考token 使用减少了 30%。

而且针对非延迟敏感任务还推出了xhigh推理力度选项,思考时间更长答案更好。
说到思考时间长,这次的新版本对于长时间运行任务的处理也比较出色,能够实现 " 超长待机 ",跨多个上下文窗口连贯工作。
这是因为 GPT-5.1-Codex-Max 原生支持压缩,突破了上下文窗口限制。
具体来说,在接近上下文窗口限制时,模型会自动压缩对话,获得新上下文窗口然后继续任务,直到完成。

在内部评估中,它能一次独立运行超过 24 小时,连贯处理数百万个 token。
看样子,新模型在处理长运行、高强度的任务上比较有优势。
比如,它在应对书籍、长文档分析等超长篇幅任务时,就无需拆分内容,避免信息割裂产生的理解偏差。
也能支撑高负载、长周期的持续工作。
OpenAI 研究员 Noam Brown 对此表示:(虽然现在表现就很不错但)尚未遇到瓶颈,还没达到极限。

目前,GPT-5.1-Codex-Max 已在 Codex 中支持与 CLI、IDE 扩展、云端和代码审查工具结合使用,API 接口很快也会上线。
当然了,新的编程模型一出,Claude 是肯定会被拉出来遛一下的。
相比之下,Claude Code 速度更快。

新版 Codex 的 token 消耗量更友好。

或许,Claude 和 Codex 的组合拳更能打。

OMT
一天时间,Gemini 3、Grok 4.1 Fast、GPT-5.1-Codex-Max 都来了,好一个硅谷 345 组团上新(doge)。
这位网友你真相了说得有道理。

实际上,OpenAI 这次还悄悄发布了 GPT-5.1 Pro。

虽然官方介绍仅有寥寥几笔,但通过第三方测评来看,这个 Pro 版本看上去还是有点东西的。

尤其是在指令遵循方面做得更好。

虽然在一定程度上和 Gemini 3 有差距,但如果能接入 IDE,将发挥出更大的潜力。

参考链接:
[ 1 ] https://x.com/polynoamial
[ 2 ] https://openai.com/index/gpt-5-1-codex-max/
[ 3 ] https://x.com/sama/status/1991258606168338444
[ 4 ] https://x.com/OpenAI/status/1991266192905179613
[ 5 ] https://news.ycombinator.com/item?id=45982649
[ 6 ] https://x.com/mattshumer_/status/1991263717820948651
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
聊 AI,当然得来量子位 MEET2026 智能未来大会!
张亚勤、孙茂松等首波 AI 行业重磅嘉宾已确认出席,还有更多嘉宾即将揭晓 了解详情
12 月 10 日
北京金茂万丽酒店
,期待与你共论 AI 行业破局之道
点亮星标
科技前沿进展每日见


登录后才可以发布评论哦
打开小程序可以发布评论哦