被骂了一年的Codex，怎么突然爆了？

智东西

作者 | 陈骏达

编辑 | 心缘

Codex，打了场漂亮的翻身仗。

今年 6 月 3 日，OpenAI 披露，其 Agent 产品 Codex 的周活跃用户已经突破 500 万，而这一数字在 2026 年初还仅有 60 万左右。5 个月时间，Codex 周活用户数量增长了 730%。

Codex 并非像 ChatGPT 那样一经问世便引爆市场的明星产品，恰恰相反，从 2025 年 4 月 Codex CLI 发布到 2026 年初的相当长一段时间里，它甚至有些 " 存在感不足 "。

在技术社区里，关于 Codex 的讨论始终热度不高，而相同形态的 Claude Code 则迅速占领开发者心智。2026 年 3 月，市场分析机构 Presenc AI 的数据显示，2026 年第一季度，Claude Code 的周活用户数量达 420 万，彼时 Codex 的周活用户不超过 100 万，不到 Claude Code 的 1/4。

Claude Code 凭借更强的口碑和更贴近开发者的交互体验，几乎成了终端 AI 编程的代名词。驱动 Codex 的 OpenAI GPT 系列模型在开发者群体里的口碑，也被 Anthropic 的 Claude 系列模型压过一头。

然而，也正是从 2026 年第一季度末开始，Codex 逐渐走出了困境。随着多个重磅更新的陆续推出，Codex 摇身一变成为 OpenAI 增长最快的产品之一，其周活用户数量从 200 万攀升至 300 万耗时大约 4 周，300 万到 400 万仅耗时大约 2 周，从 400 万到 500 万耗时大约 4 周，增速惊人。

Codex 的用户群体也在不断丰富，使用场景早已超越软件工程，目前其大约 20% 的用户，是非开发者的知识工作者。

那么，一个原本不温不火的产品，究竟是如何被重新激活的？

一、错过第一波浪潮：Codex 为何长期不温不火？

如果回顾 Codex 刚刚发布时的处境，会发现它并不是一个被市场普遍看好的项目。

首先，它进入市场的时间并不理想。2025 年初，AI 编程工具已经完成了第一轮市场教育。GitHub Copilot 让开发者习惯了 AI 辅助写代码，Cursor 则率先验证了 AI IDE 路线，先于 Codex 发布的 Claude Code，迅速树立了 "Agentic 自主编程 " 的行业标杆。

2025 年 4 月 17 日，OpenAI 在 YouTube 上发了条视频，宣告了 Codex CLI 的到来，杀进了 AI 编程工具这一拥挤的赛道。当时，Codex 只有 CLI 一个形态，长得几乎和 Claude Code 一模一样，都是跑在终端里的命令行工具。

初代 Codex CLI

在那条视频的评论区里，舆论风向几乎一边倒地倾向于唱衰 OpenAI，网友们纷纷发表风凉话。

这种情绪集中体现在几条高赞评论中。有网友直言："OpenAI 终于意识到 Anthropic 做对了。" 还有人带着讽刺的口吻评论道：" 谢谢 Anthropic，你们用 Claude Code 把 OpenAI 拉回了正轨。"

更有网友翻起了旧账，直指 OpenAI 过去一系列模仿 Anthropic 的行为：" 先是 Canvas，又是 Codex。Anthropic 搞创新，OpenAI 照着抄。真心觉得 Anthropic 做得好，我挺你们。"

除了外部环境逆风之外，OpenAI 自身也没有像今天这样全力推动 Codex。从官方表述来看，Codex 最初更接近研究性质项目，与 ChatGPT、GPT 系列模型相比，Codex 获得的资源投入和市场曝光明显有限。

这也导致 Codex 的产品力提升十分缓慢。2025 年 10 月，在 Reddit 社区 "ChatGPTCoding" 里，有这样一条热帖代表了当时 Codex 用户的心声：" 为什么 Codex CLI 目前仍然如此不完善？"

当时 Codex 对 Windows 系统的支持并不到位，编辑文件、联网搜索等基础功能远没有 Claude Code 方便，开发者常常需要自行摸索、安装插件，才能获得更好的体验。

另一个现实问题则是模型能力。今天很多人会默认 OpenAI 在所有 AI 领域都处于领先位置，但在 2025 年，编程能力并非其最突出的优势。当时开发者社区普遍认为，Claude 在大型代码库理解、复杂工程任务以及长上下文场景下表现更出色。

对于 Codex 而言，这意味着一个尴尬局面：它既没有最好的模型，也没有最成熟的产品体验。在这种情况下，增长缓慢几乎是必然结果。

二、5 个月三次大更新，Codex 逆势崛起

Codex 在发布后的 8 个多月时间里一直陷于沉寂，在 2026 年 1 月，其周活用户的数量甚至还出现了一定幅度的下滑。

Codex 的转折点，出现在今年 2 月。OpenAI 接连发布了 Codex 桌面应用和 GPT-5.3 Codex 两大新品，一个重塑 Codex 入口，一个则大幅提升了 OpenAI 模型在编程和智能体场景的实用性。

先来看看模型侧的变化。OpenAI 和 Anthropic 在同一天发布了 GPT-5.3 Codex 和 Claude Opus 4.6。在 Artificial Analysis 的智能指数榜单上，这两个模型的得分完全打平。在 Terminal Bench 等核心编程基准测试中，GPT-5.3 Codex 甚至实现了超过 10% 的领先。

GPT-5.3 Codex 和 Claude Opus 4.6 的得分（图源：Artificial Analysis）

而 OpenAI 发布 Codex 桌面应用的意义可能更为重大。它并不只是简单地把 Codex CLI" 图形化 " 了，而是在产品定位上，将 Codex 从 Agent 工具升级为 "Agent 指挥中心 "。

OpenAI 认为，如今模型已经可以自主完成长期、复杂的任务，这种情况下，开发者真正需要的是一个能在多项目间协调、管理 Agent" 数字劳动力 " 的产品。

Codex CLI、Claude Code 等命令行工具，虽然也具备通过子 Agent 并行执行任务的能力，例如拆分代码搜索、实现不同模块或并发分析问题，但这些 Agent 更多是服务于一次任务执行过程中的 " 内部协作 "，用户主要仍是在与一个 Agent 对话。

为适应 Codex 的新定位，OpenAI 在 Codex 桌面应用中将 Agent 提升为独立的工作单元，每个 Agent 拥有独立线程、独立上下文、独立代码工作区（Worktree）和长期运行能力，用户可以像管理团队成员一样同时分配任务、查看进度、审阅结果，并通过自动化能力让 Agent 持续执行周期性工作。其实，OpenAI 是把一个完整的 AI 开发团队交给了用户。

自此次升级之后，Codex 的用户体验有了大幅度的提升。在 Reddit 社区上，有位开发者在一条高赞讨论中写道，在使用 CLI 工具时，经常需要等待 Agent 完成任务后才能继续下一步操作，而 Codex App 允许同时管理多个项目和多个对话线程，使整个开发过程更接近即时通讯软件的体验，从而能够更轻松地并行推进多个项目。

不过，当时 Codex 桌面应用并没有 Windows 和 Linux 版本，这点遭到不少用户吐槽。

到 4 月份，OpenAI 又进行了一个更加关键的调整。

在 "Codex for ( almost ) Everything" 更新中，OpenAI 开始丰富 Codex 的能力。Codex 拥有了直接在后台操作计算机的能力，内置了浏览器和图像生成功能，新增了对 GitHub PR 审查、多终端标签和远程开发箱（SSH）的支持，并提供了超过 90 个新插件（如 JIRA、CircleCI）来打通日常工具链。

这些能力的引入，让用户可以在文档处理、流程自动化、信息整理以及跨工具协作等新场景使用 Codex。

这次更新也拉高了 Codex 的市场天花板。此前，Codex 给外界的印象始终停留在 AI 编程工具阶段，现如今，Codex 已经成为了一个通用 Agent 平台，其目标客户扩展至整个知识工作者群体，比如产品经理、分析师、运营人员、研究人员等，而非仅仅局限于程序员。

与 Codex 这一更新所配套的，是 GPT-5.4 的升级。在这代模型中，OpenAI 首次加入了原生的 Computer Use 能力和 100 万上下文支持。这些能力共同构成了 Codex 进一步进入白领工作场景的重要基础，使其能够更自然地参与跨应用、跨系统的复杂任务执行。

5 月份的 GPT-5.5 则进一步优化了 token 效率、长上下文、编程等能力，并改善了模型在长任务中的任务保持能力。有不少用户反馈，Codex+GPT 的组合，在使用成本上比 Claude Code+Claude 模型的组合要更具有性价比。

今年 6 月的 Codex 大更新与 4 月的更新一脉相承。Codex 面向白领工作推出了智能体插件功能，首发了 6 个特定角色插件，包括数据分析、创意制作、销售、产品设计、股票投资等，每个插件都捆绑了相关角色的应用程序、技能、说明和工作流程。这些新功能，让 Codex 可以在更丰富的企业级场景中，扮演生产力系统的角色。

除了在产品和模型上下功夫，OpenAI 在过去几个月时间里还进一步整合了 ChatGPT 与 Codex，用户可以在 ChatGPT 手机应用里完成从任务发起、Agent 运行监控到结果审查的完整流程，使用门槛进一步降低。Codex 还定期推出额度重置福利，用户有不少免费的羊毛可以薅。

这一系列调整，最终转化为 Codex 活跃用户数量的迅猛增长，在短短 5 个月内从 2026 年初的约 60 万周活跃用户跃升至 500 万以上，成为 OpenAI 近一年增长最快的产品之一。

三、Codex 成为战略级产品之后

Codex 的未来，要往何处去？

过去几年，无论从资源配置还是战略规划角度来看，OpenAI 最重要的产品始终是 ChatGPT。而现在，Codex 的资源投入正在不断提升，持续快速更新的产品、频繁重置的免费额度、以及 OpenAI 在超级碗比赛期间为 Codex 投放的 60 秒天价广告，这种种举措都在释放一个信号：Codex 正在被提升为战略级产品线。

结合 OpenAI 从去年年底以来对企业级市场的持续加码，这一变化并不难理解。无论是编程，还是白领工作，Codex 瞄准的始终是企业级市场。在增长逻辑上，相比个人用户，企业客户或者说在工作中使用 Codex 的用户，拥有更强的付费能力和意愿，也更容易帮助 OpenAI 形成长期稳定的收入结构。

这已经是一个被验证过的叙事，Anthropic 在 ARR 和估值层面对 OpenAI 的超越，很大程度上正是依赖其在企业市场的渗透能力。

Codex 也是一款更适合企业级场景的产品。对于企业客户而言，一个能够完成代码开发、自动化流程、文档处理以及任务执行的 Agent，其价值要高于纯粹的大模型 API 服务或者聊天机器人。它可以直接嵌入企业的生产系统与业务流程，成为实际的 " 执行层组件 "。

在这种结构下，企业内部 AI 投资的 ROI 计算可以变得更加容易。例如，一个 Agent 如果能够替代部分开发、测试或数据处理流程，本质上就是在降低固定人力成本或提升人均产出。这类收益是可量化、可归因的，其 ROI 叙事更为清晰。负责制定企业信息化战略的 CIO 们，也更容易在内部论证这一投资的价值。

当然，挑战依然存在。

首先是可靠性。Agent 类产品的能力虽在快速提升，但复杂任务执行中仍会出现错误。对企业而言，稳定性往往比能力上限更重要，尤其是在医疗、金融等强监管行业。Codex 的可靠性将直接影响其在这些市场的扩展。

其次是竞争。Anthropic 的 Claude Code、Claude Cowork 在开发者口碑和企业治理成熟度上仍然领先 Codex。Claude Cowork 的管理控制台、RBAC、审计日志已全面可用，而 Codex 的对应能力尚在 " 即将推出 " 阶段。Copilot 则凭借微软生态，在分销渠道上拥有难以复制的优势，其多模型策略也给用户更多选择空间。

最后是成本。Agent 的 token 消耗远高于对话，如何实现成本和性能的平衡是一个复杂问题。2026 年 4 月，OpenAI 将 Codex 从按消息计费改为基于 token 点数的滚动窗口计费，本意是让成本更精确反映实际消耗，实践中却带来不可预测性和总体成本上升。这可能导致部分用户转向开源方案，或至少在日常高消耗任务中用开源方案替代部分 Codex 的工作。

结语：Codex 还有硬仗要打

如今，国内外的头部大模型玩家，都在围绕 Agent 的 " 入口权 " 展开新一轮较量。Codex 用 5 个月时间从 60 万周活冲到 500 万，证明了即便起步落后、口碑被压制，只要找准定位、持续迭代，依然有机会翻盘。

但复盘这场翻身仗，Codex 的成功并不只靠产品功能堆叠，模型能力的追赶、产品定位的优化、目标市场的扩张、以及资源投入的倾斜，缺一不可。

500 万周活用户已经证明了 Codex 在通用 Agent 赛道的吸引力。接下来要看的是，当成本优势消退、竞品加速跟进之后，Codex 是否还能保持这样的迭代节奏和产品定力。要守住增长，Codex 还需要在产品体验和商业模式上建立更深的护城河。

宙世代

一起剪

相关标签