
作者 | 陈骏达
编辑 | 心缘
Codex,打了场漂亮的翻身仗。
今年 6 月 3 日,OpenAI 披露,其 Agent 产品 Codex 的周活跃用户已经突破 500 万,而这一数字在 2026 年初还仅有 60 万左右。5 个月时间,Codex 周活用户数量增长了 730%。

在技术社区里,关于 Codex 的讨论始终热度不高,而相同形态的 Claude Code 则迅速占领开发者心智。2026 年 3 月,市场分析机构 Presenc AI 的数据显示,2026 年第一季度,Claude Code 的周活用户数量达 420 万,彼时 Codex 的周活用户不超过 100 万,不到 Claude Code 的 1/4。
Claude Code 凭借更强的口碑和更贴近开发者的交互体验,几乎成了终端 AI 编程的代名词。驱动 Codex 的 OpenAI GPT 系列模型在开发者群体里的口碑,也被 Anthropic 的 Claude 系列模型压过一头。
然而,也正是从 2026 年第一季度末开始,Codex 逐渐走出了困境。随着多个重磅更新的陆续推出,Codex 摇身一变成为 OpenAI 增长最快的产品之一,其周活用户数量从 200 万攀升至 300 万耗时大约 4 周,300 万到 400 万仅耗时大约 2 周,从 400 万到 500 万耗时大约 4 周,增速惊人。
Codex 的用户群体也在不断丰富,使用场景早已超越软件工程,目前其大约 20% 的用户,是非开发者的知识工作者。
那么,一个原本不温不火的产品,究竟是如何被重新激活的?
一、错过第一波浪潮:Codex 为何长期不温不火?
如果回顾 Codex 刚刚发布时的处境,会发现它并不是一个被市场普遍看好的项目。
首先,它进入市场的时间并不理想。2025 年初,AI 编程工具已经完成了第一轮市场教育。GitHub Copilot 让开发者习惯了 AI 辅助写代码,Cursor 则率先验证了 AI IDE 路线,先于 Codex 发布的 Claude Code,迅速树立了 "Agentic 自主编程 " 的行业标杆。
2025 年 4 月 17 日,OpenAI 在 YouTube 上发了条视频,宣告了 Codex CLI 的到来,杀进了 AI 编程工具这一拥挤的赛道。当时,Codex 只有 CLI 一个形态,长得几乎和 Claude Code 一模一样,都是跑在终端里的命令行工具。

在那条视频的评论区里,舆论风向几乎一边倒地倾向于唱衰 OpenAI,网友们纷纷发表风凉话。
这种情绪集中体现在几条高赞评论中。有网友直言:"OpenAI 终于意识到 Anthropic 做对了。" 还有人带着讽刺的口吻评论道:" 谢谢 Anthropic,你们用 Claude Code 把 OpenAI 拉回了正轨。"


这也导致 Codex 的产品力提升十分缓慢。2025 年 10 月,在 Reddit 社区 "ChatGPTCoding" 里,有这样一条热帖代表了当时 Codex 用户的心声:" 为什么 Codex CLI 目前仍然如此不完善?"

另一个现实问题则是模型能力。今天很多人会默认 OpenAI 在所有 AI 领域都处于领先位置,但在 2025 年,编程能力并非其最突出的优势。当时开发者社区普遍认为,Claude 在大型代码库理解、复杂工程任务以及长上下文场景下表现更出色。
对于 Codex 而言,这意味着一个尴尬局面:它既没有最好的模型,也没有最成熟的产品体验。在这种情况下,增长缓慢几乎是必然结果。
二、5 个月三次大更新,Codex 逆势崛起
Codex 在发布后的 8 个多月时间里一直陷于沉寂,在 2026 年 1 月,其周活用户的数量甚至还出现了一定幅度的下滑。
Codex 的转折点,出现在今年 2 月。OpenAI 接连发布了 Codex 桌面应用和 GPT-5.3 Codex 两大新品,一个重塑 Codex 入口,一个则大幅提升了 OpenAI 模型在编程和智能体场景的实用性。
先来看看模型侧的变化。OpenAI 和 Anthropic 在同一天发布了 GPT-5.3 Codex 和 Claude Opus 4.6。在 Artificial Analysis 的智能指数榜单上,这两个模型的得分完全打平。在 Terminal Bench 等核心编程基准测试中,GPT-5.3 Codex 甚至实现了超过 10% 的领先。

而 OpenAI 发布 Codex 桌面应用的意义可能更为重大。它并不只是简单地把 Codex CLI" 图形化 " 了,而是在产品定位上,将 Codex 从 Agent 工具升级为 "Agent 指挥中心 "。

Codex CLI、Claude Code 等命令行工具,虽然也具备通过子 Agent 并行执行任务的能力,例如拆分代码搜索、实现不同模块或并发分析问题,但这些 Agent 更多是服务于一次任务执行过程中的 " 内部协作 ",用户主要仍是在与一个 Agent 对话。
为适应 Codex 的新定位,OpenAI 在 Codex 桌面应用中将 Agent 提升为独立的工作单元,每个 Agent 拥有独立线程、独立上下文、独立代码工作区(Worktree)和长期运行能力,用户可以像管理团队成员一样同时分配任务、查看进度、审阅结果,并通过自动化能力让 Agent 持续执行周期性工作。其实,OpenAI 是把一个完整的 AI 开发团队交给了用户。


到 4 月份,OpenAI 又进行了一个更加关键的调整。
在 "Codex for ( almost ) Everything" 更新中,OpenAI 开始丰富 Codex 的能力。Codex 拥有了直接在后台操作计算机的能力,内置了浏览器和图像生成功能,新增了对 GitHub PR 审查、多终端标签和远程开发箱(SSH)的支持,并提供了超过 90 个新插件(如 JIRA、CircleCI)来打通日常工具链。
这些能力的引入,让用户可以在文档处理、流程自动化、信息整理以及跨工具协作等新场景使用 Codex。

与 Codex 这一更新所配套的,是 GPT-5.4 的升级。在这代模型中,OpenAI 首次加入了原生的 Computer Use 能力和 100 万上下文支持。这些能力共同构成了 Codex 进一步进入白领工作场景的重要基础,使其能够更自然地参与跨应用、跨系统的复杂任务执行。
5 月份的 GPT-5.5 则进一步优化了 token 效率、长上下文、编程等能力,并改善了模型在长任务中的任务保持能力。有不少用户反馈,Codex+GPT 的组合,在使用成本上比 Claude Code+Claude 模型的组合要更具有性价比。
今年 6 月的 Codex 大更新与 4 月的更新一脉相承。Codex 面向白领工作推出了智能体插件功能,首发了 6 个特定角色插件,包括数据分析、创意制作、销售、产品设计、股票投资等,每个插件都捆绑了相关角色的应用程序、技能、说明和工作流程。这些新功能,让 Codex 可以在更丰富的企业级场景中,扮演生产力系统的角色。
除了在产品和模型上下功夫,OpenAI 在过去几个月时间里还进一步整合了 ChatGPT 与 Codex,用户可以在 ChatGPT 手机应用里完成从任务发起、Agent 运行监控到结果审查的完整流程,使用门槛进一步降低。Codex 还定期推出额度重置福利,用户有不少免费的羊毛可以薅。
这一系列调整,最终转化为 Codex 活跃用户数量的迅猛增长,在短短 5 个月内从 2026 年初的约 60 万周活跃用户跃升至 500 万以上,成为 OpenAI 近一年增长最快的产品之一。
三、Codex 成为战略级产品之后
Codex 的未来,要往何处去?
过去几年,无论从资源配置还是战略规划角度来看,OpenAI 最重要的产品始终是 ChatGPT。而现在,Codex 的资源投入正在不断提升,持续快速更新的产品、频繁重置的免费额度、以及 OpenAI 在超级碗比赛期间为 Codex 投放的 60 秒天价广告,这种种举措都在释放一个信号:Codex 正在被提升为战略级产品线。
结合 OpenAI 从去年年底以来对企业级市场的持续加码,这一变化并不难理解。无论是编程,还是白领工作,Codex 瞄准的始终是企业级市场。在增长逻辑上,相比个人用户,企业客户或者说在工作中使用 Codex 的用户,拥有更强的付费能力和意愿,也更容易帮助 OpenAI 形成长期稳定的收入结构。
这已经是一个被验证过的叙事,Anthropic 在 ARR 和估值层面对 OpenAI 的超越,很大程度上正是依赖其在企业市场的渗透能力。
Codex 也是一款更适合企业级场景的产品。对于企业客户而言,一个能够完成代码开发、自动化流程、文档处理以及任务执行的 Agent,其价值要高于纯粹的大模型 API 服务或者聊天机器人。它可以直接嵌入企业的生产系统与业务流程,成为实际的 " 执行层组件 "。
在这种结构下,企业内部 AI 投资的 ROI 计算可以变得更加容易。例如,一个 Agent 如果能够替代部分开发、测试或数据处理流程,本质上就是在降低固定人力成本或提升人均产出。这类收益是可量化、可归因的,其 ROI 叙事更为清晰。负责制定企业信息化战略的 CIO 们,也更容易在内部论证这一投资的价值。
当然,挑战依然存在。
首先是可靠性。Agent 类产品的能力虽在快速提升,但复杂任务执行中仍会出现错误。对企业而言,稳定性往往比能力上限更重要,尤其是在医疗、金融等强监管行业。Codex 的可靠性将直接影响其在这些市场的扩展。
其次是竞争。Anthropic 的 Claude Code、Claude Cowork 在开发者口碑和企业治理成熟度上仍然领先 Codex。Claude Cowork 的管理控制台、RBAC、审计日志已全面可用,而 Codex 的对应能力尚在 " 即将推出 " 阶段。Copilot 则凭借微软生态,在分销渠道上拥有难以复制的优势,其多模型策略也给用户更多选择空间。
最后是成本。Agent 的 token 消耗远高于对话,如何实现成本和性能的平衡是一个复杂问题。2026 年 4 月,OpenAI 将 Codex 从按消息计费改为基于 token 点数的滚动窗口计费,本意是让成本更精确反映实际消耗,实践中却带来不可预测性和总体成本上升。这可能导致部分用户转向开源方案,或至少在日常高消耗任务中用开源方案替代部分 Codex 的工作。
结语:Codex 还有硬仗要打
如今,国内外的头部大模型玩家,都在围绕 Agent 的 " 入口权 " 展开新一轮较量。Codex 用 5 个月时间从 60 万周活冲到 500 万,证明了即便起步落后、口碑被压制,只要找准定位、持续迭代,依然有机会翻盘。
但复盘这场翻身仗,Codex 的成功并不只靠产品功能堆叠,模型能力的追赶、产品定位的优化、目标市场的扩张、以及资源投入的倾斜,缺一不可。
500 万周活用户已经证明了 Codex 在通用 Agent 赛道的吸引力。接下来要看的是,当成本优势消退、竞品加速跟进之后,Codex 是否还能保持这样的迭代节奏和产品定力。要守住增长,Codex 还需要在产品体验和商业模式上建立更深的护城河。


登录后才可以发布评论哦
打开小程序可以发布评论哦