
Codex 最近的更新频率实在疯狂。
过去两个月,OpenAI 几乎隔几天就往 Codex 里塞一个新东西。
先是插件、内置浏览器、电脑操作、PR review、远程 SSH、手机端接入 …… 再到 5 月 21 日,Codex 也搞 " 疯狂星期四 ",一口气更新了几个大功能:一键把屏幕内容交给 Codex,让 Codex 长时间围绕目标工作,电脑锁屏后继续远程使用,还支持团队共享插件和查看使用数据。
之前网上有一个流传挺广的梗图:醒来,看见又一个 Claude 更新。现在 Codex 也不遑多让。
只不过 Claude 更新得更 " 碎 "、更精细,Codex 则发布了更多大功能。

值得注意的是,它们更新的都是同一个方向——企业入口和真实工作流。
Claude Code 已经先证明了这条路的价值,Anthropic 甚至开始让市场相信,前沿模型公司不一定永远只能烧钱,也有机会把利润表跑出来。
Codex 也在做同样的事,在这个时间点上,背后站着的是正在准备上市的 OpenAI。
ChatGPT 已经证明了 OpenAI 有用户,但用户不等于生意,热闹也不一定能带来利润。尤其对一家前沿模型公司来说,算力成本、训练投入、推理开销都重。OpenAI 需要向市场证明,自己不只是会做爆款 Chatbot,也能把 AI 放进企业真正愿意付钱的生产环节。
Codex 的高频更新,就是在补全这一部分。
它不只是一个开发工具,它是 OpenAI 眼下最容易讲清楚商业价值的一张牌。
我们用 ChatGPT Images 2.0 做了一张图,看看最近两个月 Codex 都做了什么更新。

3 月 24 日,搜索与设置同步。
Codex App 加入历史线程搜索、最近线程快捷跳转功能,并同步 Codex App 和 VS Code 扩展里的关键设置。算是基础体验优化:让用户能更快找回之前的任务,让桌面端和编辑器里的使用体验更一致。
3 月 25 日,插件体系上线。
Codex 开始支持插件。插件可以打包 skills、应用集成和 MCP server 配置,用来复用工作流,支持 Codex App、CLI 和 IDE extension。
4 月 9 日,代码审查工作流增强。
Codex App 加入了可折叠的行内审查评论、不同的审查模式、Git 摘要和来源区块。Codex 开始更深地进入代码审查和 PR 协作。
4 月 12 日,文件与终端上下文增强。
Codex 增加了命令菜单里的文件搜索,支持在侧边栏预览图片、PDF 和 Markdown,也为每个线程加入了终端标签页,并支持用户选中文本后直接询问 Codex。
4 月 16 日,Codex for almost everything。
这是最近两个月第一个大节点,OpenAI 开始把 Codex 推成一个更完整的 AI 工作台。这一波更新包括内置浏览器、电脑操作、线程自动化、任务侧边栏、PR 工作流、结果预览、SSH 远程连接、多终端、多窗口、Intel Mac 支持,以及一批新插件。
4 月 23 日,自动审批审查。
Codex 可以把符合条件的审批请求,先交给自动审查代理判断风险,再显示审查状态和风险等级,最后由用户决定是否批准。
5 月 5 日,Codex 访问令牌上线。
ChatGPT Enterprise 的工作区所有者和管理员,可以允许成员创建 Codex 访问令牌,用在脚本、调度器、私有 CI runner 等可信的非交互式本地工作流里。Codex 开始接近 CI、自动化和企业工程系统。
5 月 7 日,Codex 进入 Chrome。
Codex 推出 Chrome 扩展,可以在浏览器标签页里并行工作,但不会直接接管用户浏览器,用户也可以控制哪些网站允许 Codex 使用。浏览器是很多后台系统、内部工具和网页调试场景的入口,这一步让 Codex 更接近真实办公现场。
5 月 14 日,Codex 支持手机控制。
OpenAI 支持用户从 ChatGPT 手机 App 使用 Codex,连接一台正在运行 Codex App 的 Mac,用户在手机上也可以查看任务进展、批准操作、看代码差异和测试结果。这一波还包括 Hooks 正式可用、访问令牌和企业管理员设置指南。Codex 开始变成一个可以远程跟进的工作代理。
5 月 21 日,Appshots、目标模式、锁屏远程使用和插件共享。
这是第二个大节点。Appshots 可以把 Mac 当前窗口的截图和可用文本直接发给 Codex;目标模式正式上线,用户可以给 Codex 一个目标,让它围绕这个目标持续工作数小时甚至数天;锁屏远程使用则允许 Codex 在 Mac 锁屏后继续操作桌面应用,不再需要 " 留一线 "。
同时,ChatGPT Business 开始支持团队共享插件;内置浏览器的标注能力进一步增强,可以直接调整字体、颜色、间距等样式。
功能本身当然重要,但整体的更新趋势同样值得关注。无论是 Appshots 还是目标模式,又或者 Chrome 扩展、访问令牌和插件共享,都是在进入真实工作流的基本条件:看得见现场,推得动任务,也管得住风险。
想看得见现场,需要补全的是上下文能力。
真实开发任务很少只发生在代码编辑器里。文件搜索、文件预览、终端标签页、内置浏览器、浏览器标注、Chrome 扩展、Appshots,本质上都是在减少用户给 AI 描述上下文的成本。
以前你要通过描述或者 Ctrl+C/V 告诉 AI 哪里有问题,现在,OpenAI 想让 Codex 直接看到这些东西。
想推得动任务,长任务和远程执行能力很重要。
目标模式解决的是 " 能不能持续做下去 "。手机端远程访问和锁屏远程使用,让用户即使不在电脑前,任务也能继续推进。访问令牌和 Hooks,则把 Codex 进一步接进脚本、调度器、CI runner 这些企业工程系统里。
能不能管住风险,就是企业和团队管理的事情了。
个人开发者用工具,核心是看好不好用,但企业工具的问题要复杂得多:权限怎么管,插件怎么分发,谁在用、用了多少,风险怎么审查,能不能接入 CI,能不能被团队统一管理。
Codex 在这方面也做了很多工作。插件体系让工作流可以被打包和复用;插件共享让团队可以统一分发工具;自动审批审查是在控制代理执行的风险;访问令牌和企业管理员设置,则是在让 Codex 接进企业已有的工程和治理流程。
Codex 的更新为它带来了非常亮眼的用户增长速度。
3 月初,Codex 的周活跃用户还是 160 万左右。到了 5 月 14 日,OpenAI 官方在介绍 Codex 手机端时提到,每周使用 Codex 的人已经超过 400 万。也就是说,在两个月左右的时间里,Codex 的周活用户又翻了一大截。
这条增长线绕不开底层模型的能力,用户愿意更频繁地把真实任务交给 Codex 的前提是,它真的能干活。尤其是 GPT-5.5 之后,Codex 的编码、工具调用、长上下文和多步骤任务能力有了更好的基础。
但光有模型是不够的,市场不会只因为一个模型 benchmark 变高就买单,它更关心这些能力能不能变成收入。
这也是 OpenAI 在上市前必须讲清楚的地方。
OpenAI 手里有很多牌,但每张牌都有自己的不确定性。
ChatGPT 是最大的用户入口,证明了 OpenAI 有全球用户和消费级订阅能力。问题是,用户规模越大,推理成本也越重;消费级订阅能不能支撑一家前沿模型公司的长期投入,还需要继续证明。
API 是基础收入来源,能把模型能力卖给开发者和企业。但 API 市场很容易卷进价格竞争,企业客户也未必只绑定一家模型供应商。模型能力越通用,客户越可能多模型混用。
ChatGPT Enterprise、Agents 和行业解决方案,是 OpenAI 进入企业市场的正面战场。但这些产品要真正深入企业流程,需要时间、销售、集成和行业落地。
更远一点,OpenAI 还有硬件、数据中心、多云合作和算力基础设施。这些故事想象力很大,但也更重、更远、更烧钱。它们能撑起长期愿景,却很难立刻解释短期商业回报。
而 Codex 的商业价值更容易被解释。它面对的人群很明确:开发者和工程团队。
这是一群本来就愿意花钱服务的人。工程师时间贵,软件项目周期长,代码维护成本高。bug 修复、测试、代码审查,每一个环节都能算出成本。
软件开发本身也是企业最核心的生产环节之一。金融公司有风控和交易系统,零售公司有供应链和会员系统,医疗公司有数据和合规系统,媒体公司有内容后台和分发系统。哪怕不是科技公司,也有大量内部工具、数据管道、自动化脚本和业务系统需要维护 …… 今天几乎所有公司都离不开软件系统。
也就是说,Codex 切进去的,是企业每天都在花钱、每天都在消耗人力的地方。
某种意义上来讲,它是 OpenAI 讲好 IPO 叙事的希望。在 OpenAI 准备走向资本市场的时间点上,这件事变得格外重要。
因为上市叙事里,OpenAI 要面对的已经不再是 "AI 有没有未来 " 这种问题。真正难回答的是另一件事:一家前沿模型公司,能不能在巨额算力投入之外,找到一条足够清楚、足够稳定、足够能赚钱的商业路径。
更麻烦的是,Anthropic 已经先把这个问题往前推进了一步。
Codex 必须被推到前台,还有一个很关键的原因:OpenAI 最大的竞争对手之一 Anthropic,已经在企业端先跑出了一条路。
虽然从营收规模看,OpenAI 仍然领先,The Information 报道,OpenAI 2026 年第一季度营收约 57 亿美元,高于 Anthropic 同期的 48 亿美元。但现在的问题已经不只是收入有多少,前沿模型公司的真正压力,是收入增长能不能跑过成本增长。
OpenAI 第一季度收入很高,但其调整后经营利润率约为 -122%。按这一口径计算,收入 1 美元,调整后经营成本可能约为 2.22 美元,到头还要亏 1.22 美元。

过去几年,外界一直质疑大模型公司太烧钱:训练、推理、GPU、人才支出,每一样都是无底洞。用户越多,调用越多,成本也越重。
Anthropic 最近释放出的信号,则改变了这件事的想象空间。
据《华尔街 · 日报》报道,Anthropic 预计 2026 年第二季度收入超过 109 亿美元,并接近首次季度营业利润,预计营业利润约 5.59 亿美元。
虽然这并不代表 Anthropic 从此摆脱了烧钱问题,但它给了市场一个很重要的信号:前沿模型公司不一定永远只能靠融资续命,只要模型能力足够强,产品足够贴近企业高价值场景,收入增长就有可能跑在成本前面。
Anthropic 没有 ChatGPT 那样的全民入口,也没有那么多同时推进的故事。它的路线更窄,也更纯粹:直接进入企业愿意付钱的地方,尤其是开发者、金融、法律、研究、数据分析和内部知识工作这些高价值场景。
Claude Code 就是其中最典型的一张牌。它最早做的是开发者圈里的神器,主打编程场景,后来一路补长任务、插件、权限、团队管理和企业治理,慢慢变成 Anthropic 进入企业工作流的重要入口。开发者先用起来,团队再跟上,最后变成企业采购和预算。
2026 年 4 月,在 Ramp 的样本企业中,Anthropic 的采用率升至 34.4%,OpenAI 则降至 32.3%。虽然这只是基于 Ramp 平台上的企业支出样本,不代表全市场统计,但这个数据至少能说明,Anthropic 在企业付费场景里的势头正在变强。

Codex 的压力也就在这里。
OpenAI 的营收规模仍然领先,但如果它要走向资本市场,就不能只讲用户规模或者模型能力。它需要一个更接近企业生产现场的产品,去证明自己能把 AI 变成稳定的企业收入。
如果 Claude Code 证明了开发者工作流可以成为 Anthropic 的企业入口,那么 Codex 就必须证明,OpenAI 也能走通这条路。
Codex 负责人 Tibo Sottiaux 最近半开玩笑地总结了公司的 " 总体规划 ":发布更好、更高效的模型,每周发布更好的产品,再拿到更多算力(并增加在 X 上冲浪的时间)。
更好的模型,决定 Codex 能不能真正干活;更高频的产品更新,决定 Codex 能不能进入真实工作流;更多算力,则决定这一切能不能支撑越来越大的使用量。
这些都对上市非常重要。

换句话说,Codex 最近的密集更新不只是追功能,也在追 Anthropic 已经跑出来的那条企业化路径。
ChatGPT 已经证明了 OpenAI 有用户。
而 Codex 要证明,OpenAI 是个能赚钱的生意。


登录后才可以发布评论哦
打开小程序可以发布评论哦