Anthropic 昨晚发布了一篇长文,标题为《When AI builds itself》(当 AI 自我构建时),听起来像是阿西莫夫的某本科幻小说,主题也确实是一个很科幻的概念:recursive self-improvement(递归自我改进)。

简单说,过去是人类研究员写代码、跑实验、训练模型,然后把 AI 做得更强。可如果 AI 自己开始参与设计、训练、测试、优化自己的后继版本,那么 AI 进步的速度就不再只是由人类推动,可能开始由 AI" 自我进化 "。
为此,Anthropic 发出呼吁:
" 我们认为,如果世界能够选择放缓或暂时中止前沿 AI 的开发,让社会结构和对齐研究跟上技术进步,这对世界大有裨益。"
这句话听起来像安全警告,但放在 Anthropic 准备 IPO 的时间点上,它也很难不被看作另一种叙事预演:Claude 实在太好用了,甚至开始自己创造下一代 Claude 了。
为了说明AI 正在越来越多地参与 AI 研发本身。Anthropic 拿出了大量内部数据。
比如,截至 2026 年 5 月,Anthropic 合并进代码库的代码中,超过 80% 由 Claude 编写。而在 Claude Code 发布之前,这个数字还仅是个位数。
到 2026 年第二季度,按 Anthropic 的统计,工程师每天合并的代码量已经比 2024 年高出约 8 倍。

比代码量更值得注意的是,Claude 正在处理更开放的工程问题。
Anthropic 在文中说,过去一年里,员工纠正 Claude、把 Claude 拉回正轨,或者中途接手任务的频率一直在下降。这个变化不只发生在简单任务上,也发生在最复杂的开放任务上。
所谓开放任务,就是没有明确说明书的问题。比如系统崩了、训练任务挂了,工程师自己一开始也不知道答案长什么样,只能一边排查一边判断。
这类任务过去最依赖人的经验,而在那些最开放的任务里,Claude 的成功率到 2026 年 5 月已经达到 76%,六个月内提高了 50 个百分点。

不只是写代码,Anthropic 还用 Claude 做代码审查,检查 bug、安全漏洞和其他缺陷,他们回溯分析发现,如果过去每次代码变更都经过 Claude 自动审查,大约三分之一导致 claude.ai 线上事故的 bug,本可以在上线前被拦下来。
更进一步,Claude 已经开始参与研究流程。
Anthropic 有一个固定测试:给 Claude 一段训练小模型的代码,让它在不改错结果的前提下,想办法把代码跑得更快。2025 年 5 月,Claude Opus 4 大概能跑出 3 倍加速;到了 2026 年 4 月,Claude Mythos Preview 已经把这个数字推到了约 52 倍。
Anthropic 还提到一个开放式 AI 安全研究案例。他们把一个问题交给 Claude 驱动的智能体:一个较弱模型能不能可靠监督一个更强模型?
这个过程需要提出假设、测试假设、和并行智能体共享发现、反复迭代。
两位人类研究员花了一周时间,弥合了大约 23% 的差距;而 Claude 在累计约 800 小时、约 1.8 万美元算力消耗下,弥合了 97%。
这项结果当然有局限,问题是人类选的,评分标准也是人类定的,结果也没有完全迁移到生产规模模型上。但它仍然说明,Claude 已经可以在一个人类设定好方向的研究框架里,自己设计实验、自己执行、自己迭代。
另外,在人类研究员 " 走错路 " 的时候,Claude 还能给出更好的下一步判断。
Anthropic 找了 129 个内部 Claude Code 研究会话,这些会话里,人类研究员和 Claude 一起解决开放式研究问题。Anthropic 挑出其中一些 " 人类后来证明绕了弯路 " 的节点,然后把这个节点之前的上下文给不同版本的 Claude,看它会建议下一步怎么做。再由另一个知道完整会话结局的 Claude judge 来判断:模型建议和人类当时的选择,哪个更好。
结果表明,在那些人类研究员已经被事后证明有改进空间的节点上,Claude 越来越能提出更好的下一步。

过去,AI 模型的进步主要靠人类研究员和工程师推动。人类决定做什么实验、写代码,训练模型、推动 AI 的功能迭代。
现在,这条链条里越来越多的环节,开始被 Claude 接走。
Anthropic 给出了一个很直观的阶段表:

2021 到 2023 年,Anthropic 和普通科技公司没什么区别,都是人类在笔记本电脑上写代码、写文档。
2023 到 2025 年,聊天机器人开始进入工作流。工程师让模型生成代码片段,再复制到编辑器里。
2025 到 2026 年,编程智能体出现,Claude 开始能自主编写和修改代码,有时甚至能独立完成整个文件。
到了今天,智能体已经可以自己运行代码,还能把长达数小时的工作委派给其他智能体。
再往后,就是 Anthropic 真正担心的那个阶段:闭合回路。
如果这一天到来,Claude 的后续版本,就可能由 Claude 自身持续改进——这就是 recursive self-improvement,递归自我改进。
Anthropic 在文中说得很谨慎:我们还没有走到那一步,递归自我改进也不是必然发生。但它依然在强调,通往那一步的路径,已经开始变得可见。
所以 Anthropic 才会在文章最后谈到减速,甚至暂停。它的意思不是现在所有 AI 公司立刻停工,而是说,如果未来 AI 自我改进风险继续上升,前沿实验室需要一套协调、可验证的减速机制。
换句话讲," 奇点 " 就要到了,人类必须加以控制。
如果只看表面,这是一篇非常具有前瞻意识的安全文档。Anthropic 在讲递归自我改进,讲 AI 可能越来越快地改进自己,讲人类社会需要提前准备减速和暂停机制。
但放在 Anthropic 准备 IPO 的时间点上,这篇文章就有了另一层意思。
某种意义上,A 厂最近的动态很像班上那种欠儿欠儿的优等生——它确实有能耐,但也确实很装。
它想说的不只是 " 我们有一个很强的 Claude",比这更前一步,它想说 "Claude 正在帮助我们制造更强的 Claude"。
如果 Anthropic 只是卖一个模型或者卖一个工具,它就很难彻底摆脱横向比较:Anthropic 有 Claude,OpenAI 有 GPT;Anthropic 有 Claude Code,OpenAI 有 Codex;Anthropic 抢企业客户,OpenAI 也抢企业客户。两家公司的竞争非常胶着,就看谁能向市场讲出更大的故事。
需要注意的是,就在 3 天前,OpenAI 前脚在一份关于前沿 AI 治理的文件里写道:
" 我们也在今天的系统中看到了递归自我改进的早期迹象:AI 的发展本身正在被 AI 加速。
这将加剧开发者和国家之间的竞争压力,并带来现有机构无法应对的治理挑战。"
3 天后,Anthropic 后脚就说:Claude 通往递归自我改进的路径,已经开始变得可见。

要是 Claude 真如它所期待的那样发展,就不是普通产品叙事了,它会变成一个研发飞轮。
Claude 写代码、跑实验、优化训练流程,再反过来减少 Anthropic 自己产品里的事故 …… 一旦这套系统跑起来,Claude 就不只是 Anthropic 的一个产品,也是 Anthropic 的重要生产工具。
用户看到的是 Claude 这个产品,企业客户买的是 Claude 的能力,但 Anthropic 真正想让资本市场注意的是:Claude 已经嵌入了前沿模型研发的底层流程,它被放到了 Anthropic 的发动机舱里。
资本市场最喜欢听飞轮的故事,像聚宝盆一样财源滚滚:更强的 Claude 让 Anthropic 的工程师能合并更多代码,更多代码让产品和基础设施迭代更快,更快的迭代让研究员能跑更多实验,更多实验又反过来帮助下一代 Claude 变强。下一代 Claude 变强后,再继续加速 Anthropic 的研发。
Claude 的迭代速度也在支撑这个飞轮。从公开发布时间看,2023 年到 2025 年初,Claude 的主要模型更新大多是三四个月一轮,但在进入 Claude 4 之后,Anthropic 的模型更新明显变密。
Claude 4 在 2025 年 5 月发布,Opus 4.1 在 8 月发布,Sonnet 4.5 在 9 月发布,Haiku 4.5 在 10 月发布,Opus 4.5 在 11 月发布。
到了 2026 年,Opus 4.6 在 2 月 5 日发布,Sonnet 4.6 在 2 月 17 日发布,Opus 4.7 在 4 月 15 日发布,Opus 4.8 在 5 月 28 日发布。Opus 4.7 到 Opus 4.8,只隔了 42 天。
Anthropic 表面上是在说 " 这件事可能很危险,我们要提前准备刹车 ",但它同时也在暗示:" 我们已经看见油门踩下去之后会发生什么。"
IPO 叙事的微妙之处就在于此。它一边把风险讲得很重,一边也把自己的技术位置抬得很高。
不是所有 AI 公司都有资格讨论递归自我改进,你得先让外界相信,你的 AI 已经进入了 AI 研发流程,才有资格说这件事可能需要全球协调。
前面提到,就在 Anthropic 发这篇长文之前,OpenAI 刚刚把递归自我改进摆上了桌。
但两家公司的讲法很不一样。
OpenAI 那篇《Democratic Governance of Frontier AI》,是一份写给华盛顿的政策蓝图,它关心的不是 " 模型怎么变强 ",而是当前沿 AI 继续往前冲,该如何加以约束。
那篇报告里面提到的大多内容不太适合加以赘述,唯独一句话关键:OpenAI 说,今天的系统中,已经可以看到递归自我改进的早期迹象。
这句话和 Anthropic 这篇长文,其实指向同一个方向。
只不过 OpenAI 在讲制度,Anthropic 在讲自己。
OpenAI 的意思是:AI 发展太快,现有治理结构可能跟不上,所以需要一套新的规则。
而 Anthropic 直接把那个系统亮了出来,告诉市场:Claude 已经进入了我们的研发流程,所以我们看见了 AI 自我加速的路径。
这一手玩得很高明,感觉 OpenAI 内部指不定已经开始蛐蛐了——这简直是剽窃创意!明明是我们先来的!
开个玩笑,不过 OpenAI 确实需要加把劲了,快点把 GPT 5.6 抬上来吧。


登录后才可以发布评论哦
打开小程序可以发布评论哦