字母AI 5小时前
Anthropic 高喊狼(AGI)来了,是为了人类还是IPO?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 | 字母 AI

Anthropic 昨晚发布了一篇长文,标题为《When AI builds itself》(当 AI 自我构建时),听起来像是阿西莫夫的某本科幻小说,主题也确实是一个很科幻的概念:recursive self-improvement(递归自我改进)。

简单说,过去是人类研究员写代码、跑实验、训练模型,然后把 AI 做得更强。可如果 AI 自己开始参与设计、训练、测试、优化自己的后继版本,那么 AI 进步的速度就不再只是由人类推动,可能开始由 AI" 自我进化 "。

为此,Anthropic 发出呼吁:

" 我们认为,如果世界能够选择放缓或暂时中止前沿 AI 的开发,让社会结构和对齐研究跟上技术进步,这对世界大有裨益。"

这句话听起来像安全警告,但放在 Anthropic 准备 IPO 的时间点上,它也很难不被看作另一种叙事预演:Claude 实在太好用了,甚至开始自己创造下一代 Claude 了。

新的风暴已经出现

为了说明AI 正在越来越多地参与 AI 研发本身。Anthropic 拿出了大量内部数据。

比如,截至 2026 年 5 月,Anthropic 合并进代码库的代码中,超过 80% 由 Claude 编写。而在 Claude Code 发布之前,这个数字还仅是个位数。

到 2026 年第二季度,按 Anthropic 的统计,工程师每天合并的代码量已经比 2024 年高出约 8 倍。

比代码量更值得注意的是,Claude 正在处理更开放的工程问题。

Anthropic 在文中说,过去一年里,员工纠正 Claude、把 Claude 拉回正轨,或者中途接手任务的频率一直在下降。这个变化不只发生在简单任务上,也发生在最复杂的开放任务上。

所谓开放任务,就是没有明确说明书的问题。比如系统崩了、训练任务挂了,工程师自己一开始也不知道答案长什么样,只能一边排查一边判断。

这类任务过去最依赖人的经验,而在那些最开放的任务里,Claude 的成功率到 2026 年 5 月已经达到 76%,六个月内提高了 50 个百分点。

不只是写代码,Anthropic 还用 Claude 做代码审查,检查 bug、安全漏洞和其他缺陷,他们回溯分析发现,如果过去每次代码变更都经过 Claude 自动审查,大约三分之一导致 claude.ai 线上事故的 bug,本可以在上线前被拦下来。

更进一步,Claude 已经开始参与研究流程。

Anthropic 有一个固定测试:给 Claude 一段训练小模型的代码,让它在不改错结果的前提下,想办法把代码跑得更快。2025 年 5 月,Claude Opus 4 大概能跑出 3 倍加速;到了 2026 年 4 月,Claude Mythos Preview 已经把这个数字推到了约 52 倍。

Anthropic 还提到一个开放式 AI 安全研究案例。他们把一个问题交给 Claude 驱动的智能体:一个较弱模型能不能可靠监督一个更强模型?

这个过程需要提出假设、测试假设、和并行智能体共享发现、反复迭代。

两位人类研究员花了一周时间,弥合了大约 23% 的差距;而 Claude 在累计约 800 小时、约 1.8 万美元算力消耗下,弥合了 97%。

这项结果当然有局限,问题是人类选的,评分标准也是人类定的,结果也没有完全迁移到生产规模模型上。但它仍然说明,Claude 已经可以在一个人类设定好方向的研究框架里,自己设计实验、自己执行、自己迭代。

另外,在人类研究员 " 走错路 " 的时候,Claude 还能给出更好的下一步判断。

Anthropic 找了 129 个内部 Claude Code 研究会话,这些会话里,人类研究员和 Claude 一起解决开放式研究问题。Anthropic 挑出其中一些 " 人类后来证明绕了弯路 " 的节点,然后把这个节点之前的上下文给不同版本的 Claude,看它会建议下一步怎么做。再由另一个知道完整会话结局的 Claude judge 来判断:模型建议和人类当时的选择,哪个更好。

结果表明,在那些人类研究员已经被事后证明有改进空间的节点上,Claude 越来越能提出更好的下一步。

过去,AI 模型的进步主要靠人类研究员和工程师推动。人类决定做什么实验、写代码,训练模型、推动 AI 的功能迭代。

现在,这条链条里越来越多的环节,开始被 Claude 接走。

Anthropic 给出了一个很直观的阶段表:

2021 到 2023 年,Anthropic 和普通科技公司没什么区别,都是人类在笔记本电脑上写代码、写文档。

2023 到 2025 年,聊天机器人开始进入工作流。工程师让模型生成代码片段,再复制到编辑器里。

2025 到 2026 年,编程智能体出现,Claude 开始能自主编写和修改代码,有时甚至能独立完成整个文件。

到了今天,智能体已经可以自己运行代码,还能把长达数小时的工作委派给其他智能体。

再往后,就是 Anthropic 真正担心的那个阶段:闭合回路

如果这一天到来,Claude 的后续版本,就可能由 Claude 自身持续改进——这就是 recursive self-improvement,递归自我改进。

Anthropic 在文中说得很谨慎:我们还没有走到那一步,递归自我改进也不是必然发生。但它依然在强调,通往那一步的路径,已经开始变得可见。

所以 Anthropic 才会在文章最后谈到减速,甚至暂停。它的意思不是现在所有 AI 公司立刻停工,而是说,如果未来 AI 自我改进风险继续上升,前沿实验室需要一套协调、可验证的减速机制。

换句话讲," 奇点 " 就要到了,人类必须加以控制。

势不可挡的 Claude

如果只看表面,这是一篇非常具有前瞻意识的安全文档。Anthropic 在讲递归自我改进,讲 AI 可能越来越快地改进自己,讲人类社会需要提前准备减速和暂停机制。

但放在 Anthropic 准备 IPO 的时间点上,这篇文章就有了另一层意思。

某种意义上,A 厂最近的动态很像班上那种欠儿欠儿的优等生——它确实有能耐,但也确实很装。

它想说的不只是 " 我们有一个很强的 Claude",比这更前一步,它想说 "Claude 正在帮助我们制造更强的 Claude"。

如果 Anthropic 只是卖一个模型或者卖一个工具,它就很难彻底摆脱横向比较:Anthropic 有 Claude,OpenAI 有 GPT;Anthropic 有 Claude Code,OpenAI 有 Codex;Anthropic 抢企业客户,OpenAI 也抢企业客户。两家公司的竞争非常胶着,就看谁能向市场讲出更大的故事。

需要注意的是,就在 3 天前,OpenAI 前脚在一份关于前沿 AI 治理的文件里写道:

" 我们也在今天的系统中看到了递归自我改进的早期迹象:AI 的发展本身正在被 AI 加速。

这将加剧开发者和国家之间的竞争压力,并带来现有机构无法应对的治理挑战。"

3 天后,Anthropic 后脚就说:Claude 通往递归自我改进的路径,已经开始变得可见。

要是 Claude 真如它所期待的那样发展,就不是普通产品叙事了,它会变成一个研发飞轮。

Claude 写代码、跑实验、优化训练流程,再反过来减少 Anthropic 自己产品里的事故 …… 一旦这套系统跑起来,Claude 就不只是 Anthropic 的一个产品,也是 Anthropic 的重要生产工具。

用户看到的是 Claude 这个产品,企业客户买的是 Claude 的能力,但 Anthropic 真正想让资本市场注意的是:Claude 已经嵌入了前沿模型研发的底层流程,它被放到了 Anthropic 的发动机舱里。

资本市场最喜欢听飞轮的故事,像聚宝盆一样财源滚滚:更强的 Claude 让 Anthropic 的工程师能合并更多代码,更多代码让产品和基础设施迭代更快,更快的迭代让研究员能跑更多实验,更多实验又反过来帮助下一代 Claude 变强。下一代 Claude 变强后,再继续加速 Anthropic 的研发。

Claude 的迭代速度也在支撑这个飞轮。从公开发布时间看,2023 年到 2025 年初,Claude 的主要模型更新大多是三四个月一轮,但在进入 Claude 4 之后,Anthropic 的模型更新明显变密。

Claude 4 在 2025 年 5 月发布,Opus 4.1 在 8 月发布,Sonnet 4.5 在 9 月发布,Haiku 4.5 在 10 月发布,Opus 4.5 在 11 月发布。

到了 2026 年,Opus 4.6 在 2 月 5 日发布,Sonnet 4.6 在 2 月 17 日发布,Opus 4.7 在 4 月 15 日发布,Opus 4.8 在 5 月 28 日发布。Opus 4.7 到 Opus 4.8,只隔了 42 天。

Anthropic 表面上是在说 " 这件事可能很危险,我们要提前准备刹车 ",但它同时也在暗示:" 我们已经看见油门踩下去之后会发生什么。"

IPO 叙事的微妙之处就在于此。它一边把风险讲得很重,一边也把自己的技术位置抬得很高。

不是所有 AI 公司都有资格讨论递归自我改进,你得先让外界相信,你的 AI 已经进入了 AI 研发流程,才有资格说这件事可能需要全球协调。

OpenAI:怎么可以这样?

前面提到,就在 Anthropic 发这篇长文之前,OpenAI 刚刚把递归自我改进摆上了桌。

但两家公司的讲法很不一样。

OpenAI 那篇《Democratic Governance of Frontier AI》,是一份写给华盛顿的政策蓝图,它关心的不是 " 模型怎么变强 ",而是当前沿 AI 继续往前冲,该如何加以约束。

那篇报告里面提到的大多内容不太适合加以赘述,唯独一句话关键:OpenAI 说,今天的系统中,已经可以看到递归自我改进的早期迹象。

这句话和 Anthropic 这篇长文,其实指向同一个方向。

只不过 OpenAI 在讲制度,Anthropic 在讲自己。

OpenAI 的意思是:AI 发展太快,现有治理结构可能跟不上,所以需要一套新的规则。

而 Anthropic 直接把那个系统亮了出来,告诉市场:Claude 已经进入了我们的研发流程,所以我们看见了 AI 自我加速的路径。

这一手玩得很高明,感觉 OpenAI 内部指不定已经开始蛐蛐了——这简直是剽窃创意!明明是我们先来的!

开个玩笑,不过 OpenAI 确实需要加把劲了,快点把 GPT 5.6 抬上来吧。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai ipo 工程师 事故 安全漏洞
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论