数学界「悬案簿」Kourovka Notebook,AI 取得新突破。
群论领域几十年无解的第 21.10 号问题,被牛津数学家Marc Lackenby用谷歌一个新系统破解了。
过程也很有意思:AI 第一次给出的证明是错的,被系统里的审查 Agent 揪出了漏洞。
Lackenby 看到之后突然意识到:「等一下,我知道该如何填补这个漏洞」。
于是,通过和 AI 的反复配合,Lackenby 最终成功解答出了这道数学难题。
这套人机协作的系统,就是谷歌 DeepMind最新发布的「AI Co-Mathematician」(AI 联合数学家)。

它在最难的数学 AI 基准FrontierMath Tier 4上拿了48%,刷新 SOTA。
甚至超过了 GPT-5.5 Pro(39.6%)和 GPT-5.4 Pro(37.5%)。

最近几个月,不少数学难题,诸如接连几个 Erd ő s 问题都是用 GPT 解决的。
现在,谷歌也回归了。

「AI 联合数学家」,是什么?
「AI 联合数学家」是一个异步、有状态的工作空间,而非一问一答的模型。
顶层有一个「项目协调者」Agent 负责统筹,拆解任务,调度多条研究线并行推进。

数学家上传一篇论文、提出一个研究方向后,协调者不会立刻输出答案,而是先和用户对话,像真正的合作者一样帮对方精炼问题。

之后它将任务分发到多条并行工作流:一条做文献检索,一条搭计算框架,一条尝试证明策略。
每条工作流都有自己的协调 Agent,异步运行,互不阻塞。用户随时能介入、引导、接管。

如果 Agent 卡住了,它也会主动在聊天窗口里求助,而不是沉默重启。
比较特别的一点在于:它对失败的态度。
系统会持久化追踪所有失败的假说,不会丢弃,而是当作第一等的研究产出保存下来。

论文中提到,在数学研究里,知道什么行不通往往和知道什么行得通同等重要。
「AI 联合数学家」会持久化追踪每一条死胡同、每一个被否定的假设、每一次审稿 Agent 发现的漏洞。这些「负空间」不会被丢弃,而是成为后续探索的上下文。
它的产出物也不是一段聊天记录或一篇未经验证的草稿,而是带 margin 注释和来源溯源的 LaTeX 文档—


登录后才可以发布评论哦
打开小程序可以发布评论哦