量子位 9小时前
谷歌「AI联合数学家」来了!刷新最难数学AI基准SOTA,牛津教授用它解开群论悬案
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

数学界「悬案簿」Kourovka Notebook,AI 取得新突破。

群论领域几十年无解的第 21.10 号问题,被牛津数学家Marc Lackenby用谷歌一个新系统破解了。

过程也很有意思:AI 第一次给出的证明是错的,被系统里的审查 Agent 揪出了漏洞。

Lackenby 看到之后突然意识到:「等一下,我知道该如何填补这个漏洞」。

于是,通过和 AI 的反复配合,Lackenby 最终成功解答出了这道数学难题。

这套人机协作的系统,就是谷歌 DeepMind最新发布的「AI Co-Mathematician」(AI 联合数学家)

它在最难的数学 AI 基准FrontierMath Tier 4上拿了48%,刷新 SOTA。

甚至超过了 GPT-5.5 Pro(39.6%)和 GPT-5.4 Pro(37.5%)。

最近几个月,不少数学难题,诸如接连几个 Erd ő s 问题都是用 GPT 解决的。

现在,谷歌也回归了。

「AI 联合数学家」,是什么?

「AI 联合数学家」是一个异步、有状态的工作空间,而非一问一答的模型。

顶层有一个「项目协调者」Agent 负责统筹,拆解任务,调度多条研究线并行推进。

数学家上传一篇论文、提出一个研究方向后,协调者不会立刻输出答案,而是先和用户对话,像真正的合作者一样帮对方精炼问题。

之后它将任务分发到多条并行工作流:一条做文献检索,一条搭计算框架,一条尝试证明策略。

每条工作流都有自己的协调 Agent,异步运行,互不阻塞。用户随时能介入、引导、接管。

如果 Agent 卡住了,它也会主动在聊天窗口里求助,而不是沉默重启。

比较特别的一点在于:它对失败的态度

系统会持久化追踪所有失败的假说,不会丢弃,而是当作第一等的研究产出保存下来。

论文中提到,在数学研究里,知道什么行不通往往和知道什么行得通同等重要

「AI 联合数学家」会持久化追踪每一条死胡同、每一个被否定的假设、每一次审稿 Agent 发现的漏洞。这些「负空间」不会被丢弃,而是成为后续探索的上下文。

它的产出物也不是一段聊天记录或一篇未经验证的草稿,而是带 margin 注释和来源溯源的 LaTeX 文档—

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 谷歌 数学 deepmind
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论