量子位 昨天
陶哲轩亲测:我用Gemini十分钟搞定了困扰学界多年的难题
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

陶哲轩携手 Gemini,十分钟破解数学难题!

还是他本人擅长的连续整数结构的乘法数论问题。

该问题建立在前人并不完整的反证基础上,陶哲轩借助Gemini Deep Think进行证明补全。

全程只用了十分钟,Gemini 就从论证分析打通了结论确认。

而这也并非孤例,陶哲轩发现,在 Erd ő s 问题网站上,类似的情况时有发生,最近陆陆续续有 6 个困扰数学界多年的 Erd ő s 难题通过 AI 辅助方法,得以解决。

还有许多研究者正在系统性地使用 AI 工具进行相关文献资料的查询,并作为解题思路留在评论区。

而这次陶哲轩使用的模型 Gemini 2.5 Deep Think,想必大家也并不陌生。

正是此前的 IMO 金牌得主,在最新的 FrontierMath 测试中,其数学能力也远超GPT-5 ( high ) 等模型。

下面来看详细验证过程:

Gemini 用十分钟完成验证

首先回到问题本身,这是由 Paul Erd ő s 提出的 367 号问题:

该问题设定为整数 n 的 2-full 部分,即,其中为中幂为 1 的素因子之积。

简单来说,就是会把中所有只出现一次的素因子去掉,只保留指数至少为 2 的部分。

然后对于任意固定的,是否存在常数,使得对所有足够大的均满足:

甚至再极端一些,满足。

换言之,就是需要验证该条件中的极限上确界是否存在。

而就在几天前,数学家 Wouter van Doorn 对该问题的第二部分,基于一个未验证的同余恒等式,提出了相应的反证。

陶哲轩注意到了这个过程,于是将该恒等式连同问题本身一起交给了 Gemini Deep Think 进行完整证明,并确认整个论证过程。

结果只用了十分钟,Gemini 就完成了上述过程。

在此基础上,陶哲轩又用了半小时,手动将 Gemini 的 p-adic 代数数论证明转换为更为基础的论证方式。

两天后,Boris Alexeev 使用 Harmonic 的 Aristotle 工具(可直接从英语 /LaTeX 源代码中自动形式化处理),完成了对该证明的Lean 形式化,总耗时两到三小时。

至此,该问题在 Gemini 和人类数学家的协同合作下,得以解决。

后续,陶哲轩为了完整起见,还额外用 ChatGPT DeepResearch 和 Gemini DeepResearch 进行了相关文献查询

它们都能识别出该内容属于   问题,但在与之密切相关的问题   上仍然会存在混淆的情况出现。

二者均提及了与   和    相关的佩尔方程构造,以及在连续幂数(特别是假设 abc 猜想成立的情况下)的最新进展,但它们都没有发现,在问题页面下方的评论处已经出现了对该问题第二部分的证伪,并且仍然宣称该问题尚未得到解决。

One More Thing

事实上,这已经不是陶哲轩第一次用 AI 辅助解决数学工作,早在三年前ChatGPT刚发布时,他就敏锐地察觉到 AI 将在数学证明上大有所为。

虽然最初的结果并不让他满意,但随着模型数学推理能力的进步,AI 已经能够和数学家配合默契:

在 AI 的协助下,数学将在未来拥有更多的实验,而不仅仅是理论。

而对于那些对数学领域抱有热忱,但缺乏相关知识学习的人来说,AI 也将帮助他们达到难以想象的深度。

不过也有网友表示,要警惕AI 幻觉错误,AI 的验证过程往往隐藏着容易被忽略的基础错误,这时候就需要数学家细心纠正。

这也是陶哲轩一直以来的观点,AI 不会完全取代数学家,而是充当数学家证明的中介

AI 将帮助数学家发现其它可以探寻的路径。

参考链接:

[ 1 ] https://mathstodon.xyz/@tao/115591487350860999

[ 2 ] https://news.ycombinator.com/item?id=46017972

[ 3 ] https://www.erdosproblems.com/forum/thread/367

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

  快来量子位 MEET2026 智能未来大会,与我们畅聊 AI 吧!

‍张亚勤孙茂松等 AI 行业重磅嘉宾,以及百度京东高通亚马逊等头部 AI 企业已确认出席,RockAI、太初元碁、自变量、小宿科技等业内新秀也将参与分享,还有更多嘉宾即将揭晓  了解详情

  12 月 10 日

北京金茂万丽酒店

,期待与你共论 AI 行业破局之道  

点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

陶哲轩 ai 数学 子之
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论