这届大学生太难了,好不容易拼进编程竞赛总决赛,还要被 AI 秀一脸。
在刚刚结束的 2025 年国际大学程序设计竞赛(ICPC)世界总决赛上,OpenAI 的系统完美解决全部 12 道题目,若计入排名将位居第一。
谷歌的 Gemini 2.5 Deep Think 模型解决 10 道题目,达到金牌水准名列第二。
这场顶级赛事汇集了来自全球 103 个国家、近 3000 所大学的 139 支顶尖队伍。
而 AI 系统在 ICPC 官方监督的独立 "AI 实验赛道 " 中,与人类选手面对相同题目和评测标准,表现非常抢眼。
其中比较难的一道 " 问题 C",没有一个大学团队能够解决,Gemini 和 OpenAI 的模型组合都解决了。
谷歌不知出于什么原因,还比人类选手晚 10 分钟才启动系统,就有点过分了啊。
OpenAI 满分夺魁,给 GPT-5 配了强力外援
OpenAI 这次派出的是 GPT-5 和一个实验性推理模型的组合阵容。在不到五小时的比赛时间里,这套系统成功解决了全部 12 道题目。
具体来说,GPT-5 独立完成了前 11 道题目,而且其中 11 道题都是一次提交就通过了 ICPC 官方的在线评测环境。
对 OpenAI 系统来说,最有挑战的是问题 G,由实验性推理模型在 GPT-5 遇到困难后接力完成,两个模型总共提交了 9 次才攻克这道难题。
人类选手中也只有第一名圣彼得堡国立大学团队在 3 次尝试中解决,很多大学团队一次都没有提交过这个问题。
OpenAI 暂没有分享这道题的解决思路,但他们特别强调参赛的是通用推理模型,并没有专门为 ICPC 进行训练。
另外值得一提的是,OpenAI 团队中有不少研究员本身就是 ICPC 的参赛选手出身,包括接任 Ilya 的首席科学家 Jakub Pachocki,关于他的故事可以看。
此时距离 OpenAI 首次推出推理模型 o1 差不多刚好一年,与一年前相比,现在的推理模型不仅更智能、更快速,而且成本效益更高了。
谷歌 Gemini 独立解决难题
谷歌 Gemini 2.5 Deep Think 在比赛开始 10 分钟后启动,最终在五小时内成功解决了 12 道题目中的 10 道,达到了金牌级别。
Gemini 在前 45 分钟内就解决了 8 道题目,三小时内又攻克了两道,按照总用时 677 分钟计算,若与大学队伍比较,Gemini 的成绩将排在第二位。
下图中,Gemini 解决问题的时间以蓝色显示,最快的大学队伍所用时间以灰色显示。
对于人类选手没解决的问题 C,谷歌分享了解题思路。
这道题要求设计一个通过相互连接的管道网络向储存库分配液体的方案,目标是找到一种配置使所有储存库尽快填满。
由于每个管道可以打开、关闭或部分打开,可能的配置数量是无限的,这使得搜索最优配置变得极其困难。
Gemini 的解决方案:
它首先假设每个储存库都有一个 " 优先级值 ",代表相对于其他储存库应该优先考虑的程度。
当给定一组优先级值时,可以使用动态规划算法找到管道的最佳配置通过应用极小化极大定理,原始问题可以通过寻找使结果流量最受约束的优先级值来解决。
利用优先级值和最优流量之间的关系,Gemini 使用嵌套三元搜索在碗状凸解空间中快速找到最优优先级值,成功解决了问题 C。
谷歌 DeepMind 表示,Gemini 的成功融合了预训练、后训练、新型强化学习技术、多步推理和并行思维等一系列技术进展。
在强化学习过程中,他们训练 Gemini 为编程界面临的一些最困难的问题进行推理和生成代码,从结果反馈中学习并不断改进方法。
One More Thing
自推理模型范式问世之后,AI 连续在数学奥赛 IMO,信息学奥赛 IOI,编程大赛 ICPC 中表现出色。
不过,这次 OpenAI 研究副总裁 Jerry Tworek 表示:
ICPC 之后我们可能不会打别的竞赛了,下一个前沿领域更令人兴奋。
人类选手们可以松一口气了。
那么什么是下一个前沿领域?可以参考 Tworek 最新的个人介绍:
如何将各类科学和工程技能应用于现实世界的问题。
这些领域的研究者、工作者们,GPT-5 来找你们了。
参考链接:
[ 1 ] https://x.com/OpenAI/status/1968368133024231902
[ 2 ] https://deepmind.google/discover/blog/gemini-achieves-gold-level-performance-at-the-international-collegiate-programming-contest-world-finals/
[ 3 ] https://worldfinals.icpc.global/2025/
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
年度科技风向标「2025 人工智能年度榜单」评选报名开启啦!我们正在寻找 AI+ 时代领航者
❤️ 企业、产品、人物 3 大维度,共设立了 5 类奖项,欢迎企业报名参与
一键关注 点亮星标
科技前沿进展每日见
登录后才可以发布评论哦
打开小程序可以发布评论哦