IT之家 07-22
谷歌 Gemini 在国际数学奥林匹克竞赛测试中获金牌水平成绩
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

IT 之家 7 月 22 日消息,国际数学奥林匹克竞赛(IMO)是全球最负盛名的数学竞赛之一,每年每个国家由六名高中生代表参赛,他们需在规定时间内解答六道极具挑战性的数学难题。在这一竞赛中,仅有约 8% 的参赛者能够获得金牌,这使得 IMO 的金牌成为数学领域的至高荣誉。

在今年的国际数学奥林匹克竞赛中,OpenAI 和谷歌都使用了它们最新的大语言模型(LLM)参赛。

上周末,OpenAI 宣布其实验性推理语言模型在 2025 年 IMO 的题目测试中取得了金牌级别的成绩。OpenAI 的模型在与学生相同的规则下进行了测试,需要在两场时长各 4.5 小时的考试时段内完成题目解答,且不能使用任何工具或联网,最终还需以自然语言形式书写证明过程。

今日,谷歌也宣布其升级版的 Gemini Deep Think 成功解决了 IMO 六道题目中的五道,同样达到了金牌水平的表现。这一升级版的 Gemini Deep Think 采用了谷歌 DeepMind 最新研究成果中的改进推理模式,包括并行思维技术,使其能够同时探索多种解决方案,而不再局限于逐一尝试。

IT 之家注意到,谷歌 DeepMind 团队在介绍这一升级版的 Gemini Deep Think 时表示:" 为了充分发挥 Deep Think 的推理能力,我们利用了新颖的强化学习技术,进一步增强了模型的多步推理、问题解决和定理证明能力。此外,我们还为 Gemini 提供了高质量数学问题解决方案的精选语料库,并在其指令中添加了一些关于如何应对 IMO 问题的通用提示词和技巧。"

谷歌计划在未来不久将这一升级版的 Deep Think 模型提供给一组受信任的测试者进行试用,并将在后续向谷歌 AI Ultra 订阅用户开放使用权限。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

谷歌 数学 竞赛 deep it之家
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论