驱动之家 昨天
V4还没来 DeepSeekMath-V2数学模型来了:IMO奥赛金牌水平
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 11 月 27 日消息,全网都在等 DeepSeek 发布 V4 大模型,然而好事多磨,这个模型一直没有问世,但 DeepSeek 也没闲着,时不时来个惊喜,今晚突然低调发布了 DeepSeekMath-V2 模型。

DeepSeekMath-V2 是一款可自我验证的数学推理训练框架,基于 DeepSeek?V3.2?Exp?Base 训练而来,通过 LLM 验证器自动审查生成的数学证明,并利用高难度样本持续优化性能。

目前该模型代码与权重已开源,发布于 Hugging Face 及 GitHub 平台。

这款模型强在哪里?先说结果,在 IMO 2025 和 CMO 2024 中均达到金牌水平,Putnam 2024 获 118/120 分。

如果对比当前顶级的大模型,比如 Claude Sonnet4、GPT-5、Gemini 2.5 Pro 等,Basic 测试中得分被 DeepSeekMath-V2 的 99 分远远甩开,Adveanced 中也只比 Gemini DeepThink 的 65.7 分略低,这个模型也是谷歌特调的,也达到到了 IMO 金牌水平。

考虑到 DeepSeekMath-V2 的开源、免费等特性,可以说它是当前最强的数学模型了。

不过 DeepSeek 官方的说法倒是很谦虚,表示尽管仍有许多工作需要完成,这些结果表明,自我可验证的数学推理是一个可行的研究方向,可能有助于开发更强大的数学 AI 系统。

如果联系到 DeepSeek 最近几款特殊模型的表现,显然他们在 V4 发布之前积累了相当多的新技术新想法,在 OCR、数学等方面表现惊艳,这么一想 V4 如果是全能型的多模态大模型,那就更值得期待了。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

谷歌 ai 数学 开源
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论