V4还没来 DeepSeekMath-V2数学模型来了：IMO奥赛金牌水平

快科技 11 月 27 日消息，全网都在等 DeepSeek 发布 V4 大模型，然而好事多磨，这个模型一直没有问世，但 DeepSeek 也没闲着，时不时来个惊喜，今晚突然低调发布了 DeepSeekMath-V2 模型。

DeepSeekMath-V2 是一款可自我验证的数学推理训练框架，基于 DeepSeek?V3.2?Exp?Base 训练而来，通过 LLM 验证器自动审查生成的数学证明，并利用高难度样本持续优化性能。

目前该模型代码与权重已开源，发布于 Hugging Face 及 GitHub 平台。

这款模型强在哪里？先说结果，在 IMO 2025 和 CMO 2024 中均达到金牌水平，Putnam 2024 获 118/120 分。

如果对比当前顶级的大模型，比如 Claude Sonnet4、GPT-5、Gemini 2.5 Pro 等，Basic 测试中得分被 DeepSeekMath-V2 的 99 分远远甩开，Adveanced 中也只比 Gemini DeepThink 的 65.7 分略低，这个模型也是谷歌特调的，也达到到了 IMO 金牌水平。

考虑到 DeepSeekMath-V2 的开源、免费等特性，可以说它是当前最强的数学模型了。

不过 DeepSeek 官方的说法倒是很谦虚，表示尽管仍有许多工作需要完成，这些结果表明，自我可验证的数学推理是一个可行的研究方向，可能有助于开发更强大的数学 AI 系统。

如果联系到 DeepSeek 最近几款特殊模型的表现，显然他们在 V4 发布之前积累了相当多的新技术新想法，在 OCR、数学等方面表现惊艳，这么一想 V4 如果是全能型的多模态大模型，那就更值得期待了。

宙世代

一起剪

相关标签