DeepSeek推出DeepSeekMath‑V2模型，主打自验证数学推理能力

IT 之家 11 月 27 日消息，DeepSeek 发布了 DeepSeekMath ‑ V2，主打可自我验证的数学推理训练框架。

团队认为，仅追求最终答案正确率难以保证推理链条的严谨性，尤其在定理证明等需要逐步推导的任务中更为突出。模型通过构建基于 LLM 的验证器，对生成的证明进行自动审查，并利用扩展的验证计算持续生成高难度训练样本提升验证器能力。

据 IT 之家了解，DeepSeekMath ‑ V2 基于 DeepSeek ‑ V3.2 ‑ Exp ‑ Base，在 2025 年国际数学奥林匹克竞赛（IMO 2025）与 2024 年中国数学奥林匹克竞赛（CMO 2024）中均达到金牌水准，并在 2024 年普特南数学竞赛（Putnam 2024）中取得 118/120（近乎满分）的优异成绩。官方称，尽管尚有大量工作待推进，当前成果已表明：可自验证的数学推理是一条切实可行的研究路径，有望为构建更强大、更可靠的数学智能系统奠定基础。