钛媒体 App 11 月 27 日消息,DeepSeek 推出新型数学推理模型 DeepSeekMath-V2,采用可自我验证的训练框架。该模型基于 DeepSeek-V3.2-Exp-Base 构建,通过 LLM 验证器自动审查生成的数学证明,并利用高难度样本持续优化性能。在 IMO 2025 和 CMO 2024 中均达到金牌水平,Putnam 2024 获 118/120 分。团队表示,该成果验证了自验证推理路径的可行性,为构建可靠数学智能系统提供新方向。模型代码与权重已开源,发布于 Hugging Face 及 GitHub 平台。(广角观察)


登录后才可以发布评论哦
打开小程序可以发布评论哦