IT之家 23小时前
DeepSeek推出DeepSeekMath‑V2模型,主打自验证数学推理能力
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

IT 之家 11 月 27 日消息,DeepSeek 发布了 DeepSeekMath ‑ V2,主打可自我验证的数学推理训练框架。

团队认为,仅追求最终答案正确率难以保证推理链条的严谨性,尤其在定理证明等需要逐步推导的任务中更为突出。模型通过构建基于 LLM 的验证器,对生成的证明进行自动审查,并利用扩展的验证计算持续生成高难度训练样本提升验证器能力。

据 IT 之家了解,DeepSeekMath ‑ V2 基于 DeepSeek ‑ V3.2 ‑ Exp ‑ Base,在 2025 年国际数学奥林匹克竞赛(IMO 2025)与 2024 年中国数学奥林匹克竞赛(CMO 2024)中均达到金牌水准,并在 2024 年普特南数学竞赛(Putnam 2024)中取得 118/120(近乎满分)的优异成绩。官方称,尽管尚有大量工作待推进,当前成果已表明:可自验证的数学推理是一条切实可行的研究路径,有望为构建更强大、更可靠的数学智能系统奠定基础。

Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-Math-V2

Github:https://github.com/deepseek-ai/DeepSeek-Math-V2

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

数学 竞赛 it之家
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论