钛媒体 App 11 月 4 日消息,11 月 3 日晚,阿里云通义千问宣布推出 Qwen3-Max-Thinking 的早期预览版。据介绍,Qwen3-Max 推理模型仍在持续训练中,即便是当前的 Checkpoint,当借助工具调用和规模化的测试时计算时,模型可在 AIME25 和 HMMT25 等具有挑战性的数学推理基准测试中达到 100% 的准确率。(广角观察)

钛媒体 App 11 月 4 日消息,11 月 3 日晚,阿里云通义千问宣布推出 Qwen3-Max-Thinking 的早期预览版。据介绍,Qwen3-Max 推理模型仍在持续训练中,即便是当前的 Checkpoint,当借助工具调用和规模化的测试时计算时,模型可在 AIME25 和 HMMT25 等具有挑战性的数学推理基准测试中达到 100% 的准确率。(广角观察)
登录后才可以发布评论哦
打开小程序可以发布评论哦