【太平洋科技快讯】9 月 24 日消息,阿里通义千问团队正式推出 Qwen3-Max 模型,这是该团队迄今为止规模最大、能力最强的 AI 大模型。该模型总参数超过 1T,预训练使用了高达 36T tokens 的数据。
Qwen3-Max 包含三个版本:Base、Instruct 和 Thinking 思。其中,Qwen3-Max-Instruct 正式版已经上线 Qwen Chat 并在阿里云百炼提供 API 服务。
根据官方公布的信息,Qwen3-Max-Instruct 的预览版在 LMArena 文本排行榜上稳居全球前三,超越了 GPT-5-Chat。正式版本在代码能力和智能体 ( agent ) 能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。
在专注于解决现实编程挑战的基准测试 SWE-Bench Verified 上,Qwen3-Max-Instruct 取得了高达 69.6 分的优秀成绩。在评估智能体工具调用能力的 Tau2-Bench 上,它以 74.8 分超越 Claude Opus 4 与 DeepSeek-V3.1。
Qwen3-Max-Thinking 作为推理增强版本,虽仍在训练中,但已展现出非凡潜力。该版本通过集成代码解释器并运用并行测试时计算技术,展现了前所未有的推理能力。在极具挑战性的数学推理基准测试中,如 AIME 25 和 HMMT,Qwen3-Max-Thinking 均取得了满分的优异成绩,这表明其在复杂逻辑推理方面具有突出能力。
Qwen3-Max 沿用了 Qwen3 系列的模型结构设计范式,使用了 global-batch load balancing loss。这一架构使训练过程稳定平滑,没有出现 loss 尖刺。在训练效率方面,PAI-FlashMoE 多级流水并行策略优化下 Qwen3-Max-Base 的模型 MFU 相比 Qwen2.5-Max-Base 相对提升 30%。同时,其支持 1M 长上下文训练,在长序列训练场景中表现出色。
目前,用户可以通过 Qwen Chat 官网直接与 Qwen3-Max-Instruct 模型对话,其 API 也已开放使用。这一万亿参数级大模型的正式发布,标志着中国在全球 AI 大模型竞争中的地位进一步提升,为各行各业提供更强大的 AI 能力支持。
登录后才可以发布评论哦
打开小程序可以发布评论哦