阿里发布通义千问Qwen3-Max：万亿参数AI大模型登场

【太平洋科技快讯】9 月 24 日消息，阿里通义千问团队正式推出 Qwen3-Max 模型，这是该团队迄今为止规模最大、能力最强的 AI 大模型。该模型总参数超过 1T，预训练使用了高达 36T tokens 的数据。

Qwen3-Max 包含三个版本：Base、Instruct 和 Thinking 思。其中，Qwen3-Max-Instruct 正式版已经上线 Qwen Chat 并在阿里云百炼提供 API 服务。

根据官方公布的信息，Qwen3-Max-Instruct 的预览版在 LMArena 文本排行榜上稳居全球前三，超越了 GPT-5-Chat。正式版本在代码能力和智能体 ( agent ) 能力方面进一步提升，在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。

在专注于解决现实编程挑战的基准测试 SWE-Bench Verified 上，Qwen3-Max-Instruct 取得了高达 69.6 分的优秀成绩。在评估智能体工具调用能力的 Tau2-Bench 上，它以 74.8 分超越 Claude Opus 4 与 DeepSeek-V3.1。

Qwen3-Max-Thinking 作为推理增强版本，虽仍在训练中，但已展现出非凡潜力。该版本通过集成代码解释器并运用并行测试时计算技术，展现了前所未有的推理能力。在极具挑战性的数学推理基准测试中，如 AIME 25 和 HMMT，Qwen3-Max-Thinking 均取得了满分的优异成绩，这表明其在复杂逻辑推理方面具有突出能力。

Qwen3-Max 沿用了 Qwen3 系列的模型结构设计范式，使用了 global-batch load balancing loss。这一架构使训练过程稳定平滑，没有出现 loss 尖刺。在训练效率方面，PAI-FlashMoE 多级流水并行策略优化下 Qwen3-Max-Base 的模型 MFU 相比 Qwen2.5-Max-Base 相对提升 30%。同时，其支持 1M 长上下文训练，在长序列训练场景中表现出色。

目前，用户可以通过 Qwen Chat 官网直接与 Qwen3-Max-Instruct 模型对话，其 API 也已开放使用。这一万亿参数级大模型的正式发布，标志着中国在全球 AI 大模型竞争中的地位进一步提升，为各行各业提供更强大的 AI 能力支持。

宙世代

一起剪

相关标签