太平洋电脑网 09-24
阿里发布通义千问Qwen3-Max:万亿参数AI大模型登场
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

【太平洋科技快讯】9 月 24 日消息,阿里通义千问团队正式推出 Qwen3-Max 模型,这是该团队迄今为止规模最大、能力最强的 AI 大模型。该模型总参数超过 1T,预训练使用了高达 36T tokens 的数据。

Qwen3-Max 包含三个版本:Base、Instruct 和 Thinking 思。其中,Qwen3-Max-Instruct 正式版已经上线 Qwen Chat 并在阿里云百炼提供 API 服务。

根据官方公布的信息,Qwen3-Max-Instruct 的预览版在 LMArena 文本排行榜上稳居全球前三,超越了 GPT-5-Chat。正式版本在代码能力和智能体 ( agent ) 能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。

在专注于解决现实编程挑战的基准测试 SWE-Bench Verified 上,Qwen3-Max-Instruct 取得了高达 69.6 分的优秀成绩。在评估智能体工具调用能力的 Tau2-Bench 上,它以 74.8 分超越 Claude Opus 4 与 DeepSeek-V3.1。

Qwen3-Max-Thinking 作为推理增强版本,虽仍在训练中,但已展现出非凡潜力。该版本通过集成代码解释器并运用并行测试时计算技术,展现了前所未有的推理能力。在极具挑战性的数学推理基准测试中,如 AIME 25 和 HMMT,Qwen3-Max-Thinking 均取得了满分的优异成绩,这表明其在复杂逻辑推理方面具有突出能力。

Qwen3-Max 沿用了 Qwen3 系列的模型结构设计范式,使用了 global-batch load balancing loss。这一架构使训练过程稳定平滑,没有出现 loss 尖刺。在训练效率方面,PAI-FlashMoE 多级流水并行策略优化下 Qwen3-Max-Base 的模型 MFU 相比 Qwen2.5-Max-Base 相对提升 30%。同时,其支持 1M 长上下文训练,在长序列训练场景中表现出色。

目前,用户可以通过 Qwen Chat 官网直接与 Qwen3-Max-Instruct 模型对话,其 API 也已开放使用。这一万亿参数级大模型的正式发布,标志着中国在全球 AI 大模型竞争中的地位进一步提升,为各行各业提供更强大的 AI 能力支持。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 通义千问 阿里 编程 阿里云
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论