七连发！阿里多款重磅发布亮相云栖大会

【CNMO 科技消息】9 月 24 日，2025 云栖大会现场，阿里云 CTO 周靖人接连发布了七款大模型技术产品。七款技术产品覆盖语言、语音、视觉、多模态、代码等模型领域，在模型智能水平、Agent 工具调用以及 Coding 能力、深度推理、多模态等方面均实现突破。

在大语言模型中，阿里通义旗舰模型 Qwen3-Max 全新亮相，性能超过 GPT5、Claude Opus 4 等，跻身全球前三。Qwen3-Max 包括指令（Instruct）和推理（Thinking）两大版本，其预览版已在 Chatbot Arena 排行榜上位列第三，正式版性能可望再度实现突破。

Qwen3-Max 是通义千问家族中最大、最强的基础模型，预训练数据量达 36T，总参数超过万亿，拥有极强的 Coding 编程能力和 Agent 工具调用能力。在大模型用 Coding 解决真实世界问题的 SWE-Bench Verified 测试中，Instruct 版本斩获 69.6 分，位列全球第一梯队；在聚焦 Agent 工具调用能力的 Tau2-Bench 测试中，Qwen3-Max 取得突破性的 74.8 分，超过 Claude Opus4 和 DeepSeek-V3.1。Qwen3-Max 推理模型也展现出非凡性能，结合工具调用和并行推理技术，其推理能力创下新高，尤其在聚焦数学推理的 AIME 25 和 HMMT 测试中，均达到突破性的满分 100 分，为国内首次。

下一代基础模型架构 Qwen3-Next 及系列模型正式发布，模型总参数 80B 仅激活 3B ，性能即可媲美千问 3 旗舰版 235B 模型，实现模型计算效率的重大突破。Qwen3-Next 针对大模型在上下文长度和总参数两方面不断扩展（Scaling）的未来趋势而设计，创新改进采用了混合注意力机制、高稀疏度 MoE 结构、多 token 预测（MTP）机制等核心技术，模型训练成本较密集模型 Qwen3-32B 大降超 90%，长文本推理吞吐量提升 10 倍以上，为未来大模型的训练和推理的效率设立了全新标准。

在专项模型方面，千问编程模型 Qwen3-Coder 重磅升级。新的 Qwen3-Coder 与 Qwen Code、Claude Code 系统联合训练，应用效果显著提升，推理速度更快，代码安全性也显著提升。Qwen3-Coder 此前就广受开发者和企业好评，代码生成和补全能力极强，可一键完成完整项目的部署和问题修复，开源后调用量曾在知名 API 调用平台 OpenRouter 上激增 1474%，位列全球第二。

宙世代

一起剪