手机中国 前天
阿里巴巴宣布开源Qwen3-Coder-Next:部署门槛较低
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

【CNMO 科技消息】2 月 4 日,CNMO 注意到,阿里巴巴官方宣布,正式开源专为编程智能体打造的 Qwen3-Coder-Next 模型。

Qwen3-Coder-Next 采用极致高效的 MoE 架构,总参数达 80B,但每次推理仅激活 3B 参数,大幅降低了显存与算力需求。该模型专为智能体设计,聚焦于长时程、多工具、可交互的真实编程任务。

在训练过程中,Qwen3-Coder-Next 不依赖参数规模扩张,而是着重扩展智能体训练信号。通过大规模可验证编程任务与可执行环境训练,模型能够直接从环境反馈中学习,掌握长时程推理、熟练使用工具以及从执行错误中有效恢复等核心能力。训练过程涵盖持续预训练、监督微调、领域专家训练和专家知识蒸馏等多个环节,确保模型在多个领域具备精细化专家能力。

实测表现方面,Qwen3-Coder-Next 在多个主流编程智能体基准上展现出强劲竞争力。在 SWE-Bench Verified 上,使用 SWE-Agent 框架时,该模型达到 70% 以上的问题解决率,在多语言设置及更具挑战的 SWE-Bench-Pro 基准上依然保持竞争力。尽管激活参数规模较小,但该模型在多项智能体评测中仍能匹敌或超过若干更大的开源模型。

此外,Qwen3-Coder-Next 部署门槛低,实用体验佳。开发者可将其灵活集成至本地 IDE 插件、命令行智能体或企业内网环境等多种场景,实现自动修复与代码生成、自然语言操作终端等功能。目前,Qwen3-Coder-Next(Base)与 Qwen3-Coder-Next(Instruct)两个版本已正式开源,全面支持研究、评测及商业应用,开发者可通过 GitHub、魔搭、Hugging Face 获取模型,也可进入阿里云百炼进行 API 调用。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

开源 编程 阿里巴巴 阿里云
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论