阿里Qwen3.7-Max编程能力全球第四国内唯一闯入前五

【CNMO 科技消息】5 月 27 日，CNMO 科技注意到，阿里旗下通义千问 Qwen3.7-Max 在最新一期 Code Arena 编程评测中取得 1541 分，排名全球第四，成为唯一跻身全球编程模型前五的中国厂商。排名前三的均为 Anthropic 的 Claude 系列模型，分别为 Claude Opus 4.6 Thinking、Claude Opus 4.6 和 Claude Opus 4.7。

千问

此前，海外开发者社区已对 Qwen3.7-Max 进行了多轮实测对比。在 Atomic Chat 组织的测试中，Qwen3.7-Max 与 Opus 4.7、GPT-5.5 同场竞技，任务是编写一个能自我训练的俄罗斯方块 AI。结果显示，Qwen3.7-Max 仅用 1.32 美元 token 成本就超越对手，性能提升 56%。在 3D 像素风微缩宝塔模型生成任务中，其输出速度和质量同样领先。开发者表示，Qwen3.7-Max 接入 Hermes Agent 和 OpenCode 后，基本可以替代 GPT-5.5 和 Opus 4.7。

在实际编程任务中，Qwen3.7-Max 的稳定性和细节表现较为突出。测试人员让其生成一款 3D 赛车游戏，Qwen3.7-Max 首轮即生成可玩 HTML 文件，仅存在小 bug，经简单对话调整后即可正常运行。相比之下，Gemini 3.5 Flash、Claude Opus 4.6、GPT-5.5 均需多轮修复才能跑通全部功能。Qwen3.7-Max 额外实现了开始界面和发动机音效等细节，而其他模型未提供。

宙世代

一起剪

相关标签