阿里Qwen3.7-Max模型AI编程能力超Claude Opus 4.6

IT 之家 5 月 26 日消息，全球权威三方编程榜单 Code Arena 昨日（5 月 25 日）更新榜单，阿里旗舰模型 Qwen3.7-Max 得分 1541 分，仅次于 Claude 系列，在大模型厂商中排名全球第二。

IT 之家查询公开资料，Code Arena 是目前全球人工智能领域含金量最高、最权威的编程大模型（LLM）能力评估榜单之一。

该榜单不测试学术化的选择题，而是评估模型在生成、调试、重构复杂代码时的实际编程能力，此外为防止刷榜（Anti-Gaming），采用用户随机盲测，模型无法提前获知考题，让模型必须具有真实的硬核代码生成能力。

根据最新榜单成绩，阿里旗舰模型 qwen3.7-max-20260517 得分 1541 分，在全球模型榜单中排名第四，仅次于 claude-opus-4-7-thinking、claude-opus-4-7 和 claude-opus-4-6-thinking。

阿里 Qwen3.7-Max 模型的编程能力已超过 claude-opus-4-6 模型，并超过了 glm-5.1、kimi-k2.6 模型。

IT 之家查询公开资料，在最新放出的 Design Arena 榜单中，阿里旗舰模型 Qwen3.7-Max 同样取得耀眼成绩，位列第十名。

Design Arena ( 以及其图像侧 Image Arena / LMArena ) 作为一个基于真实用户盲测的 AI 模型评测平台，在当前 AI 行业中具有极高的含金量。它被认为是全球公认度最高的 AI 模型评测平台之一，被称为 "AI 界的奥林匹克 "。

宙世代