IT之家 12小时前
阿里Qwen3.7-Max模型AI编程能力超Claude Opus 4.6
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

IT 之家 5 月 26 日消息,全球权威三方编程榜单 Code Arena 昨日(5 月 25 日)更新榜单,阿里旗舰模型 Qwen3.7-Max 得分 1541 分,仅次于 Claude 系列,在大模型厂商中排名全球第二。

IT 之家查询公开资料,Code Arena 是目前全球人工智能领域含金量最高、最权威的编程大模型(LLM)能力评估榜单之一。

该榜单不测试学术化的选择题,而是评估模型在生成、调试、重构复杂代码时的实际编程能力,此外为防止刷榜(Anti-Gaming),采用用户随机盲测,模型无法提前获知考题,让模型必须具有真实的硬核代码生成能力。

根据最新榜单成绩,阿里旗舰模型 qwen3.7-max-20260517 得分 1541 分,在全球模型榜单中排名第四,仅次于 claude-opus-4-7-thinking、claude-opus-4-7 和 claude-opus-4-6-thinking。

阿里 Qwen3.7-Max 模型的编程能力已超过 claude-opus-4-6 模型,并超过了 glm-5.1、kimi-k2.6 模型。

IT 之家查询公开资料,在最新放出的 Design Arena 榜单中,阿里旗舰模型 Qwen3.7-Max 同样取得耀眼成绩,位列第十名。

Design Arena ( 以及其图像侧 Image Arena / LMArena ) 作为一个基于真实用户盲测的 AI 模型评测平台,在当前 AI 行业中具有极高的含金量。它被认为是全球公认度最高的 AI 模型评测平台之一,被称为 "AI 界的奥林匹克 "。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 编程 阿里 it之家 人工智能
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论