手机中国 12小时前
阿里Qwen3.7-Max编程能力全球第四 国内唯一闯入前五
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

【CNMO 科技消息】5 月 27 日,CNMO 科技注意到,阿里旗下通义千问 Qwen3.7-Max 在最新一期 Code Arena 编程评测中取得 1541 分,排名全球第四,成为唯一跻身全球编程模型前五的中国厂商。排名前三的均为 Anthropic 的 Claude 系列模型,分别为 Claude Opus 4.6 Thinking、Claude Opus 4.6 和 Claude Opus 4.7。

千问

此前,海外开发者社区已对 Qwen3.7-Max 进行了多轮实测对比。在 Atomic Chat 组织的测试中,Qwen3.7-Max 与 Opus 4.7、GPT-5.5 同场竞技,任务是编写一个能自我训练的俄罗斯方块 AI。结果显示,Qwen3.7-Max 仅用 1.32 美元 token 成本就超越对手,性能提升 56%。在 3D 像素风微缩宝塔模型生成任务中,其输出速度和质量同样领先。开发者表示,Qwen3.7-Max 接入 Hermes Agent 和 OpenCode 后,基本可以替代 GPT-5.5 和 Opus 4.7。

在实际编程任务中,Qwen3.7-Max 的稳定性和细节表现较为突出。测试人员让其生成一款 3D 赛车游戏,Qwen3.7-Max 首轮即生成可玩 HTML 文件,仅存在小 bug,经简单对话调整后即可正常运行。相比之下,Gemini 3.5 Flash、Claude Opus 4.6、GPT-5.5 均需多轮修复才能跑通全部功能。Qwen3.7-Max 额外实现了开始界面和发动机音效等细节,而其他模型未提供。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

编程 阿里 发动机 ai 界面
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论