GLM-5编程能力实测：新的全球第一能超越Opus 4.6

快科技 2 月 11 日消息，今天可以说是国产 AI 大模型历史性的一天，DeepSeek、智谱及 Minimax 都发布了新一代大模型，其中智谱的 GLM-5 声势浩大，其编程能力已经成为世界一流水平。

从智谱官网介绍来看，GLM-5 重点就是提升编程与智能体能力，其参数量达到了 7440 亿，是上代 GLM-4.X 的 2 倍左右，因此性能提升很明显。

至于具体的编程能力，拿到了早期测试的海外 AI 博主 @AICodeKing 已经发布了测试结果，详细内容可以参考他的视频评测。

来看下结论，在代理编程上，GLM-5 搭配 Kilo CLI 得分 589，位列第一，比前不久发布的最强编程模型 Claude Opus 的 585 分还高一点。

非代理编程上，GLM-5 位列第三，仅次于 Opus 4.6 及 Gemini 3 Pro，但超越了 Opus 4.5，实力依然强悍。

具体该如何评价？AICodeKing 的结论如下：

除了在一些小技巧上表现不佳之外，GLM-5 总体上很出色，基准第三，代理编程上第一，比 Opus 4.6 还强，而且跟主流的 CLI 工具兼容性很好，能够用它构建复杂的应用程序。

预计其价格会高于 GLM-4，但跟竞争对手相比，依然是一个经济实惠的选择，实际上上面的表格中也提到了编程任务的花费，Opus 4.6 及 G3P 的成本分别达到了 6.39 及 0.85，但 GLM-5 只要 0.14 美元，差距是几倍到几十倍，性价比上 GLM-5 无疑是要远胜前面的两个的，这也是程序员需要考虑的。

当然，对国内的开发者来说 GLM-5 这种国产 AI 编程大模型更合适，御三家对国内开发者的客观及主观限制可以说人神共愤。

宙世代

一起剪

相关标签