快科技 2 月 11 日消息,今天可以说是国产 AI 大模型历史性的一天,DeepSeek、智谱及 Minimax 都发布了新一代大模型,其中智谱的 GLM-5 声势浩大,其编程能力已经成为世界一流水平。
从智谱官网介绍来看,GLM-5 重点就是提升编程与智能体能力,其参数量达到了 7440 亿,是上代 GLM-4.X 的 2 倍左右,因此性能提升很明显。
至于具体的编程能力,拿到了早期测试的海外 AI 博主 @AICodeKing 已经发布了测试结果,详细内容可以参考他的视频评测。
来看下结论,在代理编程上,GLM-5 搭配 Kilo CLI 得分 589,位列第一,比前不久发布的最强编程模型 Claude Opus 的 585 分还高一点。

非代理编程上,GLM-5 位列第三,仅次于 Opus 4.6 及 Gemini 3 Pro,但超越了 Opus 4.5,实力依然强悍。

具体该如何评价?AICodeKing 的结论如下:

除了在一些小技巧上表现不佳之外,GLM-5 总体上很出色,基准第三,代理编程上第一,比 Opus 4.6 还强,而且跟主流的 CLI 工具兼容性很好,能够用它构建复杂的应用程序。
预计其价格会高于 GLM-4,但跟竞争对手相比,依然是一个经济实惠的选择,实际上上面的表格中也提到了编程任务的花费,Opus 4.6 及 G3P 的成本分别达到了 6.39 及 0.85,但 GLM-5 只要 0.14 美元,差距是几倍到几十倍,性价比上 GLM-5 无疑是要远胜前面的两个的,这也是程序员需要考虑的。
当然,对国内的开发者来说 GLM-5 这种国产 AI 编程大模型更合适,御三家对国内开发者的客观及主观限制可以说人神共愤。



登录后才可以发布评论哦
打开小程序可以发布评论哦