驱动之家 02-11
GLM-5编程能力实测:新的全球第一 能超越Opus 4.6
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 2 月 11 日消息,今天可以说是国产 AI 大模型历史性的一天,DeepSeek、智谱及 Minimax 都发布了新一代大模型,其中智谱的 GLM-5 声势浩大,其编程能力已经成为世界一流水平。

从智谱官网介绍来看,GLM-5 重点就是提升编程与智能体能力,其参数量达到了 7440 亿,是上代 GLM-4.X 的 2 倍左右,因此性能提升很明显。

至于具体的编程能力,拿到了早期测试的海外 AI 博主 @AICodeKing 已经发布了测试结果,详细内容可以参考他的视频评测。

来看下结论,在代理编程上,GLM-5 搭配 Kilo CLI 得分 589,位列第一,比前不久发布的最强编程模型 Claude Opus 的 585 分还高一点。

非代理编程上,GLM-5 位列第三,仅次于 Opus 4.6 及 Gemini 3 Pro,但超越了 Opus 4.5,实力依然强悍。

具体该如何评价?AICodeKing 的结论如下:

除了在一些小技巧上表现不佳之外,GLM-5 总体上很出色,基准第三,代理编程上第一,比 Opus 4.6 还强,而且跟主流的 CLI 工具兼容性很好,能够用它构建复杂的应用程序。

预计其价格会高于 GLM-4,但跟竞争对手相比,依然是一个经济实惠的选择,实际上上面的表格中也提到了编程任务的花费,Opus 4.6 及 G3P 的成本分别达到了 6.39 及 0.85,但 GLM-5 只要 0.14 美元,差距是几倍到几十倍,性价比上 GLM-5 无疑是要远胜前面的两个的,这也是程序员需要考虑的。

当然,对国内的开发者来说 GLM-5 这种国产 AI 编程大模型更合适,御三家对国内开发者的客观及主观限制可以说人神共愤。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 编程 程序员
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论