量子位 12小时前
智谱开源GLM-4.5工具调用超越Claude Opus 4.1,成本仅1.4%
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

在对手最擅长的地方打败对手,智谱做到了。

开源模型 GLM-4.5 在伯克利工具使用榜单上超越 Claude Opus 4.1,运行相同任务成本仅为 1.4%。

抢在 GPT-5 之前发布的融合大模型 GLM-4.5,以其在前端开发跨文件修改全栈项目构建等场景中的卓越表现受到不少关注。

现在,GLM-4.5 的编程能力也已经接近 Claude 4。

GLM-4.5 采用 MoE 架构,为评估 Agentic Coding 能力,团队构建了 CC-Bench 评测体系。

通过在覆盖六大开发领域、52 个实际编程任务中对比 GLM-4.5 与 Claude Sonnet 4、DeepSeek-V3.1、Kimi-K2 和 Qwen3-Coder-480B,可以看出 GLM-4.5 在与顶尖开源模型对比时表现强劲,尤其在任务完成效果和工具调用可靠性方面。

在与 Claude Sonnet 4 的直接竞争中可以发现,GLM-4.5 在编码性能方面接近行业标杆 Claude Sonnet 4。

并且,艾伦人工智能研究所研究科学家 Tim Dettmers 体验后表示:开源的 GLM-4.5 在推理速度上和闭源模型一样好,甚至比 Opus 4.1 快 3 倍、比 GPT-5 快 5 倍。

甚至有反馈称,在涵盖多语言、多种函数调用测试的大模型能力权威榜单伯克利工具调用排行榜中,GLM-4.5 已经超越 Claude 4、Grok-4 等。

再细看榜单还可以发现,GLM-4.5 花费的成本还是最低的。

说到花费,值得提一嘴的是,智谱还推出了高性价比的 Claude Code 套餐,价格仅为 Claude 的 1/7,适用于 GLM-4.5 以及 GLM-4.5-Air。

Claude Code 是 Anthropic 推出的开源工具,简单来说就是 Claude Code CLI 与各类 AI 模型供应商之间的智能中介,将不同模型接入 Claude Code 后,就可以根据任务需求选用不同成本的模型。

不止 Claude Code,团队称未来还将拓展到更多 Coding 工具。

目前,GLM-4.5 已接入包括 Claude Code、Cline、Gemini CLI、Grok CLI、CodeGeeX、Kilo Code、Roo Code、Trae 在内的多款主流编程工具,全面支持日常开发流程。

所以,被 Claude 价格门槛劝退的你,会不会尝试一下 GLM-4.5 呢?

参考链接:

[ 1 ] https://x.com/alxfazio/status/1962399641376354724

[ 2 ] https://x.com/Zai_org/status/1962522757536887205

[ 3 ] https://x.com/KhaledAlwaleed/status/1962545997373919740

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

专属 AI 产品从业者的实名社群,只聊 AI 产品最落地的真问题   扫码添加小助手,发送「姓名 + 公司 + 职位」申请入群~

进群后,你将直接获得:

  最新最专业的 AI 产品信息及分析  

   不定期发放的热门产品内测码

   内部专属内容与专业讨论

点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

艾伦 开源 编程 伯克利 效果
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论