在对手最擅长的地方打败对手,智谱做到了。
开源模型 GLM-4.5 在伯克利工具使用榜单上超越 Claude Opus 4.1,运行相同任务成本仅为 1.4%。
抢在 GPT-5 之前发布的融合大模型 GLM-4.5,以其在前端开发、跨文件修改、全栈项目构建等场景中的卓越表现受到不少关注。
现在,GLM-4.5 的编程能力也已经接近 Claude 4。
GLM-4.5 采用 MoE 架构,为评估 Agentic Coding 能力,团队构建了 CC-Bench 评测体系。
通过在覆盖六大开发领域、52 个实际编程任务中对比 GLM-4.5 与 Claude Sonnet 4、DeepSeek-V3.1、Kimi-K2 和 Qwen3-Coder-480B,可以看出 GLM-4.5 在与顶尖开源模型对比时表现强劲,尤其在任务完成效果和工具调用可靠性方面。
在与 Claude Sonnet 4 的直接竞争中可以发现,GLM-4.5 在编码性能方面接近行业标杆 Claude Sonnet 4。
并且,艾伦人工智能研究所研究科学家 Tim Dettmers 体验后表示:开源的 GLM-4.5 在推理速度上和闭源模型一样好,甚至比 Opus 4.1 快 3 倍、比 GPT-5 快 5 倍。
甚至有反馈称,在涵盖多语言、多种函数调用测试的大模型能力权威榜单伯克利工具调用排行榜中,GLM-4.5 已经超越 Claude 4、Grok-4 等。
再细看榜单还可以发现,GLM-4.5 花费的成本还是最低的。
说到花费,值得提一嘴的是,智谱还推出了高性价比的 Claude Code 套餐,价格仅为 Claude 的 1/7,适用于 GLM-4.5 以及 GLM-4.5-Air。
Claude Code 是 Anthropic 推出的开源工具,简单来说就是 Claude Code CLI 与各类 AI 模型供应商之间的智能中介,将不同模型接入 Claude Code 后,就可以根据任务需求选用不同成本的模型。
不止 Claude Code,团队称未来还将拓展到更多 Coding 工具。
目前,GLM-4.5 已接入包括 Claude Code、Cline、Gemini CLI、Grok CLI、CodeGeeX、Kilo Code、Roo Code、Trae 在内的多款主流编程工具,全面支持日常开发流程。
所以,被 Claude 价格门槛劝退的你,会不会尝试一下 GLM-4.5 呢?
参考链接:
[ 1 ] https://x.com/alxfazio/status/1962399641376354724
[ 2 ] https://x.com/Zai_org/status/1962522757536887205
[ 3 ] https://x.com/KhaledAlwaleed/status/1962545997373919740
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
专属 AI 产品从业者的实名社群,只聊 AI 产品最落地的真问题 扫码添加小助手,发送「姓名 + 公司 + 职位」申请入群~
进群后,你将直接获得:
最新最专业的 AI 产品信息及分析
不定期发放的热门产品内测码
内部专属内容与专业讨论
点亮星标
科技前沿进展每日见
登录后才可以发布评论哦
打开小程序可以发布评论哦