
模型能力是决定长期竞争力的根本要素。
本文为 IPO 早知道原创
作者|Stone Jin
微信公众号|ipozaozhidao
据 IPO 早知道消息," 全球大模型第一股 " 智谱(2513.HK)今日开盘上涨超 25% 再创历史新高,市值突破 1700 亿港元。
当然,这主要源于智谱今天上线并开源了被誉为 "Agentic Engineering 时代最好开源模型 " 的 GLM-5 ——不可否认的是,学界与业界正逐渐形成一种共识,大模型从写代码、写前端,进化到写工程、完成大任务,即从 "Vibe Coding" 变革为 "Agentic Engineering"。
GLM-5 正是这一变革的产物:在 Coding 与 Agent 能力上,GLM-5 取得开源 SOTA 表现,在编程能力上实现了对齐 Claude Opus 4.5,在业内公认的主流基准测试中取得开源模型 SOTA。在 SWE-bench-Verified 和 Terminal Bench 2.0 中分别获得 77.8 和 56.2 的开源模型最高分数,性能超过 Gemini 3 Pro。
正是这一能力水准,使 GLM-5 在未公开开发者身份的前提下迅速引发全球开发者的关注,在匿名测试期间连续多日占据 OpenRouter 平台热门模型,并被用户评价为 " 最强匿名模型 " 之一。
这里需要指出的一点是,长期以来,闭源模型凭借在复杂工程任务中的稳定交付能力构筑了竞争壁垒,开源模型则多定位于低成本平替。而 GLM-5 的发布,意味着开源阵营首次在 " 工程可交付性 " 上实现对顶尖闭源模型的追赶,为全球开发者提供了首个具备系统工程能力的开源基础模型,改变行业格局。
另外需要注意的是,GLM 系列模型一直受到全球开发者喜爱,故在 GLM Coding Plan 全球爆量后,智谱不得不启动限售活动。而本次 GLM-5 的上线依托众多国产芯片有力保障了线上服务的稳定和高效。

目前, GLM-5 已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等国产算力平台的深度推理适配。通过底层算子优化与硬件加速,GLM-5 在国产芯片集群上已经实现高吞吐、低延迟的稳定运行。
模型能力是决定长期竞争力的根本要素
智谱是具备显著潜能的技术能力驱动型平台
本周摩根大通发布的研报指出,中国 AI 市场正从 " 百模大战 " 过渡至结构性整合阶段,能否生存取决于商业化落地能力与可持续的模型迭代。在此阶段,摩根大通认为模型能力是决定长期竞争力的根本要素。
此外,摩根大通还强调,AI 模型开发商的长期经济效益,主要取决于其能否在多轮技术周期中保持模型能力处于全球领先位置,而商业模式形态、部署方式及短期利润率结构,很大程度上是该能力衍生出的下游表现。" 智谱已展现出坚实的技术实力,只要能将其自研模型的性能保持在全球顶尖梯队,那么对 AI 能力需求的巨大规模,叠加中国独特的工程成本优势,将支撑公司营收走出强劲增长轨迹。"
而从 GLM 系列模型的持续发布,以及智谱的战略明显向智能体系统、工具增强推理与面向开发者的基础设施倾斜,均在一定程度上表明智谱的技术路线图正与全球前沿技术能力维度对齐。
基于这一逻辑,摩根大通将智谱定义为一个具备显著增长潜能的技术能力驱动型平台。从商业化路径来看,智谱可规模化扩张的云 API 业务以及正在加速推进的全球开发者生态落地,都已成为其增长的重要驱动力。
摩根大通预计,得益于通过全球开发者生态落地快速推进 API 业务的规模化扩张, 2025-2030 年智谱营收年复合增长率为 127%,并将于 2029 年实现盈利,目标价较当前股价仍有较大涨幅空间,是把握全球 AI 下一轮价值创造浪潮的首选标的。
性能直接对标 Claude Opus 4.5
要做真正的 Agentic Ready 基座模型
回到智谱本次发布的新模型本身。
GLM-5 在编程能力上实现了对齐 Claude Opus 4.5,在业内公认的主流基准测试中取得开源模型 SOTA。在 SWE-bench-Verified 和 Terminal Bench 2.0 中分别获得 77.8 和 56.2 的开源模型最高分数,性能超过 Gemini 3 Pro。

事实上,2026 年大模型将会从 " 会写 " 走到 " 会做事 ",尤其是端到端完成大型任务。GLM-5 是一个 " 系统架构师 ",它不仅为开发精美的 Demo 而生,更为稳定交付生产结果而生。
在内部 Claude Code 评估集合中,GLM-5 在前端、后端、长程任务等编程开发任务上显著超越上一代的 GLM-4.7(平均增幅超过 20%),能够以极少的人工干预自主完成 Agentic 长程规划与执行、后端重构和深度调试等系统工程任务,使用体感逼近 Opus 4.5。

此外,GLM-5 在 Agent 能力上同样实现开源 SOTA,在多个评测基准中取得开源第一。在 BrowseComp(联网检索与信息理解)、MCP-Atlas(大规模端到端工具调用)和 τ² -Bench(复杂场景下自动代理的工具规划和执行)均取得最高表现。

在衡量模型经营能力的 Vending Bench 2 中,GLM-5 获得开源模型第一表现。Vending Bench 2 要求模型在一年期内经营一个模拟的自动售货机业务,GLM-5 最终账户余额达到 4432 美元,经营表现接近 Claude Opus 4.5,展现出出色的长期规划和资源管理能力。

整体而言,这些能力是 Agentic Engineering 的核心:模型不仅要能写代码、完成工程,还要能在长程任务中保持目标一致性、进行资源管理、处理多步骤依赖关系,成为真正的 Agentic Ready 基座模型。
本文由公众号 IPO 早知道(ID:ipozaozhidao)原创撰写,如需转载请联系 C 叔↓↓↓





登录后才可以发布评论哦
打开小程序可以发布评论哦