时代财经 02-13
涨价30%起!智谱上线GLM-5引爆市场,市值一日厚增400亿港元,DeepSeek、MiniMax也扎堆“上新”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

本文来源:时代财经 作者:庞宇

图片来源:图虫

继字节跳动视频生成模型 Seedance2.0 火爆出圈后,国产大模型在春节前迎来一波罕见的 " 集体突袭 "。

2 月 12 日,智谱 AI 正式上线并开源其新一代旗舰模型 GLM-5。智谱官方确认,这个新模型正是此前在全球模型服务平台 OpenRouter 登顶热度榜首、引发圈内疯狂猜测的神秘模型 "Pony Alpha"。

作为 " 大模型第一股 ",智谱(02513.HK)这一动作迅速引爆了资本市场,2 月 12 日收盘,智谱股价大涨 28.68%,创下历史新高,总市值达到 1792 亿港元,市值较前一日厚增 400 亿港元。

同日,MiniMax 正式上线最新旗舰编程模型 MiniMax M2.5;豆包宣布将 Seedance 2.0 接入豆包 App、电脑端和网页版。在此之前,DeepSeek 亦完成了一次版本更新。

一场围绕国产大模型的 " 春节冲刺赛 " 悄然打响。

扎堆上新

作为本轮更新中最受关注的产品之一,智谱将 GLM-5 定义为 "Agentic Engineering 时代最好的模型 ",其亮点指向复杂系统工程与长程 Agent 任务。

官方资料显示,GLM-5 的更新围绕编程能力与 Agent(智能体)能力展开系统性强化。在参数规模上,将预训练数据从 23T 提升至 28.5T;在工程架构上,构建全新的 "Slime" 框架,支持更大模型规模及更复杂的强化学习任务。

同时,智谱在 GLM-5 中提出异步智能体强化学习算法,使模型能够持续从长程交互中学习;首次集成 DeepSeek Sparse Attention(稀疏注意力机制),在维持长文本效果无损的同时,大幅降低模型部署成本。

智谱在官网中写道,GLM-5 是大模型技术演进的重要里程碑,标志着行业正从 "Vibe Coding(氛围编程)" 向 "Agentic Engineering(智能体工程)" 发生转变。

从第三方评测与官方披露的数据来看,GLM-5 的 Coding 能力已进入国际主流模型的对标区间。

GLM-5 在权威的 Artificial Analysis 榜单中位居全球第四、开源第一;在业内公认的主流基准测试中取得开源模型 SOTA 分数;在 SWE-bench-Verified 和 Terminal Bench 2.0 中分别获得 77.8 和 56.2 的开源模型 SOTA 分数,性能超过 Gemini 3 Pro。

在实际使用层面,部分开发者反馈其在复杂 Coding 与 Agent 场景下的体验已逼近 Claude Opus 4.5,尤其在多步推理、系统级任务拆解和长程执行能力方面表现突出。

回看发布前一周,智谱在 OpenRouter 上以 "Pony Alpha" 之名悄然上线,24 小时内便登顶热度榜首,吸引了大量开发者的关注和测试。彼时,OpenRouter 官方推文将 Pony Alpha 描述为 " 前沿基础模型 ",并特别指出其在编程、智能体工作流、推理及角色扮演方面表现强劲,尤其强调其 " 极高的工具调用准确率 "。

除了智谱外,还有多家模型厂商也在春节前 " 抢跑 ",分别在编程智能体、长文本处理以及多模态生成等细分赛道上精准发力。

在编程赛道,MiniMax 展现出了强劲的对标实力。2 月 12 日,MiniMax 正式上线最新旗舰编程模型 MiniMax M2.5。与 GLM-5 类似,其对外介绍该模型定位为 " 为 Agent 场景原生设计的生产级模型 ",在编程与智能体性能上直接对标 Claude Opus 4.6。不同的是,该模型走出了一条 " 小而美 " 的效率路线—— M2.5 激活参数量仅 10B,却支持 100 TPS 的高吞吐量,在推理能效上优势明显。

在深度推理方面,DeepSeek 继续加强其长文本能力。2 月 11 日晚,多名用户反馈,DeepSeek 网页端与移动应用同步进行了版本更新,其上下文窗口从原本的 128K(去年 8 月发布的 DeepSeekV3.1)涨至 1M(百万)Token,知识库则更新至 2025 年 5 月。经用户测试,DeepSeek 已能一次性 " 吞下 " 整本长篇小说(如超过 24 万 Token 的《简爱》),长文本处理能力大幅提升。

而在互联网大厂更为擅长的多模态(图像与视频)战场,视觉生成的竞争也进入了白热化阶段。

在图像生成方面,2 月 10 日,阿里云发布了新一代图像生成基础模型 Qwen-Image-2.0,采用 MMDiT 多模态扩散架构,把生图和编辑能力合二为一,能解析比较长的中文指令(支持最多 1000 个字符),且在中文汉字渲染方面表现突出;同一天,字节跳动旗下剪映、字节 AI 创作平台小云雀等平台上线图像生成模型 Seedream5.0 Preview,增强了对提示词的理解能力,支持检索生图、多步逻辑推理和联网知识整合。

在视频生成方面,字节跳动攻势更猛,2 月 12 日,豆包正式宣布将此前火爆全网的视频生成模型 Seedance 2.0 接入豆包 App、电脑端和网页版,完成了在 C 端应用的全线铺开。在即梦 Seedance2.0 内测阶段,该模型一经推出便引发巨大讨论,更是被游戏科学 CEO、《黑神话:悟空》制作人冯骥称作 " 当前地表最强的视频生成模型 "。

大模型进化

进入 2026 年,学界与业界正逐渐形成一种共识:大模型从写代码、写前端,进化到写工程、完成大任务。

这一趋势并非仅存在于国内。日前,Anthropic 发布的《2026 Agentic Coding 趋势报告》指出,2025 年 AI 编程能力从实验性工具演向生产力系统演进,开始向用户交付真实可用功能,且早期采用者与后来者之间的能力差距正在加速拉大。

当前硅谷大模型风向已全面转向 Agentic Coding,GPT-5.3-Codex、Claude Opus 4.6 等,均聚焦长时程、高复杂度工程任务,如编译内核、重构代码库、批量解决 GitHub issue。

在实际体验中,GLM-5 的 Agentic 能力提升也被多位测评者明显感知。

资深 AI 测评者冷逸向时代财经表示:"GLM-4 系列在 Agentic 方面一直有短板,在长任务处理、工具调用上的效果比较一般,更擅长前端,但很难支撑复杂的开发项目。" 他指出," 这一次 GLM-5 主要提升就在 Agentic 方向,进步非常明显,已经能够处理更复杂的长任务和工程级项目,尤其长程任务的 Coding 能力,已经对齐 Claude Opus 4.5。"

在冷逸看来,在业内,Claude Opus 版本一直是编程模型的天花板,而这是国内首次有模型能追上。不过,他也指出,GLM-5 在基础的百科知识、推理、写作和视觉理解方面离 Gemini 3 Pro 还有差距,需要在底层模型的训练上下功夫。" 美国‘御三家’大模型(GPT、Claude、Gemini)都在朝着 Agentic Engineering 转变和突破,这意味着现在的模型更实用,更走进生成级场景了。GLM-5,算是我们国内第一个迈入全球顶尖梯队的模型。"

值得一提的是,就在 GLM-5 发布当日,智谱还同步发布 GLM Coding Plan 价格调整函,取消首购优惠,套餐价格整体涨幅自 30% 起。在行业看来,这一动作也释放出模型进入规模化商用阶段的信号。据了解,目前 GLM-5 已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等国产算力平台的深度推理适配。

长江证券研报指出,本次模型 API 及订阅价格大涨,说明模型进入需求时代。国内模型之前 API 价格大幅低于海外,伴随模型逐步追赶好用性实用性提升正式进入需求驱动时代。国内模型厂商 MaaS 业务有望迎来大爆发,毛利率有望快速提升。同时模型的变化有望驱动云基础资源及国产算力。

在 GLM-5 带动下,2 月 12 日,智谱 AI 概念股强势上扬,截至当日收盘,首都在线(300846.SZ)、优刻得(688158.SH)20cm 涨停,并行科技(920493.BJ)涨超 14%,电广传媒(000917.SZ)、蓝色光标(300058.SZ)涨逾 9%,凌云光(688400.SH)等涨超 5%。

随着模型持续迭代、应用逐步落地,这场 " 春节冲刺 " 或许只是国产大模型新一轮竞赛的序章,而真正的分水岭,才刚刚开始显现。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

突袭 开源 编程 字节跳动 春节
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论