直面派 3小时前
掌握定价权后,这家AI公司暴涨25%
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

" 干活的 Token,是简单问答的 10 倍,甚至 100 倍。"

在几天前中关村论坛的一场开源主题圆桌上,当杨植麟把 " 为什么涨价 " 的问题直接抛给智谱 CEO 张鹏时,收到了这样的回答。

张鹏选择用模型市场眼下正在发生的现实来回答,而这样的市场判断,在智谱刚披露的财报里,已经得到了验证。

智谱今日发布的财报披露,2025 年公司收入 7.243 亿元,同比增长 131.9%;毛利 2.967 亿元,综合毛利率 41%;研发投入 31.804 亿元。

只看上面这一组数字,已经呈现出了智谱的 2025:收入在快速放大,投入也在同步拉高,这家扎根五道口、由清华孵化的大模型公司正持续在基模研发领域投入,换取模型能力和市场位置。

但如果把财报中的收入结构拆开看,会发现智谱 " 激进 " 的技术投入,已经开始涌现回报。

云端 API 收入 1.904 亿元,同比增长 292.6%,收入占比相比 2024 年,从 15.5% 提升到 26.3%。

与此同时,智谱的业务已经覆盖 218 个国家和地区,连接超过 400 万开发者和企业,付费开发者规模达到 24.2 万。

翻译过来就是,API 调用正在变成可靠的收入来源,甚至有进一步扩大的趋势。

进入 2026 年,智谱对 GLM 系列服务连续提价:2 月上涨约 30%,取消首购优惠;到 3 月,整体 API 价格较去年底提升约 83%。

然而,价格上调之后,平台用户仍然继续增长,调用也没有出现明显回落。

财报发布后首日,市场迅速给出了积极反响,截至今天上午 10 点,智谱股价暴涨 25%、突破 870 港元,市值来到 4000 亿港元区间。

以智谱为代表的大模型公司正在掌握定价权,这是这份财报和近期动态中给出的答案。

01

Agent 驱动下的 MaaS:调用开始 " 爆炸 "

在上市前,相比起 MaaS,智谱的主要收入路径其实很清晰:本地化部署。做项目、交付模型,但这一类收入集中在项目周期内,增长的持续性相对不稳定。

智谱在 2025 年的收入结构里,这一模式仍然存在。本地部署收入 5.339 亿元,占比超过七成,但财报同时提到,本地化部署业务为满足客户需求投入更多交付资源,导致毛利率阶段性下降。

所以,撑起财报收入和毛利率的,其实是 GLM 系列大模型本身。

财报显示,智谱 2025 年 API 收入 1.904 亿元,MaaS 平台连接超过 400 万开发者,付费开发者规模 24.2 万。

调用量的激增,正在让 MaaS 服务的商业化落地愈发常态和持续。

国家数据局披露,截至 2026 年 3 月,中国日均 Token 调用量已经超过 140 万亿,相比 2024 年初增长超过 1000 倍,较 2025 年底的 100 万亿规模,在三个月内再次提升 40% 以上。

OpenRouter 的统计进一步说明这一结构的变化:在 3 月中旬的一周里,全球模型调用量达到 20.4 万亿 Token,中国模型占 7.359 万亿,环比增长 56.9%,并连续多周超过美国模型。

其中,GLM 系列模型和其他 4 家国产模型一同,在榜单前十名中占据了 5 席。

这组数据背后,是调用形态发生了变化。

在早期的 Chatbot 时代,调用的主要场景是问答,一问一答结束,Token 消耗与文本长度直接相关。现在的调用更多侧重于 Agent 形态下执行任务,一次请求往往包含多轮推理、工具调用和结果修正。

OpenClaw 这类 Agent 框架的爆发,把这种变化推到了极致。一个重度用户的日均 Token 消耗可以达到数千万甚至更高,而传统对话产品的月消耗通常只是百万级。

毫无疑问,这为包括 GLM 在内的头部基座模型提供了大量落地场景。

"GLM 模型的 Coding 能力在全行业范围内取得了广泛的认可。随着旗舰模型 GLM5 的发布,智谱再次率先完成了从 vibe coding 到 Agentic,也就是到智能体工程的跨度。" 电话会议上,智谱 CEO 张鹏这样介绍 GLM 模型迭代策略。

而根据财报披露,中国前十大互联网公司中已有 9 家接入 GLM 模型,集中在代码生成、自动化流程和 Agent 执行场景。

这些调用并非 " 样板工程 ",而是实打实在业务流程内部运行。一旦模型进入业务流程,API 调用这件事,就逐渐变成了一个系统行为。

" 面对 2 月以来供不应求的市场,我们将继续加大投入国产芯片软硬一体化的调优,将推理性能压榨到极限。" 电话会议上,智谱 CEO 张鹏这样总结道。他表示," 这不是为了短期的盈利,而是为了支撑那条不断上扬的高质量 Token 消耗的指数型曲线。"

以 Coding 能力为基座,以 Agent 为落地场景,这就回答了为什么 API 收入能够 " 撑 " 起智谱这份财报。

02

从调用到价格:智谱为什么能涨价

事实上,从几年前百模大战开始,国产模型在行业中一直在比拼性价比。" 每百万 Token 多少钱 " 成为了各类模型分析中的关键指标,价格也成为了一种最直观的竞争手段。

但从去年底开始,这个逻辑出现了明显变化。

回到 OpenRouter 的榜单上,在全球调用量前十的模型中,中国模型已经占据半数以上,且主要由海外开发者驱动,这意味着以 GLM 为代表的国产模型不仅依靠中国市场,也在全球开发者生态中发挥重要作用。

同时,国产模型在多个榜单中占据主导位置。近日,全球权威 LLM Agent(大模型智能体)基准测试机构 ClawBench 更新了 2026 年 3 月评测数据,其中,智谱旗下 GLM-5-Turbo 模型以 93.9 的高分登顶全球榜首,成为当前全球智能体能力最强的大模型;同属智谱的 GLM-5 模型以 91.7 分位列榜单第 6 位。

技术驱动和 Agent 调用激增的双重背景下,大模型行业的供需关系开始发生变化。

智谱是行业中最先做出反应的 AI 公司之一。

公开信息显示,2026 年一季度,GLM Coding Plan 上涨约 30%,GLM-5-Turbo 再上涨约 20%,累计涨幅超过 80%。

值得关注的是,在价格上调之后,用户侧调用没有下降,反而进一步向 Coding 和 Agent 场景集中。

显然,当模型真正能提供生产力,API 产生的调用不是 " 可有可无 " 的需求,而是用户侧的刚需。而在 AI 生产力领域,Coding 扮演了一种基座级生产力的角色。

在几个月前的 AGI-NEXT 论坛上,智谱创始人唐杰曾表示:"DeepSeek 之后,行业需要思考的是‘下一场战役’的核心方向。我们团队为此争论了无数个夜晚,最终,智谱决定将所有精力都投入到 Coding 领域。"

同样在那场论坛上,腾讯首席科学家姚顺雨也提到,在 Coding 场景," 用户愿意为最好、也最贵的模型付费 "。

显然,智谱财报中的表现,正是上述路径的延续。

更直接的信号在用户侧的真实使用上。GLM-5 上线后,由于需求过高,出现阶段性限流。当供给成为约束,大模型公司也就有了掌握定价权的底气。

再看 GLM 系列的发展路径。

GLM 从 4.5 到 5,再到 5-Turbo 和 5.1,能力提升集中在长上下文、多步推理和工具调用。这些能力直接对应的是 Coding 和 Agent 场景,聚焦于最具价值的调用场景。

底层效率也在同步变化。智谱通过架构优化,将推理成本压缩到原来的 50%,同时保持性能。这让高频调用成为可能,也让高价值调用具备规模基础。

而在模型技术路线上,智谱 GLM 系列一直是 Coding 能力的领跑者之一。GLM5 系列在多项权威评测中取得全球开源第一、综合排名全球前三,并在 Code Arena 编程榜与 OpenAI、Anthropic 并列第一。

在算力侧,GLM 模型已经进入国产芯片的软硬协同阶段,通过系统级优化提升推理效率。这意味着供给端也在逐步适配调用增长。

调用结构、模型能力、算力供给,这三件事在同一时间发生变化。

在电话会议中,智谱 CEO 张鹏提出了 TAC(Token Architect Capability)框架,这个框架可以用一个公式来理解:AGI 商业价值 = 智能上界 × Token 消耗规模。

把这个公式套在财报里就会发现,当模型开始形成生产力,调用规模进而快速放大,收入自然随之增长。

显然,不是所有模型都有资格涨价,只有那些被放进生产流程、承担实际任务的模型,才有这个能力。

再回到智谱这份财报。

超过 30 亿的研发投入,显示出智谱还在持续加码模型能力和算力基础。尝到了靠 API 赚钱的甜头后,智谱没有因此停下强化技术路径的脚步。

在瞄准 AGI 的赛道上,智谱不是唯一的参与者,尽管它已经是少数跑通 MaaS 商业化流程的公司之一。

掌握定价权,并非是一个一劳永逸的节点,而会是一个动态竞争的过程。掌握了先手定价权的智谱,无疑想要把技术路线的红利,逐渐转化为 AGI 赛道上的长期竞争优势。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论