掌握定价权后，这家AI公司暴涨25%

" 干活的 Token，是简单问答的 10 倍，甚至 100 倍。"

在几天前中关村论坛的一场开源主题圆桌上，当杨植麟把 " 为什么涨价 " 的问题直接抛给智谱 CEO 张鹏时，收到了这样的回答。

张鹏选择用模型市场眼下正在发生的现实来回答，而这样的市场判断，在智谱刚披露的财报里，已经得到了验证。

智谱今日发布的财报披露，2025 年公司收入 7.243 亿元，同比增长 131.9%；毛利 2.967 亿元，综合毛利率 41%；研发投入 31.804 亿元。

只看上面这一组数字，已经呈现出了智谱的 2025：收入在快速放大，投入也在同步拉高，这家扎根五道口、由清华孵化的大模型公司正持续在基模研发领域投入，换取模型能力和市场位置。

但如果把财报中的收入结构拆开看，会发现智谱 " 激进 " 的技术投入，已经开始涌现回报。

云端 API 收入 1.904 亿元，同比增长 292.6%，收入占比相比 2024 年，从 15.5% 提升到 26.3%。

与此同时，智谱的业务已经覆盖 218 个国家和地区，连接超过 400 万开发者和企业，付费开发者规模达到 24.2 万。

翻译过来就是，API 调用正在变成可靠的收入来源，甚至有进一步扩大的趋势。

进入 2026 年，智谱对 GLM 系列服务连续提价：2 月上涨约 30%，取消首购优惠；到 3 月，整体 API 价格较去年底提升约 83%。

然而，价格上调之后，平台用户仍然继续增长，调用也没有出现明显回落。

财报发布后首日，市场迅速给出了积极反响，截至今天上午 10 点，智谱股价暴涨 25%、突破 870 港元，市值来到 4000 亿港元区间。

以智谱为代表的大模型公司正在掌握定价权，这是这份财报和近期动态中给出的答案。

Agent 驱动下的 MaaS：调用开始 " 爆炸 "

在上市前，相比起 MaaS，智谱的主要收入路径其实很清晰：本地化部署。做项目、交付模型，但这一类收入集中在项目周期内，增长的持续性相对不稳定。

智谱在 2025 年的收入结构里，这一模式仍然存在。本地部署收入 5.339 亿元，占比超过七成，但财报同时提到，本地化部署业务为满足客户需求投入更多交付资源，导致毛利率阶段性下降。

所以，撑起财报收入和毛利率的，其实是 GLM 系列大模型本身。

财报显示，智谱 2025 年 API 收入 1.904 亿元，MaaS 平台连接超过 400 万开发者，付费开发者规模 24.2 万。

调用量的激增，正在让 MaaS 服务的商业化落地愈发常态和持续。

国家数据局披露，截至 2026 年 3 月，中国日均 Token 调用量已经超过 140 万亿，相比 2024 年初增长超过 1000 倍，较 2025 年底的 100 万亿规模，在三个月内再次提升 40% 以上。

OpenRouter 的统计进一步说明这一结构的变化：在 3 月中旬的一周里，全球模型调用量达到 20.4 万亿 Token，中国模型占 7.359 万亿，环比增长 56.9%，并连续多周超过美国模型。

其中，GLM 系列模型和其他 4 家国产模型一同，在榜单前十名中占据了 5 席。

这组数据背后，是调用形态发生了变化。

在早期的 Chatbot 时代，调用的主要场景是问答，一问一答结束，Token 消耗与文本长度直接相关。现在的调用更多侧重于 Agent 形态下执行任务，一次请求往往包含多轮推理、工具调用和结果修正。

OpenClaw 这类 Agent 框架的爆发，把这种变化推到了极致。一个重度用户的日均 Token 消耗可以达到数千万甚至更高，而传统对话产品的月消耗通常只是百万级。

毫无疑问，这为包括 GLM 在内的头部基座模型提供了大量落地场景。

"GLM 模型的 Coding 能力在全行业范围内取得了广泛的认可。随着旗舰模型 GLM5 的发布，智谱再次率先完成了从 vibe coding 到 Agentic，也就是到智能体工程的跨度。" 电话会议上，智谱 CEO 张鹏这样介绍 GLM 模型迭代策略。

而根据财报披露，中国前十大互联网公司中已有 9 家接入 GLM 模型，集中在代码生成、自动化流程和 Agent 执行场景。

这些调用并非 " 样板工程 "，而是实打实在业务流程内部运行。一旦模型进入业务流程，API 调用这件事，就逐渐变成了一个系统行为。

" 面对 2 月以来供不应求的市场，我们将继续加大投入国产芯片软硬一体化的调优，将推理性能压榨到极限。" 电话会议上，智谱 CEO 张鹏这样总结道。他表示，" 这不是为了短期的盈利，而是为了支撑那条不断上扬的高质量 Token 消耗的指数型曲线。"

以 Coding 能力为基座，以 Agent 为落地场景，这就回答了为什么 API 收入能够 " 撑 " 起智谱这份财报。

从调用到价格：智谱为什么能涨价

事实上，从几年前百模大战开始，国产模型在行业中一直在比拼性价比。" 每百万 Token 多少钱 " 成为了各类模型分析中的关键指标，价格也成为了一种最直观的竞争手段。

但从去年底开始，这个逻辑出现了明显变化。

回到 OpenRouter 的榜单上，在全球调用量前十的模型中，中国模型已经占据半数以上，且主要由海外开发者驱动，这意味着以 GLM 为代表的国产模型不仅依靠中国市场，也在全球开发者生态中发挥重要作用。

同时，国产模型在多个榜单中占据主导位置。近日，全球权威 LLM Agent（大模型智能体）基准测试机构 ClawBench 更新了 2026 年 3 月评测数据，其中，智谱旗下 GLM-5-Turbo 模型以 93.9 的高分登顶全球榜首，成为当前全球智能体能力最强的大模型；同属智谱的 GLM-5 模型以 91.7 分位列榜单第 6 位。

技术驱动和 Agent 调用激增的双重背景下，大模型行业的供需关系开始发生变化。

智谱是行业中最先做出反应的 AI 公司之一。

公开信息显示，2026 年一季度，GLM Coding Plan 上涨约 30%，GLM-5-Turbo 再上涨约 20%，累计涨幅超过 80%。

值得关注的是，在价格上调之后，用户侧调用没有下降，反而进一步向 Coding 和 Agent 场景集中。

显然，当模型真正能提供生产力，API 产生的调用不是 " 可有可无 " 的需求，而是用户侧的刚需。而在 AI 生产力领域，Coding 扮演了一种基座级生产力的角色。

在几个月前的 AGI-NEXT 论坛上，智谱创始人唐杰曾表示："DeepSeek 之后，行业需要思考的是‘下一场战役’的核心方向。我们团队为此争论了无数个夜晚，最终，智谱决定将所有精力都投入到 Coding 领域。"

同样在那场论坛上，腾讯首席科学家姚顺雨也提到，在 Coding 场景，" 用户愿意为最好、也最贵的模型付费 "。

显然，智谱财报中的表现，正是上述路径的延续。

更直接的信号在用户侧的真实使用上。GLM-5 上线后，由于需求过高，出现阶段性限流。当供给成为约束，大模型公司也就有了掌握定价权的底气。

再看 GLM 系列的发展路径。

GLM 从 4.5 到 5，再到 5-Turbo 和 5.1，能力提升集中在长上下文、多步推理和工具调用。这些能力直接对应的是 Coding 和 Agent 场景，聚焦于最具价值的调用场景。

底层效率也在同步变化。智谱通过架构优化，将推理成本压缩到原来的 50%，同时保持性能。这让高频调用成为可能，也让高价值调用具备规模基础。

而在模型技术路线上，智谱 GLM 系列一直是 Coding 能力的领跑者之一。GLM5 系列在多项权威评测中取得全球开源第一、综合排名全球前三，并在 Code Arena 编程榜与 OpenAI、Anthropic 并列第一。

在算力侧，GLM 模型已经进入国产芯片的软硬协同阶段，通过系统级优化提升推理效率。这意味着供给端也在逐步适配调用增长。

调用结构、模型能力、算力供给，这三件事在同一时间发生变化。

在电话会议中，智谱 CEO 张鹏提出了 TAC（Token Architect Capability）框架，这个框架可以用一个公式来理解：AGI 商业价值 = 智能上界 × Token 消耗规模。

把这个公式套在财报里就会发现，当模型开始形成生产力，调用规模进而快速放大，收入自然随之增长。

显然，不是所有模型都有资格涨价，只有那些被放进生产流程、承担实际任务的模型，才有这个能力。

再回到智谱这份财报。

超过 30 亿的研发投入，显示出智谱还在持续加码模型能力和算力基础。尝到了靠 API 赚钱的甜头后，智谱没有因此停下强化技术路径的脚步。

在瞄准 AGI 的赛道上，智谱不是唯一的参与者，尽管它已经是少数跑通 MaaS 商业化流程的公司之一。

掌握定价权，并非是一个一劳永逸的节点，而会是一个动态竞争的过程。掌握了先手定价权的智谱，无疑想要把技术路线的红利，逐渐转化为 AGI 赛道上的长期竞争优势。

宙世代

一起剪