Token走向零毛利时代智谱路在何方?

21 世纪经济报道记者石恩泽

5 月 22 日晚间，DeepSeek 没有开发布会，没有通稿，只是静悄悄地在官方渠道更新了一则公告。

公告写得极其简短，核心只有一句话：全系 API 输入降价。尤其是旗舰模型 DeepSeek-V4 系列，限时叠加 1/4 优惠，相当于永久降价 75%。

若是将 DeepSeek-V4 Pro 的最新定价与 OpenAI 和 Claude 同档位模型做对比，这中间产生的 Token（词元）输出价差超 100 倍。可以说，DeepSeek 这一刀下去，砍出全球头部大模型报价历史最低点。

这不是在卷同行，而是在逼所有人回答一个问题：" 如果你的模型性价比拼不过 DeepSeek，你的市场定位是什么？" 一位国内头部云厂商 AI 产品负责人深夜在朋友圈里发出灵魂拷问。

而这颗石子激起的涟漪里，最耐人寻味的样本之一，是智谱——一个在 Token 走向零毛利时代的浪潮中，选择逆流而上的公司。

进入 6 月，全球多家大模型厂商紧跟 DeepSeek 步伐，开启调价潮。据公开消息，国内的小米 MiMo-V2.5 系列、字节跳动 Seedance 2.0 系列、腾讯云接入的 MiniMax-M3 都宣布降价；国外的 OpenAI 也于 6 月 11 日启动首轮大规模 API 降价。

对 DeepSeek 来说，低价是武器。但对绝大多数中国大模型创业公司来说，同样的低价，到底是 " 黎明前的黑暗 "，还是 " 注定填不满的无底洞 "？

以已上市的智谱（2513.HK）为观察样本，"Token 走向零毛利时代 " 这句话正在从预言变为现实。

2025 年，智谱全年营收达到 7.24 亿元，同比增长 131.9%；年内净亏损 47.18 亿元，同比扩大 59.5%。这样算下来，智谱 2025 年每赚 1 元收入，就要亏去 6.5 元。

其中，智谱 2025 年研发开支高达 31.8 亿元，约为其当年收入的 4.4 倍。这意味着智谱每赚 1 元，就要投入 4.4 元在研发上。这样的商业模式，可谓是越努力，越亏损。

而这还不是智谱 " 烧钱 " 的全部。据智谱 2025 年报，智谱单是经营本身就 " 吃掉 " 约 22.46 亿元现金，外加投资所用掉的现金 3.76 亿元，全年共流出 26.22 亿元现金。而其账面现金之所以没崩，是因为后续有融资活动补了进来。

2026 年 1 月，智谱成功登陆港股市场，融得 45.16 亿元，而这里面有 26.14 亿元作为融资净流入进入报表。

把流入和流出一算可以发现，智谱 2025 年经营活动本身并未产生现金积累。可以说，当下的智谱根本不是一个正常盈利公司，而是一个靠融资输血的研发型公司。

这也是为什么智谱在 2026 年 6 月公告，拟冲刺科创板 A 股上市，计划募资 150 亿元。这本质上还是在拉长 " 资本续命 " 的跑道。

当全球大模型厂商掀起 Token 降价潮，若是智谱也被裹挟着降价，那么其现金流状况危如累卵。

为此，近 2 年，智谱做了两件看似矛盾的事——先降价，再提价。

2025 年 4 月，智谱 BigModel 开放平台进行了一次大规模调价：GLM-4-Plus 降价 90%，从 50 元 / 百万 tokens 降至 5 元 / 百万 tokens；GLM-4-FlashX 定价 10 元 / 亿 tokens；GLM-Z1-Air 定价 50 元 / 亿 tokens。

彼时，字节豆包报价压到 0.0008 元 / 千 tokens，大家都在比谁更便宜，智谱也不例外。

2026 年成了分水岭。智谱是国产头部厂商中第一个实质性提价的，而且涨了好几轮。

2026 年 2 月，伴随 GLM-5 发布，智谱对 GLM Coding Plan 进行了结构性调价，涨幅 30% 起，并取消了首购优惠。

2026 年 3 月，智谱发布 GLM-5-Turbo，API 价格再上调 20%，相对上代 GLM-4.7 累计涨幅约 83%。

2026 年 4 月，智谱发布 GLM-5.1，API 价格再提 10%；4 月中旬，智谱 GLM Coding Plan 海外版全线涨价 80% 至 150%，Lite、Pro、Max 版本的套餐价格从原先的每月 10 美元、30 美元、80 美元，分别涨至 18 美元、72 美元、160 美元，这个价格已经几乎等同于 ChatGPT、Gemini、Claude 等国外模型的订阅费。

对于涨价策略，智谱 CEO 张鹏在业绩会上用一组数据打消市场疑虑：2026 年一季度智谱 API 涨价 83% 后，调用量不降反升，市场依然供不应求，调用量增长 400%。

张鹏表示，这印证了高质量 Token 是当下的稀缺资源。他还称，当模型足够强，API 本身就是最好的商业模式，定价权是由技术实力以及长期趋势所带来的领先地位决定的。

不同于智谱硬气提价，同样港股上市的 MiniMax（0100.HK）选择了降价，在旗舰模型 MiniMax-M3 上线一周后，宣布永久降价 50%。

针对两家的不同策略，摩根大通 6 月 12 日发布了研究报告，并对中国两家上市 AI 模型公司作出截然相反的评级判断——维持智谱 " 增持 "，将 MiniMax 下调至 " 中性 "。

摩根大通在报告中指出，在 AI 使用需求仍超过推理供给的阶段，没有任何开发者会在需求过剩时主动降价。如果一家模型公司在新模型上线后迅速从溢价回撤，实际上就是在用定价行为承认——市场不接受这个溢价。

值得注意的是，MiniMax 降价后已与 DeepSeek 系列处于同一价格区间，意味着其在定价上选择与 " 由 DeepSeek 设定价格的那一层 " 竞争。这将直接导致 MiniMax 丧失该价格区间的定价权。

反倒是智谱通过 GLM-5 和 5.1 持续刷新国内 SOTA（最优模型），并在提价后使用量继续增长。摩根大通认为，这意味着下游工作流对 GLM 系列的依赖度足以支撑涨价。而市场以实际行动拒绝了 MiniMax-M3 的溢价预期。

参照云厂商的发展路径，通用推理 Token 正在走 IaaS 化的老路：可标准化的部分必然商品化，利润率趋近零，而真正的钱在上面的 PaaS 和 SaaS 层。这就是所谓的 "K 型分化 "。

放到大模型行业里，通用推理 Token 加速商品化，沿着 IaaS 的老路滑向零毛利；活路只能往上走，要么做垂直场景 Agent 拿中等毛利，要么啃企业私有化部署的合规与替换成本，靠壁垒扛溢价。

而 DeepSeek 这次出手，恰恰是把这条 K 型曲线上的分岔口彻底焊死了。它用极致低价将所有试图停留在 " 通用 Token 批发商 " 位置的玩家，一把推进了零毛利的深渊。

回到 DeepSeek 那一刀砍下去的夜晚。它不只是砍出了历史最低价，更是把整个行业劈成了泾渭分明的两条路：一条是 "Token 批发商 " 的康庄大道，规模越大，离零毛利越近；另一条是企业级 AI 服务商的窄门，门槛越高，活得越久。

智谱选择了后者。它用 2025 年全年 7.24 亿元营收、47.18 亿元亏损、22.46 亿元经营现金流净流出的代价，换来了一组比财务报表更重要的数字：API 涨价 83% 后调用量反增 400%，GLM-5 系列在多个基准上刷新中国 SOTA，摩根大通给出 " 增持 " 评级。

这些数字告诉市场一件事：当你的模型足够强，客户愿意为你支付溢价，哪怕外面到处都是 " 地板价 "。

但这条路并不好走。智谱 2025 年每赚 1 块钱就要亏 6.5 元的结构性缺口，不会因为一两轮涨价就自动弥合。它需要在现金烧完之前，完成三重跨越：收入从 7 亿级跨向数十亿级，让固定成本被大规模摊薄；自研推理效率逼近 DeepSeek 的水平，把第三方算力依赖降下来；本地化部署从项目制转向订阅制，让现金流从脉冲式变成持续式。

这三件事，任何一件都不容易。但比起在零毛利的 Token 红海里和 DeepSeek 拼刺刀，这至少是一条有出口的路。

Token 走向零毛利时代，智谱路在何方？

答案或许就在张鹏那句表态里：" 当模型足够强，API 本身就是最好的商业模式。" 但这句话有一个前提，那就是你不仅要真的足够强，还要市场也这么认为。

更多内容请下载 21 财经 APP

宙世代

一起剪

相关标签