21 世纪经济报道记者 石恩泽
5 月 22 日晚间,DeepSeek 没有开发布会,没有通稿,只是静悄悄地在官方渠道更新了一则公告。
公告写得极其简短,核心只有一句话:全系 API 输入降价。尤其是旗舰模型 DeepSeek-V4 系列,限时叠加 1/4 优惠,相当于永久降价 75%。
若是将 DeepSeek-V4 Pro 的最新定价与 OpenAI 和 Claude 同档位模型做对比,这中间产生的 Token(词元)输出价差超 100 倍。可以说,DeepSeek 这一刀下去,砍出全球头部大模型报价历史最低点。
这不是在卷同行,而是在逼所有人回答一个问题:" 如果你的模型性价比拼不过 DeepSeek,你的市场定位是什么?" 一位国内头部云厂商 AI 产品负责人深夜在朋友圈里发出灵魂拷问。
而这颗石子激起的涟漪里,最耐人寻味的样本之一,是智谱——一个在 Token 走向零毛利时代的浪潮中,选择逆流而上的公司。
进入 6 月,全球多家大模型厂商紧跟 DeepSeek 步伐,开启调价潮。据公开消息,国内的小米 MiMo-V2.5 系列、字节跳动 Seedance 2.0 系列、腾讯云接入的 MiniMax-M3 都宣布降价;国外的 OpenAI 也于 6 月 11 日启动首轮大规模 API 降价。
对 DeepSeek 来说,低价是武器。但对绝大多数中国大模型创业公司来说,同样的低价,到底是 " 黎明前的黑暗 ",还是 " 注定填不满的无底洞 "?
以已上市的智谱(2513.HK)为观察样本,"Token 走向零毛利时代 " 这句话正在从预言变为现实。
2025 年,智谱全年营收达到 7.24 亿元,同比增长 131.9%;年内净亏损 47.18 亿元,同比扩大 59.5%。这样算下来,智谱 2025 年每赚 1 元收入,就要亏去 6.5 元。
其中,智谱 2025 年研发开支高达 31.8 亿元,约为其当年收入的 4.4 倍。这意味着智谱每赚 1 元,就要投入 4.4 元在研发上。这样的商业模式,可谓是越努力,越亏损。
而这还不是智谱 " 烧钱 " 的全部。据智谱 2025 年报,智谱单是经营本身就 " 吃掉 " 约 22.46 亿元现金,外加投资所用掉的现金 3.76 亿元,全年共流出 26.22 亿元现金。而其账面现金之所以没崩,是因为后续有融资活动补了进来。
2026 年 1 月,智谱成功登陆港股市场,融得 45.16 亿元,而这里面有 26.14 亿元作为融资净流入进入报表。
把流入和流出一算可以发现,智谱 2025 年经营活动本身并未产生现金积累。可以说,当下的智谱根本不是一个正常盈利公司,而是一个靠融资输血的研发型公司。
这也是为什么智谱在 2026 年 6 月公告,拟冲刺科创板 A 股上市,计划募资 150 亿元。这本质上还是在拉长 " 资本续命 " 的跑道。
当全球大模型厂商掀起 Token 降价潮,若是智谱也被裹挟着降价,那么其现金流状况危如累卵。
为此,近 2 年,智谱做了两件看似矛盾的事——先降价,再提价。
2025 年 4 月,智谱 BigModel 开放平台进行了一次大规模调价:GLM-4-Plus 降价 90%,从 50 元 / 百万 tokens 降至 5 元 / 百万 tokens;GLM-4-FlashX 定价 10 元 / 亿 tokens;GLM-Z1-Air 定价 50 元 / 亿 tokens。
彼时,字节豆包报价压到 0.0008 元 / 千 tokens,大家都在比谁更便宜,智谱也不例外。
2026 年成了分水岭。智谱是国产头部厂商中第一个实质性提价的,而且涨了好几轮。
2026 年 2 月,伴随 GLM-5 发布,智谱对 GLM Coding Plan 进行了结构性调价,涨幅 30% 起,并取消了首购优惠。
2026 年 3 月,智谱发布 GLM-5-Turbo,API 价格再上调 20%,相对上代 GLM-4.7 累计涨幅约 83%。
2026 年 4 月,智谱发布 GLM-5.1,API 价格再提 10%;4 月中旬,智谱 GLM Coding Plan 海外版全线涨价 80% 至 150%,Lite、Pro、Max 版本的套餐价格从原先的每月 10 美元、30 美元、80 美元,分别涨至 18 美元、72 美元、160 美元,这个价格已经几乎等同于 ChatGPT、Gemini、Claude 等国外模型的订阅费。
对于涨价策略,智谱 CEO 张鹏在业绩会上用一组数据打消市场疑虑:2026 年一季度智谱 API 涨价 83% 后,调用量不降反升,市场依然供不应求,调用量增长 400%。
张鹏表示,这印证了高质量 Token 是当下的稀缺资源。他还称,当模型足够强,API 本身就是最好的商业模式,定价权是由技术实力以及长期趋势所带来的领先地位决定的。
不同于智谱硬气提价,同样港股上市的 MiniMax(0100.HK)选择了降价,在旗舰模型 MiniMax-M3 上线一周后,宣布永久降价 50%。
针对两家的不同策略,摩根大通 6 月 12 日发布了研究报告,并对中国两家上市 AI 模型公司作出截然相反的评级判断——维持智谱 " 增持 ",将 MiniMax 下调至 " 中性 "。
摩根大通在报告中指出,在 AI 使用需求仍超过推理供给的阶段,没有任何开发者会在需求过剩时主动降价。如果一家模型公司在新模型上线后迅速从溢价回撤,实际上就是在用定价行为承认——市场不接受这个溢价。
值得注意的是,MiniMax 降价后已与 DeepSeek 系列处于同一价格区间,意味着其在定价上选择与 " 由 DeepSeek 设定价格的那一层 " 竞争。这将直接导致 MiniMax 丧失该价格区间的定价权。
反倒是智谱通过 GLM-5 和 5.1 持续刷新国内 SOTA(最优模型),并在提价后使用量继续增长。摩根大通认为,这意味着下游工作流对 GLM 系列的依赖度足以支撑涨价。而市场以实际行动拒绝了 MiniMax-M3 的溢价预期。
参照云厂商的发展路径,通用推理 Token 正在走 IaaS 化的老路:可标准化的部分必然商品化,利润率趋近零,而真正的钱在上面的 PaaS 和 SaaS 层。这就是所谓的 "K 型分化 "。
放到大模型行业里,通用推理 Token 加速商品化,沿着 IaaS 的老路滑向零毛利;活路只能往上走,要么做垂直场景 Agent 拿中等毛利,要么啃企业私有化部署的合规与替换成本,靠壁垒扛溢价。
而 DeepSeek 这次出手,恰恰是把这条 K 型曲线上的分岔口彻底焊死了。它用极致低价将所有试图停留在 " 通用 Token 批发商 " 位置的玩家,一把推进了零毛利的深渊。
回到 DeepSeek 那一刀砍下去的夜晚。它不只是砍出了历史最低价,更是把整个行业劈成了泾渭分明的两条路:一条是 "Token 批发商 " 的康庄大道,规模越大,离零毛利越近;另一条是企业级 AI 服务商的窄门,门槛越高,活得越久。
智谱选择了后者。它用 2025 年全年 7.24 亿元营收、47.18 亿元亏损、22.46 亿元经营现金流净流出的代价,换来了一组比财务报表更重要的数字:API 涨价 83% 后调用量反增 400%,GLM-5 系列在多个基准上刷新中国 SOTA,摩根大通给出 " 增持 " 评级。
这些数字告诉市场一件事:当你的模型足够强,客户愿意为你支付溢价,哪怕外面到处都是 " 地板价 "。
但这条路并不好走。智谱 2025 年每赚 1 块钱就要亏 6.5 元的结构性缺口,不会因为一两轮涨价就自动弥合。它需要在现金烧完之前,完成三重跨越:收入从 7 亿级跨向数十亿级,让固定成本被大规模摊薄;自研推理效率逼近 DeepSeek 的水平,把第三方算力依赖降下来;本地化部署从项目制转向订阅制,让现金流从脉冲式变成持续式。
这三件事,任何一件都不容易。但比起在零毛利的 Token 红海里和 DeepSeek 拼刺刀,这至少是一条有出口的路。
Token 走向零毛利时代,智谱路在何方?
答案或许就在张鹏那句表态里:" 当模型足够强,API 本身就是最好的商业模式。" 但这句话有一个前提,那就是你不仅要真的足够强,还要市场也这么认为。
更多内容请下载 21 财经 APP


登录后才可以发布评论哦
打开小程序可以发布评论哦