文 | 伯虎财经(bohuFN),作者 | All too well
今年 2 月,当恒生科技指数还处在一路向南的惨淡当中时,有两个 " 小登 " 走出了不一样的行情。上市两个月的智谱从一月底的 226.4 港元每股一路飙升到发稿前的 628 港元每股;上市不过一个半月的 MiniMax 从一月底的 473 港元每股上涨到发稿前的 880 港元每股。
两家公司市值均一度跨过 3000 亿港元关口。
3000 亿港元是什么概念?横向对比一下就很直观——当前 B 站总市值 957.17 亿港元,京东市值约为 3016.79 亿港元。也就是说,这两家成立还尚不足十年的 AI 公司,市值已经悄然越过许多互联网巨头。
和 " 小登 " 在二级市场予取予求不同,大厂们正忙着让更多人用上 AI。
今年春节,字节、阿里和腾讯纷纷取消了春节休假,严阵以待,应对用重金换来的 AI 需求。在各家的战报里,仅除夕当天,豆包 AI 互动总次数达到 19 亿次;阿里花费 30 亿元,让近 2 亿用户使用千问下单消费;腾讯用 10 亿红包,换来了 1.14 亿的月活新高。
这是大厂们 2026 年的第一波交锋。如何撬动和发现更多的需求?如何先人一步的占据 AI 时代的入口?这是大厂们关心的问题。
无论是大厂们的撒币买用户,还是二级市场上的 AI" 小登 " 当道,都是 AI 时代里的不同切口。毫无疑问的是,AI 应用已经开始深入融合我们的生活,它既站在港股 AI" 小登 " 的升浪中,也藏身在大厂的 FOMO 情绪里,催促后者把它推向每一个人。
01 2026,AI 商业化元年?
MiniMax 和智谱的狂飙之所以让不少人担忧,很大程度上是因为他们的市值无法适用于传统的估值模型。
即便是把它们放到 AI 企业的篮子里,也属于是被严重高估的。美国同行 Anthropic 最新估值约 3800 亿美元,年化收入已经超过 20 亿美元,市销率大约 190 倍。而如果以 MiniMax 前九个月 5344 万美元对应的 3000 亿港元营收来算,后者的市销率超过 700 倍。
但推动 MiniMax 和智谱这波上涨的重要原因是,它们的新模型证明了中国 AI 团队有能力用算法效率弥补硬件短板,做出让专业用户为之付费、好用的模型。
以智谱为例。
程序员一直是 AI 的重要付费群体,此前大火的 vibe coding 就是让 AI 作为产出工具来完成写代码的工作。但在全球权威编程基准测试里,闭源模型的领先一直很明显。
智谱新发布的 GLM-5 打破了这个惯例,从 Artificial Analysis 测试的结果来看,GLM-5 直接跻身智能程度全球第 4,编程能力全球第 6,代理能力全球第 3,紧追顶尖的闭源模型。而在 AA-Omniscience 幻觉率测试中,GLM-5 把幻觉率压缩至 34%。


除了在推理、代码和自主能力上的全面升级,GLM-5 还大幅降低了运行成本。GLM-5 引入的深度稀疏注意力机制让它能够根据内容智能筛选出最重要的词,举个例子,同样是 12.8 万个词的长文本,GLM-5 的计算量直接砍掉了一半到三分之二。因此,GLM-5 的参数总量扩展到了 7440 亿,但每次实际激活运算的参数只有 400 亿。
新模型发布后,由于用户规模与调用量快速提升,智谱还官宣 GLM Coding Plan 价格上调 30% 以上。主打轻量化和效率的 MiniMax M2.5 在被以 OpenClaw 为代表的 Agent 需求推动下,只用了一个星期的时间,就成了 OpenRouter 上 Tokens 调用量的榜一。
不再追求模型参数,而是让用户真正用起来,这和过去我们熟悉的 AI 厂商开打价格战的竞争态势是截然不同的。
即便是仍然花大价钱买用户的大厂们,实际上竞争的也是好用。
晚点 LatePost 报道,2025 年初,字节跳动 CEO 梁汝波曾在集团全员会上说,豆包没显出 " 越多人用越好用 " 的互联网产品特性,他提出字节要追求智能上限。春节前,Doubao2.0 升级,除夕当天,Qwen3.5 上线。两者同样强调 Agent 执行能力,能办事,真有用。视频生成模型 Seedance2.0 发布后,游戏科学 CEO、《黑神话:悟空》制作人冯骥更是发出了 "AIGC 的童年时代,结束了 " 的感叹。
和小登们不同的是,这些拥有庞大生态、版图从电商、生活服务蔓延到短视频、游戏乃至支付巨头们,还需要借由 AI 继续巩固自己的地位。
所以千问接入了淘宝闪购、支付宝、淘宝、飞猪、高德等阿里系应用,为了让千问的使用体验更好,阿里投入了大量资源,每周更新 2-3 次,一些需求从设计到上线仅需 1-3 天。
无论是智谱和 MiniMax 的抢跑,还是大厂的红包大战,其实都在面向不同的人群,努力让 AI 真正被用起来。
02 繁荣背后的隐忧
OpenRouter 数据显示,今年 2 月第一周处理的 AI tokens 达到 13 万亿,环比 1 月第一周接近翻倍。这和当下行业的 Agent 爆发式增长有很大关系。
在海外,OpenClaw 作为一款开源的个人 AI 助手,能够在本地电脑或服务器上自主运行,并通过自然语言指令执行各种任务。它的爆火速度堪称史诗级,其在发布后的短短一周内就突破 10 万颗星标,成为 GitHub 历史上增速最快、关注度最高的开源项目之一。
虽然当下处于墙内墙外两开花的状态,但 AI 应用还存在不少隐忧。
首先,高投入高亏损是行业常态,以智谱和 MINIMAX 为例。
2022 — 2024 年、2025 年上半年,智谱的营收分别为 0.57 亿元、1.25 亿元、3.12 亿元、1.91 亿元,净利润分别为 -1.43 亿元、-7.88 亿元、-29.56 亿元、-23.51 亿元,三年半亏损 62.38 亿元。
2022 — 2024 年、2025 年前三季度,MINIMAX 营收分别为 0、0.03 亿美元、 0.31 亿美元、0.53 亿美元,分别实现净利润 -0.74 亿美元、-2.69 亿美元、-4.65 亿美元、-5.12 亿美元,三年又三个季度合计亏损 13.2 亿美元。
亏损主要出在人力成本和算力成本。据海豚投研分析,两个公司员工整体都没超 1000 人,尤其是 Minimax 都不足 400 人;两家公司研发人员都接近 75%,单人头月成本 6.5-8.5 万元人民币(不含期权激励),其中 Minimax 研发人员单人月成本是 16 万。
看着不低的人力成本,但和动不动上亿美金抢人大战的惨烈比起来,又不算离谱。真正的压力来自算力。
从两家公司披露的数据来看,单单模型训练相关的算力投入,就占到了总支出的 50% 以上,是绝对的大头,也是亏损的核心来源。
以 2023 年为例,研发一代模型的训练成本大约在四五千万美元之间。而当模型进入下一代,为了实现代际差异,无论是数据量、参数规模还是算力需求,往往都呈现指数级增长。模型升级一代,训练成本提高 3 — 5 倍几乎是常态。
也就是说,算力效率提升了,但算力总需求却在放大。
一方面,模型规模持续膨胀,多模态能力不断叠加;另一方面,Agent、编程助手等高频场景开始落地,调用次数迅速上升。在这种情况下,即便单次 token 成本快速下行,只要总调用量和模型复杂度同步飙升,企业最终要支付的算力总账单,反而可能越滚越大。
这也解释了,为什么推理成本明明在下降,公司烧钱却越来越厉害。
根据灼识咨询数据,行业平均推理成本已从 2022 年底每百万 token 约 20 美元降至 2024 年底不足 0.1 美元,未来仍可能继续下降。单次调用确实更便宜了。
与此同时,2024 年,MiniMax 与推理及训练相关的云计算成本合计约 1.67 亿美元,占营收比例达 545%。也就是说,每赚 1 块钱,要付出 5 块多的算力费用。智谱当年计算与算力服务费合计 15.83 亿元,占营收 506%。每进账 1 块钱,大约 5 块被算力吞掉。
而且这种趋势还愈演愈烈。智谱的算力服务费占研发开支比例,从 2022 年的 17.3%,一路爬升到 2025 年上半年的 71.8%;MiniMax 与训练相关的云计算开支占研发比例,也从 39.4% 提升至接近 80%。
这就意味着,目前的情况下,模型要优秀,训练成本就越高,收入似乎也跟不上更新迭代的速度,到底何时才会有个结果?
其次是监管和侵权风险。比如 Seedance2.0 不仅收到了来自版权方的律师函,还下线了争议极大的真人素材参考能力。
浪潮之下,毕其功于一役是不切实际的想法。AI 的参与者们面临的是一场真实的商业战争,而刚刚过去的春节可能只不过是一道开胃前菜罢了。
参考来源:
1、至顶 AI 实验室:智谱 GLM-5 技术曝光,代码能力已经赶上 Claude?
2、硅基星芒:智谱与 Minimax 交出 " 大招 " 之后,DeepSeek" 平 A" 了一下
3、晚点 AI:春节 AI 战役全记录:红包、模型与算力
4、字母 AI:跟 Claude 掰腕子,智谱 MiniMax 双模齐发
5、海豚投研:深扒 Minimax 与智谱:大模型,一场算力强度与融资耐力的残酷绝杀?
6、极客公园:为什么所有人都觉得 MiniMax、智谱「太贵了」?
7、厚雪研究:中国 " 大模型双雄 " 上市:研发支出 70%-80% 花在算力
文章封面首图及配图,版权归版权所有人所有。若版权者认为其作品不宜供大家浏览或不应无偿使用,请及时联系我们,本平台将立即更正。


登录后才可以发布评论哦
打开小程序可以发布评论哦