锁在互联网里的中国大模型

图片来源：unsplash

中国的大模型已经很强了。

从 2023 年的爆发元年至今狂奔三载，中国大模型已能与 OpenAI 的 GPT、Anthropic 的 Claude 和谷歌的 Gemini 站上同一舞台。不仅性能代差逐渐缩小，从数量角度考量，较成熟、有影响力的大模型甚至多于潮头之上的美国 AI。

不过，在有目共睹的技术进步中，仍有一条令人担忧的脉络。

或许可以称之为互联网经济的惯性。

AI 浪潮奔涌前，中国互联网产业已沸腾了二十余年。AI 爆发后，那些几乎宰制了数个周期的竞争模式和思维理念，仍在寻求同化这一新事物。

从批量复刻、疯狂买量、降价清场到补贴竞赛、平台为王、赢者通吃，不少中国的科技巨头与创业者们，虽然嘴上说着自我革新、时代更迭，但脑中挥之不去的念头，看起来还是让人工智能先学会互联网经济的套路。

虽然也有 DeepSeek 等看似 " 不在此山中 " 的特例，但称之为特例，就意味着主流所向已一目了然。

特例和主流，旧法与新潮，共同催熟了中国大模型，成就其今日的样貌。但也正是在 Token 经济真正爆发，AI 寻求落地之刻，互联网经济的惯性思维和路径依赖，很可能会变成一种看似闭环的桎梏，将中国大模型锁在其中。

三场大战

互联网经济惯性从中国大模型爆发之初就未曾缺席。

2023 年到 2026 年，三年多的三场 " 大战 "，甚至让中国大模型的发展历程，变成了微缩版的互联网商战史。

百模大战

2022 年 11 月 30 日，ChatGPT 横空出世。两个月后，这个 AI 聊天机器人的 MAU（月活跃用户数）就突破了 1 亿，成为历史上最快达到这一目标的 C 端应用程序。

ChatGPT 在对话中体现出了近似人类的智能，其背后是 OpenAI 的 GPT-3.5 大模型。

大模型的现象级热度很快传导至中国，于是，有了被称为爆发元年的 2023 年。

夹杂着对新技术、新业态的兴奋和历史级的 FOMO（错失恐惧症）情绪，市场加速狂奔。

短短半年内，中国涌现出了超过 130 个大模型。

就像互联网时代数个新业态的发轫期一样，发布会和 PPT 再次迎来黄金时代。无论是功成名就的互联网大厂还是名不见经传的技术创业者，无论是出身于搜狗、美团，还是传统的家电企业，都抢着加入战局。

而且，锚定 GPT 的入局者，大多执着于开发通用大模型，争做 " 国产 OpenAI"。

如今回看，那似乎更像是一场批量复刻的 " 模仿秀 "。实际上，很多当时做私域大模型的厂商在论证自身优势时就不无心机地点出过国产大模型的 " 套路 "，理论体系是谷歌的 Transformer，训练方法借鉴 OpenAI，能拼的更多是数据和算力。

不过，不同于互联网经济的种种新业态，大模型的技术门槛、投入门槛实际上更高，在 GPT-3 就开始闭源，此后的能力跃迁难以 " 照葫芦画瓢 " 的情况下，多数缺少技术实力和创新努力的 " 参赛选手 "，能力在不及 ChatGPT 的水平线上拉齐，根本无法复刻 OpenAI 的成功。

随着算力成本与技术门槛凸显，洗牌来得比大多数人想得更早，缺乏造血能力的玩家相继退场，赛道迅速收敛，但似乎也仍暗合了互联网经济跑步入局，跑步出局，赢者寡，败者众的模式。

价格大战

到了 2024 年中，洗牌尚未尘埃落定，赛道已经急不可耐地打响了第二场战役：价格战。

DeepSeek 的 V2 模型被视为 " 始作俑者 "，在其受到全球瞩目前，这也是这家公司曝光度最高的一段时间。

随后智谱、字节跳动、阿里巴巴、百度、腾讯火速跟进。短短一个月内，大模型的 API 调用价格从 " 厘 " 时代直接被打穿，甚至出现了大量 " 免费送 Token" 的极限操作。

但实际上，大部分加入价格战的厂商，根本没法 cover 成本。而很多操作虽然打着技术普惠的旗号，但底层却是互联网血拼时代的清场逻辑。

除了降价，盛行的还有投流，除了互联网大厂，月之暗面（Kimi）、MiniMax 这样的初创也 " 着了魔 " 一样的疯狂买量。

这场充满互联网套路的绞杀加速了行业洗牌，一定程度上让资本厚度占据了竞争 C 位，也一度让低价模式 " 深入人心 "，为此后的 " 涨价难 " 埋下伏笔。

春节大战

2025 年堪称中国大模型之年，典型代表是冲击国际顶级性能、并且让开源生态彻底爆发的 DeepSeek，和在更广泛的用户市场无往不利的豆包。

这一年中国大模型的性能实现整体飞跃。有人视之为财力、人力、算力投入的必然结果，也有人认为 DeepSeek 的 MoE 路线恰好押中 OpenAI 发布 o1 开启的推理时代，其性价比和开源特性又将大模型（不限于中国，但对中国大模型更为明显）的工程优化和全面爆发向前推了一步。

性能的跃升也加剧了产品落地和商业化的急迫性。

为了争夺超级入口的地位，为了抢得商业落地的客源，在 2026 年 2 月的马年春节档，腾讯、阿里、字节、百度这四家互联网大厂正面对决，发起了一场春节大战，总耗资近百亿人民币，而核心，仍是红包和补贴，他们最熟的那个剧本。

不过，砸钱的收效并不理想。节后一周，各家应用的日活迅速回落，强行拉满的渗透率没能转化为忠诚用户，反而暴露了成本吃重、算力不足等经济性难题。

春节大战的迅速退潮或许说明，用互联网经济的模版写大模型的故事，可能难以达到自己想要的结局，毕竟这个赛道的网络效应无法类比于微信、抖音，依托于大模型的 AI 应用，也根本不能以一个互联网 APP 的产品生命周期和回报曲线来衡量。除了高昂的前期技术研发投入，其持续的迭代成本和算力成本，也让相关模式根本算不过来账。

而一味的价格战、补贴战、流量战，也很可能让 " 用户为智能付费 " 的可行商业模式变得更为艰难。

围城、拯救、理想

几场大战期间，中国大模型（此处主要指通用大模型）一度成为 " 围城 "。

外面的人，依然挤破头想冲进去。

自称拥有自研大模型的企业不在少数，也不乏实为垂类大模型但被包装成、暗示为通用智能的情况。毕竟，对于创业、融资、IPO 或者二级市场的股价来说，AI 仍是最时髦的故事，而大模型这个早已普及的概念，也仍能拿来吹票。

然而，" 围城 " 之内，也不乏想出来的人。

大模型 " 六小虎 " 之一，前搜狗 CEO 王小川创立的百川智能，成立之初的愿景也直指 " 中国的 OpenAI"，要在通用人工智能（AGI）的底座模型上与世界顶尖水平一较高下。但目前，该公司的主要业务方向已转向医疗等垂直赛道模型，并重点探索 AI 应用的落地。

类似的情况不在少数，许多曾经号称要做基础大模型、通用大模型的厂商，已悄然变成了帮企业做私有化部署的 " 模型施工队 "。究其原因，很大程度上是因为在大模型 " 上道 " 前，互联网的 " 卷 " 式竞争已足以淘汰一大批玩家，而大模型 " 上道 " 之后，" 围城中人 " 很可能发现这会演变成一场没有尽头的算力军备竞赛。

那些留在城内，并且看起来站稳脚跟的玩家，有时也未必如外界所见那般光鲜、积极。

实际上，直到 2025 年末 2026 年初，Kimi、MiniMax 等顶级明星初创大模型厂商走过的 " 弯路 " 才更多被舆论所了解。

不少报道指出，这两家起步早、成名早的 AI 初创代表，在 2024 年曾深陷互联网模式陷阱，要么就在多线产品赛马中摇摆，要么就专注投流冲 DAU，打消耗战，都一度让技术路线混乱不堪，团队也出现动荡。

后来的故事是，2025 年初 DeepSeek 的爆火将曾经的 C 位咔挤到边缘，但反而将它们从互联网模式焦虑中拯救了出来。据称，不再背负 " 率先成为中国 OpenAI" 的包袱后，两家公司再次回归技术，聚焦大模型本身的开发，数月后也都拿出了更为亮眼的成绩。

被动扮演 " 拯救者 " 角色的 DeepSeek，此后愈发成为了理想主义者和特立独行者的代表。直到 2026 年二季度之前，这家低调、不融资、不冲量甚至不加班的公司，都被视为专注实现 AGI 而独立于互联网经济模式之外的那一个。

但在 2026 年初 DeepSeek 的 V4 屡屡失约后，人们似乎变得不耐烦起来。等待一个理想主义者会错失多少热闹呢？越来越多的 AI 应用出现，以 " 龙虾 OpenClaw" 为代表的 Agent 掀起新的狂潮，而 DeepSeek 的风评实际上在下降。即使 V4 发布并持续降价，但不买账的声音也越来越多，而其性能水平没能真正达到美国 " 御三家 " 的水平，产品分层出现混乱，算力紧张导致专家模式门槛持续垒高、可用性下降等问题，也引发了一些抱怨声音。

如今，DeepSeek 开始引入外部投资，在 2026 年人们频频谈论 AI 落地、商业价值兑现的节点，这个理想主义者未来的故事也变得更加模糊。

字节仍在跳动，Token 快要失控

2026 年，Token 这个词爆火，一如三年前大模型的爆火。

但也正是 Token 经济学，让大模型赛道与互联网经济模式的矛盾凸显了出来。

互联网时代，跳动的字节本身花不了那么多钱，大笔的资金可以用来打获客的战役，堆产品、上补贴、买流量等 " 大力出奇迹 " 操作，并最终做成超级产品、大平台，形成垄断持续获利的模式是可行的。毕竟，一个产品 " 走起来 " 后，其边际成本就会大幅下降，开发一个短视频 App 需要几千万，但让第 1 个用户看视频，和让第 1000 万个用户看视频，增加的服务器成本微乎其微。

但这套互联网经济黄金法则却无法直接挪用于 AI 赛道。当 Agent 大举刺激推理所需的 Token 量，AI 被推动着必须落地形成生产力的时刻，大模型每一次交互背后昂贵、需要持续投入的算力成本，也被更显著地摆在了台前。

如果沿用互联网的低价、补贴模式，那么就会陷入流量越大，亏损越深的陷阱。不少厂商会发现，砸钱获取的日活，在某个节点后变成了巨大的成本 " 债务 "。而那些消耗海量 Token 的免费低净值提问，却无法在数据、转化上真正提供助力。

在这种情况下，涨价甚至降智都成为了摆上台面的选择。

今年初，Token 价格持续走高，3 月 " 龙虾 " 爆火后尤甚。这一度导致 OpenRouter 统计的中国 AI 大模型周调用量在 4 月出现连续下滑。

而如上文提及的，包括 DeepSeek 在内，不少大模型厂商对自己的入口进行了调整，限制了用户使用，体验感实际上出现下降。与此同时，有业内人士透露，行业整体的 Token 质量也走出了与产业发展热度相反的曲线，目前响应速度、缓存命中率等核心指标表现不升反降，行业还出现了很多以次充好、挂羊头卖狗肉的乱象。

更快的商业变现一度被认为能解决 Token 边际成本问题。

但从豆包探索付费模式来看，C 端 AI 产品能否走通订阅模式，为大模型输血，还很难说。毕竟，从这波中国大模型热潮爆发之初，无论主流还是特例，都较少真正探索付费模式，培养用户付费习惯。

而在海外愈发火爆的大模型 To B 市场，也难以直接在中国复刻。有后来居上之势的 Anthropic 和校准方向的 OpenAI，都积极地开发靠提供标准化的 SaaS 订阅服务赚钱的模式。但在中国，SaaS 的土壤天然贫瘠，大模型公司被迫走向了沉重的私有化定制项目。不少报道、案例称，为了拿下大客户的几百万订单，顶尖的 AI 算法科学家被派去给传统企业做数据清洗、做系统集成，硬生生把前沿科技做成了劳动密集型的 IT 外包。而最终，付费模式和习惯也没能在 Token 濒临失控前在 B 端建立起来。

互联网经济模式让新业态的发展有可参考路径，但如果迷恋曾经的成功模式，将往日套路照单全收，那无异于 " 画地为牢 "。

目前，大模型的研发和产品化，与互联网业态杂糅在一起，而路径依赖在营收平衡、B 端 C 端付费模式上均有触壁的端倪，如果无从突破，很可能被锁在自己画就的圈里。

从海外引领潮流的 OpenAI 和 Anthropic 来看，虽然它们也曾在变现上有过 " 昏招 " 和难评的举措，尤其前者引入广告、打价格战等操作一度也招致争议，但从今年的情况来看，在其 " 搞钱 " 道路和前景上，编程领域的生产力突破是突破性的拐点。实际上 OpenAI 在看到 Anthropic 通过 Claude code 大幅提升变现能力后，也将自己的重点聚焦到了编程上。

而此后，经由 Agent 让大模型能力溢出到办公、PA（个人助理）等，则激活了更广泛的 B 端、C 端市场潜力。

对于狂飙的中国大模型来说，过往几年的低价、免费模式，形成了一定的用户价格锚定效应，客户结构也变得比较混杂，很可能已经导致盈利路径愈发不清晰，长此以往，企业自身的财务结构也会变得更加脆弱。

另一方面，中国大模型此前的发展路径更多聚焦于模型参数竞赛和应用场景拓展，这很像 " 做题家思维 " 和互联网 " 产品为王 " 理念的结合体，但总体上对推理优化和服务稳定性的工程积累仍有欠缺，在技术迭代加速，推理时代猝然迎来拐点时，大模型也被圈进了涨价难，降服务质量又怕会失去竞争力的两难境地。

与此同时，种种因素叠加，更让大模型缺乏从 " 补贴期 " 到 " 盈利期 " 的平滑过渡，Token 狂飙带来的种种困境与乱象即是表征。

当然，AI 仍是在不断发展的新事物，无论从技术路线还是商业模式上来说，探索的空间和机会当然仍在。好消息是，中国大模型在编程、办公、PA 等领域也在集中发力，对于付费模式也开始了新的尝试。

或许打破 " 闭环 "，避免被锁死的路，也很快会展现出来。

（作者｜胡珈萌，编辑｜杨林）

宙世代

一起剪

相关标签