最近业界都在传,DeepSeek 进行了目标可能高达 500 亿人民币的首轮融资,将刷新中国大模型公司单轮融资最高纪录。据我了解到的消息,是不是 500 亿的规模虽然无法确定,但其首轮融资金额已打破纪录并严重超募,成功完成首轮融资已成定局。
那么,今天这样的形势下,中国大模型玩家的未来格局是什么样的?甚至未来市场上能有多少家大模型玩家?这些玩家将如何构成?其实挺值得讨论一下。
竞赛规则和目标越来越明确
先说个业界的共识:Scaling law 并没有到头,
「更多维度的数据,更高质量的数据工程,更大的算力带来的更庞大的基模,还在给模型能力带来快速增长,甚至这种能力的成长还没有看到边界。」这基本上是现阶段硅谷一线 Researcher 的共识。
这种共识代表着某种「确定性」,这意味着提升模型智能水平,在一定程度上从一个高风险的科学探索问题,开始更靠近一个高投入的工程和资本问题。只要有足够的数据、算力和工程执行力,持续投入就能换来相对可预期的智能提升。
与此同时智能本身也逼近了一个临界点——智能程度足以实现自进化。Anthropic Claude Cowork 的代码全部由 Claude Code 产出,并在十天中完成。用当前最先进的智能生产力,投入下一代智能的迭代,这种模型能力到达某种临界点后,可用于提升下一代模型的训练效率或数据质量的现实,开始给人一种近乎「左脚踩右脚」的梯云纵的想象。
相信中国模型领域应该也已经迅速形成了两个共识:
一方面,无论大厂还是创业公司,都必须拼尽全力,尽快跨过这道临界点。跨不过去,差距将被彻底拉开,牌桌就没有你的位置。
另一方面,这并不是靠一代、两代模型 SOTA 就能赢得的比赛。它是一场星际飞行,在一个足够长的时间里,玩家们比拼的是持续的加速度,而非某一次的冲刺加速。这意味着,你需要足够大的「能量池」,才能留在竞赛里。
模型将不只是现有巨头的游戏
训练模型需要巨大的资源消耗,上顶级模型牌桌的入场券大概就得 10 亿美元级别。这笔钱,依靠一级市场的融资已经非常不易。但这很可能仅仅是「起步价」。
真正的考验在于,你是否具备「百亿甚至千亿美元」级别的持续投入能力。这笔钱大概率无法单靠融资,它可能来自两个核心支柱之一:一个能持续产生巨额利润的强大业务,或是能被资本市场长期、海量注资的信心。
虽然模型一度被认为是独属于「巨头」的游戏,但随着这场游戏的确定性和「规则」逐渐明确,反而现在有一些新玩家在入场,他们未必是传统意义上的巨头,但是他们也有强烈的入场动力。
这背后的思考是,基础大模型并非一个产品,而是这个时代的「工业母机」。拥有自主、可控、持续迭代的模型能力,相当于在新时代拥有了自己的核心工业体系。反之,如果完全依赖外部模型 API,就像你只能做来料加工甚至是服务业,而不拥有核心的工业体系,那么无论你的应用层业务多么繁荣,都会面临「空心化」的问题,沦为他人工业链条中的一环。当然,更大的问题是你也会严重缺少在新时代开疆辟土的「工业能力」。
基于此,中国的模型牌桌上可能将会有三类玩家:
第一类玩家是科技巨头,例如阿里、字节、腾讯。
他们的核心优势并非单纯的资本,而是他们都有着非常强大的主营业务。
这种优势对于训模型的重要性,可以从「云」的发展中窥见:阿里云之所以能成为亚洲第一云,根源在于它诞生于双十一的极限交易洪峰中,是被自有业务的极端场景「逼」出来的基础设施。亚马逊 AWS 也是如此。
所以科技巨头作为第一梯队的核心优势在于他们强大的「A 面」——电商、社交、内容等庞大的主营业务,是「B 面」模型引擎的天然训练场与价值出口。
对科技巨头而言,投入模型研发并非选项,而是必须。放弃自研模型,就意味着平台「空心化」,将未来的「工业主权」拱手让人,这是他们绝对无法接受的。
比如之前比较被大家忽视的腾讯,其最近的模型虽然还没有 SOTA 到引人注目,但已经看得出在快速追赶和提速。按照这种发展趋势,未来也一定是不可忽视的力量。
第二类玩家是 MiniMax、智谱、月之暗面、阶跃星辰这类模型创业公司。
他们是本轮浪潮中最敏锐的先行者,他们因模型而来,也 all in 模型,凭借技术信仰和敏锐的执行力,在模型能力上紧咬前沿。
作为新兴公司,他们的优势理应体现在更高的组织效率、更敏捷的执行力,以及在技术上的原生「天赋点」,能以相对更优的效率取得成果。
但他们面临的挑战也显而易见:如何解决持续长跑的燃料问题?因此长出一个强大的 A 面业务一定是值得追求的。
例如相对于 OpenAI,Anthropic 最近一年多来在硅谷更受推崇,就是因为它凭借 Claude Code 等产品迅速建立起了强大的 A 面,展现了从第二类向第一类玩家迁移的趋势。
在全球化中寻找出路或许是一个要探索的方向。毕竟在中美两大市场之外,广阔的全球市场提供了巨大空间。将模型能力或基于模型的产品,像电力一样输出到全球不同角落,用一定的价值循环做支点,驱动模型引擎的持续迭代,形成价值闭环。这条路不容易,但概率不为零。
相对于我们比较熟悉的前两类,第三类玩家也很值得讨论。
这类玩家是战局中最值得关注的变量。他们虽然没有巨头的体量,但具备几个典型的特征:较高的利润率、可观的利润规模、有砸几十亿美元的投入决心,以及创始人自己对大模型领域足够深的投入,在技术决心和业务决定上的极度笃定。
DeepSeek 就是这类里最独树一帜的代表。它正是基于幻方量化在长期量化交易业务中锤炼的 AI 与超算技术能力而创立,也得益于幻方量化这个坚实业务 A 面的支撑,加之创始人梁文峰兼具决心、意愿与模型领域的能力,使 DeepSeek 成为了业界不可忽视的力量。
但当所有人都意识到模型是一场长跑时,仅靠一个中型 A 面业务的利润支撑是不足的。因此,这也解释了 DeepSeek 走向融资就是一种必然选择。
此外,DeepSeek 之所以受到大力加持,还在于其独特的战略站位。首先 DeepSeek 在开源路线上已经在建立初步的生态,实际上带动了硅基流动、无问芯穹等公司的存在。同时,在所有国内大模型公司里,DeepSeek 也是与国产算力生态整合最为积极和坚定的。毕竟对于其他巨头和创业公司而言,这是一条充满不确定性与挑战的、让他们很难 all in 的道路,但 DeepSeek 做出了这个选择,使其在事实上承载了部分与国家科技战略相关的使命。这种与国家战略的深度共振,超越了单一的商业业务,构成了其更宏大、也更稳固的一个「A 面」。
这不仅仅意味着 DeepSeek 可能获得不亚于大厂的持续资源能力,也意味着开源模型领域的进一步能力加强,成为了中美闭源大模型之外的一股对冲力量。
其实我还有一个大胆的推测,大模型玩家中,可能还有一个值得重点关注的是米哈游创始人之一的蔡浩宇创立的 AI 公司 Anuttacon,其近期发布的 LPM 1.0 表演模型可能只是一道「前菜」。据传蔡浩宇在 LLM 上的专注投入已经开始一段时间了。
另外的一个证据是在米哈游 4 月 17 日的官方校招信息中,已明确开始为「基础大模型」举办技术分享暨顶尖校招生招募,并清晰地指出这是基于「自研 Foundation Model」。更值得注意的是,信息中提到米哈游的另一位创始人刘伟也将前往现场共同探讨交流。从这也看得出来,投身基础大模型大概率不只是蔡浩宇的个人兴趣和动作,而可能是创始团队在这方面达成了共同的决心,是一次重要的集体战略选择。
从基本能力上看,米哈游的游戏业务年收入在百亿美元级别,利润可能在 30-40 亿美元区间。同时蔡浩宇已经建立独立的公司,应该已经开始明确集中精力聚焦于大模型领域。他大概率不是像之前外界猜测的那样只是围着未来游戏引擎来搞模型——虽然最开始的出发点可能确实有这个因素。因为从当下模型的发展趋势看,就算最终其模型的能力可以帮助米哈游创造「AI 世代的新游戏」,那也一定不会只是垂直于游戏领域的「AI 游戏引擎」,而必须是基于强大语言模型向上生长的数字世界「工业母机」。
实际上,米哈游在游戏领域的成就已经非常可观,我猜测其创始人们很可能不只把大模型作为确保游戏业务能穿越时代的「防守动作」。这为什么不能是他们依托游戏业务这么好的阵地的「进攻性」能力?是通向更大赔率和更大规模的未来业务新可能性呢?
毕竟米哈游凭借其游戏业务的支撑,并且同样可以借助资本市场的杠杆,它有潜力成为第三类玩家中另一个重要的力量。前提是,要看他们什么时候能在大语言模型上放出他们的阶段性成果,验证他们在技术上获得被认可的「参赛资格」。
这种半场杀入,但目标坚决,并一定会寻找用技术创新超车的新玩家,至少对技术人才们而言是一种新机遇。
总之,到今天看,大模型还不能说只是巨头的游戏,故事还在分叉,精彩还在继续。


登录后才可以发布评论哦
打开小程序可以发布评论哦