在即将到来的 1 月 27 日——也就是 "DeepSeek 时刻 " 一周年之际,全球 AI 社区都期待 DeepSeek 再来个大招。
市场喧嚣期待之时,知名科技评论作者 Kevin Xu 发布长文对 DeepSeek 的商业模式、护城河进行了分析,在 AI 圈内引起了很大反响。
他认为,DeepSeek 最坚固的护城河,是它零外部融资、无商业化压力的独特模式。在全球 AI 巨头都被资本裹挟着必须赚钱的时候,DeepSeek 是唯一一个可以不计成本、不看脸色、只为 AGI 梦想狂奔的 " 自由人 "。
Kevin S. Xu(徐凯文)是专注中美科技与资本交叉领域的独立观察者,知名科技评论人。他创办的 ChinaTalk 播客及 Newsletter 在专业圈层颇具影响力,擅长从资本流向、组织行为与地缘政治多维度解构技术演进逻辑。
我们给大家梳理了一下文章要点:
给市场预期泼盆冷水
:虽然大家都在等 DeepSeek 的新模型,但作者直言 " 不要指望它能像去年那样再次震惊世界 "。因为现在的市场已经被 " 开源模型 " 喂饱了,DeepSeek 虽然打响了第一枪,但现在并不是唯一、也不是最开源的玩家了(比如它至今没开源数据集)。
唯一的 " 零融资 " 异类
:现在的 AI 圈就是 " 销金窟 ",连马斯克都没扛住,最近也给 xAI 融了一笔高达 200 亿美元的巨资。但 DeepSeek 的老板梁文锋至今坚持 " 零外部融资 ",这在所有顶尖实验室里是独一份的,他把控制权看得比钱重。
超级 " 印钞机 " 兜底
:梁文锋能这么硬气,是因为他背后的量化基金 " 幻方量化 " 太赚钱了。去年,幻方以 53% 的回报率赚了超 7 亿美元(约 50 亿人民币)的利润。梁文锋直接把这些钱拿来买显卡、招人,这种用 " 老钱 " 养 " 新梦 " 的模式,让他完全不需要看投资人的脸色。
被 VC 拒绝反而是福报
:2023 年 DeepSeek 刚成立时其实找过融资,但当时国内 VC 普遍短视、不敢投,结果这反而成了 " 塞翁失马 "。作者认为,一旦拿了 VC 的钱,就必须背上商业化 KPI,动作就会变形,而现在的 DeepSeek 只需要对技术负责,不需要对财报负责。
" 钱多 " 麻烦多
:这是一个非常深刻的洞察——钱太多会滋生 " 大公司病 "。作者举了个很讽刺的例子:有些富得流油的实验室(比如 Thinking Machines),甚至在办公室健身房里用上了 印着自家 Logo 的定制杠铃片 。这种浮夸的排场背后,是员工盯着期权带来的 " 纸面富贵 ",部门之间为了争夺算力资源搞 " 宫斗 "。而 DeepSeek 因为没有外部估值,团队极度扁平,没有资源内耗。
算力不是万能药
:文章引用了前 OpenAI 大神 Ilya Sutskever 的观点—— 真正的颠覆性创新往往不需要无限堆算力 。Transformer 架构当年只用了 8 到 64 张卡就跑出来了。钱太多反而会让团队变懒,以为堆算力就能解决一切,从而失去了 " 科研品味 "。
投资人的终极悖论
:最后,作者站在一位投资人的角度发出了一声叹息——作为一个投资人,他做梦都想投 DeepSeek;但他心里也清楚, 一旦 DeepSeek 接受了外部投资,那种纯粹的特质就会消失了 。
作者原文如下(由 AI 翻译):
没有商业模式:DeepSeek 的长期优势
随着 1 月 27 日 "DeepSeek 时刻(DeepSeek Moment)" 一周年纪念日的临近,市场对于 DeepSeek 在农历新年(2 月 17 日)前发布一款更强大新模型的期待正日益高涨。
然而,过高的期望几乎注定会带来失望。虽然我也急切地等待着这款新模型,想看看 DeepSeek 究竟在忙些什么,但我并不预期它会像一年前那样再次震惊市场。整个 AI 行业乃至更广泛的市场,已经习惯了每隔一两个月就有一款新的 " 开放权重 " 模型发布,尤其是来自中国实验室的模型,它们即便算不上最尖端,也往往表现扎实。凭借着开放和免费的特性,这些模型正以一种无法追踪和溯源的方式在各地获得牵引力——这也是开源技术整体上的一种美德(或者说是缺陷)。正如英伟达 CEO 黄仁勋喜欢说的那样,以 Token 生成量计算,世界上最大的 AI 仍然是 OpenAI,但第二大的,是开源 AI。
DeepSeek 或许在去年通过发布 V3 和 R1 打响了 MIT License 许可的开源模型的第一枪,但其他实验室迅速跟进,从同样来自中国的竞争对手阿里巴巴及其 Qwen(通义千问)模型系列,到 OpenAI 推出的 gpt-oss 模型。(两者均使用 Apache 2.0 许可,这是另一种常见的开源宽松许可。)正如我之前指出的,如果不是因为 DeepSeek,OpenAI 可能永远不会感受到压力,从而去兑现其开源根源的承诺,哪怕只是口头上的,比如发布 gpt-oss。虽然 DeepSeek 继续开源其模型的权重以及各种工具和库,但它已不再是市场上最开放的实验室,因为它从未开放过其用于训练模型的数据集或主代码库。
根据 Artificial Analysis 的数据,目前全球开放程度排名前三的模型分别来自 NVIDIA(Nemotron 3)、Allen Institute(Olmo 3)和穆罕默德 · 本 · 扎耶德人工智能大学(MBZUAI,K2-V2)。

因此,DeepSeek 的模型不再是开放模型中能力最强的,不再是最便宜的,甚至也不再是最开放的。那么,是否还有一个充分的理由,让我们继续给予这个曾经震惊世界的实验室超乎寻常的关注?
是的,我认为有。但不是因为它的模型或技术进步,而是因为其内部的激励机制和商业模式。更确切地说,我们应该关注 DeepSeek,因为它没有商业模式——在中国、美国及其他地区的所有前沿实验室中,这是一个独特且反直觉的特性,而非缺陷。
01 自筹资金支撑的 AGI 梦想
早在 DeepSeek 迎来其 " 高光时刻 " 并成为家喻户晓的名字之前的几周,我首次撰写关于 DeepSeek 的文章时(当时也在 ChinaTalk 播客上讨论过),就提到了这种 " 无商业模式优势 "。值得注意的是,当整个 AI 世界都被资本淹没时,这种优势竟表现得如此顽固且持久。
梁文锋没有筹集任何外部资金。该实验室确实通过其 API 服务产生一些收入,但仍在不断降低定价。梁文锋满足于用他的量化基金——幻方量化的收益来资助 DeepSeek 的研发,正是幻方量化最初孵化了 DeepSeek。需要明确的是,梁文锋在 2023 年 ChatGPT 推出几个月后想要创办 DeepSeek 时,确实曾尝试从中国投资者那里筹集风险投资。但他那 " 笃信 AGI(AGI-pilled)" 的理想主义,加上缺乏商业计划书,以及中国 VC 著名的短视和风险厌恶,导致了那次融资努力的失败——但这反而塞翁失马,焉知非福。
随着 2025 年的飞逝,为了不错过更多潜在的进步,越来越多的资金涌入,资助了更多的 AI 进展。每一个哪怕只有一点点牵引力的实验室都筹集了更多的钱,随之而来的是对未来商业化的更多期望。一批所谓的 "AI 新实验室 " ——由明星研究员领导的、风投支持的纯研究实验室——如雨后春笋般涌现,例如 Thinking Machines Lab(Mira Murati)、SSI(Ilya Sutskever)和 AMI Labs(Yann LeCun)。甚至连我过去常拿来与 DeepSeek 做最紧密类比的 xAI ——因为它们同样缺乏商业化的紧迫性——也屈服于外部资本的诱惑。几天前,埃隆 · 马斯克(Elon Musk)的实验室完成了一轮 200 亿美元的 E 轮融资,资金结构包含了股权和债权。
即便是世界上最富有的人之一,也无法对更多的钱说 " 不 "!与此同时,梁文锋继续自筹资金维持他那神秘的店铺和他的 AGI 梦想。当然,梁文锋的量化基金去年业绩辉煌,以 53% 的回报率创造了超过 7 亿美元的利润,这无疑提供了巨大帮助。据推测,这些利润的大部分都投入到了购买更多 GPU(尽管面临美国的出口管制,但尽其所能)和招聘人才上,以继续推动 DeepSeek 的研究路线图。尽管如此,在 DeepSeek 获得全球知名度并在 AI 行业实现 100% 的品牌认知度之后,筹集一二十亿美元以加速其步伐本应是轻而易举的事。无论你爱它还是恨它,每个人都听说过它。
然而,对外部资金说 " 不 ",让你能够掌控自己的命运。如果你的自定命运是 " 致力于让 AGI 成为现实 …… 用好奇心解开 AGI 之谜 …… 用长期主义回答本质问题 " ——这是 DeepSeek 在 HuggingFace 页面上的标语——那么用较少的资金换取完全的控制权是一个值得的权衡。当然,你也可以通过一些 " 公司治理创新 " 来达到目的。Thinking Machines Lab 就是这种情况,创始人的 1 票投票权价值比所有其他董事会成员的票数总和还多 1 票,从而实际上拥有完全控制权。但无论你在董事会层面如何 " 创新 ",一旦你接受了风险投资,为了产生风投规模的回报而进行的大规模商业化,迟早是会被期待的。
DeepSeek 没有任何这些预期。因此,它没有商业模式,也不需要商业模式。通往 AGI 的道路需要算力、人才,以及相当剂量的良好研究品味。没人规定它必须需要一个商业模式。
02 钱多麻烦多,没钱没烦恼
当然,筹集更多资金最常见的理由是为了购买更多的算力来支持研究。然而,并不显见的是,要产出好的研究成果,更多的算力总是必要的。
这一洞察并非 DeepSeek 那独特的自筹资金架构所独有。Ilya Sutskever,这位可以说是拥有最佳研究品味的 AI 研究员,也表示同意。他在 Dwarkesh 播客中用自己的话说道:
" 算力规模已经足够大,以至于并不显见你需要那么多额外的算力来证明某个想法。我给你打个比方。AlexNet 是建立在两块 GPU 上的。那是用于它的总算力。Transformer 是建立在 8 到 64 块 GPU 上的。2017 年没有哪篇 Transformer 论文的实验使用了超过 64 块 GPU,这相当于什么,今天的两块 GPU?ResNet 也是如此,对吧?你可以争辩说,o1 推理模型(o1 reasoning)并不是世界上最耗算力的东西。
因此,对于研究来说,你绝对需要一定量的算力,但远非显而易见的是,你需要绝对最大量的算力来进行研究。"
另一方面,通过消除外部资金的附带条件,以及 " 仅仅因为有钱就必须购买更多算力 " 的必要性,两种组织层面的优势显现出来。而 DeepSeek 两者兼备。
首先,即使资源更加有限,内部也不存在资源竞争。 这里没有官僚主义、内斗、权力斗争,也没有为了决定 GPU 是应该支持新产品发布、扩展现有流行服务的推理需求,还是分配给一个新的研究想法而进行的利益交换。在一个没有外部资金、没有商业模式的小型实验室里,良好的研究品味和新想法可以得到最大程度的支持和拥抱,即使绝对层面上的总算力是有限的。
其次,基于薪酬、津贴或团队获得的算力多少而产生的嫉妒和等级秩序更少,而这些往往是有毒的,却根植于人性之中。 你的组织瞬间变得扁平,并且可以保持扁平。伴随外部资金而来的不仅是商业模式的期望,还有估值、股票期权,以及一个高估值 AI 实验室所有的浮华装饰,无论这种估值在早期是多么没有意义。来自梦幻估值的纸面财富往往会让位于膨胀的自我价值感、嫉妒,以及被资金更雄厚的竞争对手挖角。这些浮华装饰不仅仅关乎个人财富创造,还与实验室的品牌、声望和吸引更多人才的魅力捆绑在一起。而这些装饰可能会变得相当荒谬,比如该实验室办公室健身房里那些印有 "Thinking Machines" 品牌的杠铃片:

DeepSeek 有自己的健身房吗?我不知道。可能有。但我很确定它没有印着品牌的杠铃片。Ilya Sutskever 是否希望他能像梁文锋一样自筹资金来运营 SSI(迄今已筹集 30 亿美元)?可能吧。他可能拥有最好的直觉和研究品味,但他无法阻止挖角者——甚至他的联合创始人 CEO 也被 Meta 财力更雄厚的扎克伯格挖走了。这并不是说 DeepSeek 对挖角免疫。其明星研究员之一罗福莉,现在正领导着财力更雄厚的雷军旗下小米的 AI 工作。
在一个被金钱淹没的行业,以及金钱总是带来的阴谋和戏剧性中,DeepSeek 因零外部资金而导致的商业模式缺失,是其唯一持久优势的源泉:为服务于 AGI 研究而实现的内部最大化对齐,别无其他。
我甚至不确定我是否相信 AGI。但作为一名投资者和资本家,我很乐意进入 DeepSeek 的股东名册。话虽如此,如果 DeepSeek 曾经让我或任何外部投资者进入,那么让 DeepSeek 之所以成为 DeepSeek 的特质,将彻底毁掉,不复存在。


登录后才可以发布评论哦
打开小程序可以发布评论哦