硬AI 1小时前
没有商业模式,是DeepSeek最坚固的“护城河”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

在即将到来的 1 月 27 日——也就是 "DeepSeek 时刻 " 一周年之际,全球 AI 社区都期待 DeepSeek 再来个大招。

市场喧嚣期待之时,知名科技评论作者 Kevin Xu 发布长文对 DeepSeek 的商业模式、护城河进行了分析,在 AI 圈内引起了很大反响。

他认为,DeepSeek 最坚固的护城河,是它零外部融资、无商业化压力的独特模式。在全球 AI 巨头都被资本裹挟着必须赚钱的时候,DeepSeek 是唯一一个可以不计成本、不看脸色、只为 AGI 梦想狂奔的 " 自由人 "。

Kevin S. Xu(徐凯文)是专注中美科技与资本交叉领域的独立观察者,知名科技评论人。他创办的 ChinaTalk 播客及 Newsletter 在专业圈层颇具影响力,擅长从资本流向、组织行为与地缘政治多维度解构技术演进逻辑。

我们给大家梳理了一下文章要点:

给市场预期泼盆冷水

:虽然大家都在等 DeepSeek 的新模型,但作者直言 " 不要指望它能像去年那样再次震惊世界 "。因为现在的市场已经被 " 开源模型 " 喂饱了,DeepSeek 虽然打响了第一枪,但现在并不是唯一、也不是最开源的玩家了(比如它至今没开源数据集)。

唯一的 " 零融资 " 异类

:现在的 AI 圈就是 " 销金窟 ",连马斯克都没扛住,最近也给 xAI 融了一笔高达 200 亿美元的巨资。但 DeepSeek 的老板梁文锋至今坚持 " 零外部融资 ",这在所有顶尖实验室里是独一份的,他把控制权看得比钱重。

超级 " 印钞机 " 兜底

:梁文锋能这么硬气,是因为他背后的量化基金 " 幻方量化 " 太赚钱了。去年,幻方以 53% 的回报率赚了超 7 亿美元(约 50 亿人民币)的利润。梁文锋直接把这些钱拿来买显卡、招人,这种用 " 老钱 " 养 " 新梦 " 的模式,让他完全不需要看投资人的脸色。

被 VC 拒绝反而是福报

:2023 年 DeepSeek 刚成立时其实找过融资,但当时国内 VC 普遍短视、不敢投,结果这反而成了 " 塞翁失马 "。作者认为,一旦拿了 VC 的钱,就必须背上商业化 KPI,动作就会变形,而现在的 DeepSeek 只需要对技术负责,不需要对财报负责。

" 钱多 " 麻烦多

:这是一个非常深刻的洞察——钱太多会滋生 " 大公司病 "。作者举了个很讽刺的例子:有些富得流油的实验室(比如 Thinking Machines),甚至在办公室健身房里用上了 印着自家 Logo 的定制杠铃片 。这种浮夸的排场背后,是员工盯着期权带来的 " 纸面富贵 ",部门之间为了争夺算力资源搞 " 宫斗 "。而 DeepSeek 因为没有外部估值,团队极度扁平,没有资源内耗。

算力不是万能药

:文章引用了前 OpenAI 大神 Ilya Sutskever 的观点—— 真正的颠覆性创新往往不需要无限堆算力 。Transformer 架构当年只用了 8 到 64 张卡就跑出来了。钱太多反而会让团队变懒,以为堆算力就能解决一切,从而失去了 " 科研品味 "。

投资人的终极悖论

:最后,作者站在一位投资人的角度发出了一声叹息——作为一个投资人,他做梦都想投 DeepSeek;但他心里也清楚, 一旦 DeepSeek 接受了外部投资,那种纯粹的特质就会消失了

作者原文如下(由 AI 翻译):

没有商业模式:DeepSeek 的长期优势

随着 1 月 27 日 "DeepSeek 时刻(DeepSeek Moment)" 一周年纪念日的临近,市场对于 DeepSeek 在农历新年(2 月 17 日)前发布一款更强大新模型的期待正日益高涨。

然而,过高的期望几乎注定会带来失望。虽然我也急切地等待着这款新模型,想看看 DeepSeek 究竟在忙些什么,但我并不预期它会像一年前那样再次震惊市场。整个 AI 行业乃至更广泛的市场,已经习惯了每隔一两个月就有一款新的 " 开放权重 " 模型发布,尤其是来自中国实验室的模型,它们即便算不上最尖端,也往往表现扎实。凭借着开放和免费的特性,这些模型正以一种无法追踪和溯源的方式在各地获得牵引力——这也是开源技术整体上的一种美德(或者说是缺陷)。正如英伟达 CEO 黄仁勋喜欢说的那样,以 Token 生成量计算,世界上最大的 AI 仍然是 OpenAI,但第二大的,是开源 AI。

DeepSeek 或许在去年通过发布 V3 和 R1 打响了 MIT License 许可的开源模型的第一枪,但其他实验室迅速跟进,从同样来自中国的竞争对手阿里巴巴及其 Qwen(通义千问)模型系列,到 OpenAI 推出的 gpt-oss 模型。(两者均使用 Apache 2.0 许可,这是另一种常见的开源宽松许可。)正如我之前指出的,如果不是因为 DeepSeek,OpenAI 可能永远不会感受到压力,从而去兑现其开源根源的承诺,哪怕只是口头上的,比如发布 gpt-oss。虽然 DeepSeek 继续开源其模型的权重以及各种工具和库,但它已不再是市场上最开放的实验室,因为它从未开放过其用于训练模型的数据集或主代码库。

根据 Artificial Analysis 的数据,目前全球开放程度排名前三的模型分别来自 NVIDIA(Nemotron 3)、Allen Institute(Olmo 3)和穆罕默德 · 本 · 扎耶德人工智能大学(MBZUAI,K2-V2)。

因此,DeepSeek 的模型不再是开放模型中能力最强的,不再是最便宜的,甚至也不再是最开放的。那么,是否还有一个充分的理由,让我们继续给予这个曾经震惊世界的实验室超乎寻常的关注?

是的,我认为有。但不是因为它的模型或技术进步,而是因为其内部的激励机制和商业模式。更确切地说,我们应该关注 DeepSeek,因为它没有商业模式——在中国、美国及其他地区的所有前沿实验室中,这是一个独特且反直觉的特性,而非缺陷。

01 自筹资金支撑的 AGI 梦想

早在 DeepSeek 迎来其 " 高光时刻 " 并成为家喻户晓的名字之前的几周,我首次撰写关于 DeepSeek 的文章时(当时也在 ChinaTalk 播客上讨论过),就提到了这种 " 无商业模式优势 "。值得注意的是,当整个 AI 世界都被资本淹没时,这种优势竟表现得如此顽固且持久。

梁文锋没有筹集任何外部资金。该实验室确实通过其 API 服务产生一些收入,但仍在不断降低定价。梁文锋满足于用他的量化基金——幻方量化的收益来资助 DeepSeek 的研发,正是幻方量化最初孵化了 DeepSeek。需要明确的是,梁文锋在 2023 年 ChatGPT 推出几个月后想要创办 DeepSeek 时,确实曾尝试从中国投资者那里筹集风险投资。但他那 " 笃信 AGI(AGI-pilled)" 的理想主义,加上缺乏商业计划书,以及中国 VC 著名的短视和风险厌恶,导致了那次融资努力的失败——但这反而塞翁失马,焉知非福。

随着 2025 年的飞逝,为了不错过更多潜在的进步,越来越多的资金涌入,资助了更多的 AI 进展。每一个哪怕只有一点点牵引力的实验室都筹集了更多的钱,随之而来的是对未来商业化的更多期望。一批所谓的 "AI 新实验室 " ——由明星研究员领导的、风投支持的纯研究实验室——如雨后春笋般涌现,例如 Thinking Machines Lab(Mira Murati)、SSI(Ilya Sutskever)和 AMI Labs(Yann LeCun)。甚至连我过去常拿来与 DeepSeek 做最紧密类比的 xAI ——因为它们同样缺乏商业化的紧迫性——也屈服于外部资本的诱惑。几天前,埃隆 · 马斯克(Elon Musk)的实验室完成了一轮 200 亿美元的 E 轮融资,资金结构包含了股权和债权。

即便是世界上最富有的人之一,也无法对更多的钱说 " 不 "!与此同时,梁文锋继续自筹资金维持他那神秘的店铺和他的 AGI 梦想。当然,梁文锋的量化基金去年业绩辉煌,以 53% 的回报率创造了超过 7 亿美元的利润,这无疑提供了巨大帮助。据推测,这些利润的大部分都投入到了购买更多 GPU(尽管面临美国的出口管制,但尽其所能)和招聘人才上,以继续推动 DeepSeek 的研究路线图。尽管如此,在 DeepSeek 获得全球知名度并在 AI 行业实现 100% 的品牌认知度之后,筹集一二十亿美元以加速其步伐本应是轻而易举的事。无论你爱它还是恨它,每个人都听说过它。

然而,对外部资金说 " 不 ",让你能够掌控自己的命运。如果你的自定命运是 " 致力于让 AGI 成为现实 …… 用好奇心解开 AGI 之谜 …… 用长期主义回答本质问题 " ——这是 DeepSeek 在 HuggingFace 页面上的标语——那么用较少的资金换取完全的控制权是一个值得的权衡。当然,你也可以通过一些 " 公司治理创新 " 来达到目的。Thinking Machines Lab 就是这种情况,创始人的 1 票投票权价值比所有其他董事会成员的票数总和还多 1 票,从而实际上拥有完全控制权。但无论你在董事会层面如何 " 创新 ",一旦你接受了风险投资,为了产生风投规模的回报而进行的大规模商业化,迟早是会被期待的。

DeepSeek 没有任何这些预期。因此,它没有商业模式,也不需要商业模式。通往 AGI 的道路需要算力、人才,以及相当剂量的良好研究品味。没人规定它必须需要一个商业模式。

02 钱多麻烦多,没钱没烦恼

当然,筹集更多资金最常见的理由是为了购买更多的算力来支持研究。然而,并不显见的是,要产出好的研究成果,更多的算力总是必要的。

这一洞察并非 DeepSeek 那独特的自筹资金架构所独有。Ilya Sutskever,这位可以说是拥有最佳研究品味的 AI 研究员,也表示同意。他在 Dwarkesh 播客中用自己的话说道:

" 算力规模已经足够大,以至于并不显见你需要那么多额外的算力来证明某个想法。我给你打个比方。AlexNet 是建立在两块 GPU 上的。那是用于它的总算力。Transformer 是建立在 8 到 64 块 GPU 上的。2017 年没有哪篇 Transformer 论文的实验使用了超过 64 块 GPU,这相当于什么,今天的两块 GPU?ResNet 也是如此,对吧?你可以争辩说,o1 推理模型(o1 reasoning)并不是世界上最耗算力的东西。

因此,对于研究来说,你绝对需要一定量的算力,但远非显而易见的是,你需要绝对最大量的算力来进行研究。"

另一方面,通过消除外部资金的附带条件,以及 " 仅仅因为有钱就必须购买更多算力 " 的必要性,两种组织层面的优势显现出来。而 DeepSeek 两者兼备。

首先,即使资源更加有限,内部也不存在资源竞争。 这里没有官僚主义、内斗、权力斗争,也没有为了决定 GPU 是应该支持新产品发布、扩展现有流行服务的推理需求,还是分配给一个新的研究想法而进行的利益交换。在一个没有外部资金、没有商业模式的小型实验室里,良好的研究品味和新想法可以得到最大程度的支持和拥抱,即使绝对层面上的总算力是有限的。

其次,基于薪酬、津贴或团队获得的算力多少而产生的嫉妒和等级秩序更少,而这些往往是有毒的,却根植于人性之中。 你的组织瞬间变得扁平,并且可以保持扁平。伴随外部资金而来的不仅是商业模式的期望,还有估值、股票期权,以及一个高估值 AI 实验室所有的浮华装饰,无论这种估值在早期是多么没有意义。来自梦幻估值的纸面财富往往会让位于膨胀的自我价值感、嫉妒,以及被资金更雄厚的竞争对手挖角。这些浮华装饰不仅仅关乎个人财富创造,还与实验室的品牌、声望和吸引更多人才的魅力捆绑在一起。而这些装饰可能会变得相当荒谬,比如该实验室办公室健身房里那些印有 "Thinking Machines" 品牌的杠铃片:

DeepSeek 有自己的健身房吗?我不知道。可能有。但我很确定它没有印着品牌的杠铃片。Ilya Sutskever 是否希望他能像梁文锋一样自筹资金来运营 SSI(迄今已筹集 30 亿美元)?可能吧。他可能拥有最好的直觉和研究品味,但他无法阻止挖角者——甚至他的联合创始人 CEO 也被 Meta 财力更雄厚的扎克伯格挖走了。这并不是说 DeepSeek 对挖角免疫。其明星研究员之一罗福莉,现在正领导着财力更雄厚的雷军旗下小米的 AI 工作。

在一个被金钱淹没的行业,以及金钱总是带来的阴谋和戏剧性中,DeepSeek 因零外部资金而导致的商业模式缺失,是其唯一持久优势的源泉:为服务于 AGI 研究而实现的内部最大化对齐,别无其他。

我甚至不确定我是否相信 AGI。但作为一名投资者和资本家,我很乐意进入 DeepSeek 的股东名册。话虽如此,如果 DeepSeek 曾经让我或任何外部投资者进入,那么让 DeepSeek 之所以成为 DeepSeek 的特质,将彻底毁掉,不复存在。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

融资 ai 开源 自由人 kpi
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论