梁文锋想通了

DeepSeek 正在回归一家商业公司的正常发展路径。

DeepSeek 终于传出了融资消息。

据外媒报道，DeepSeek 正在寻求至少 3 亿美元的首轮外部融资，估值至少 100 亿美元。

字母榜向深度求索求证，但对方未予回应。

2025 年初 DeepSeek 爆火之后，投资人们曾密集寻找见梁文锋的机会，但 DeepSeek 长期没有开放融资窗口。

过去一年，DeepSeek 最特殊的地方，恰恰在于它不像一家典型 AI 公司。

它背后有幻方量化供血，梁文锋不急着融资，也不急着把公司推上估值、商业化和资本退出的流水线。

DeepSeek 对自己的定位，与其说是一家商业公司，不如说更像是一个完全独立于资本市场而运作的开源研究机构。

融资传闻出现后，市场马上闻风而动。投资人估计已经把梁文锋电话打爆了，甚至有人已经准备订机票，只为这一次能够见到梁文锋，获得投资 DeepSeek 的机会。

然而，时间毕竟已经过去了一年，DeepSeek 自身和市场都出现了难以忽视和影响深远的变化。

过去一年，DeepSeek 当然不能说技术上已经落后。但如果和同行相比，很多同行已经做了很多 DeepSeek 没有做、或者没有做成体系的事情。

字节有豆包、有即梦、有 Seedance 视频生成模型；阿里和腾讯开始把世界模型推到台前；腾讯元宝、阿里千问都在往各自生态里嵌；智谱、MiniMax 已经登陆港股，并在二级市场上完成了新的估值重估。

资本市场的参照系也变了。

如果只看 DeepSeek 至少 100 亿美元的估值，它当然还是一家很贵的 AI 公司。

可放在今天的中国 AI 坐标系里，这个数字已经不再惊人。智谱、MiniMax 在港股高点的市值都曾突破 3000 亿港元，按部分市场口径折算，DeepSeek 的百亿美元估值只是它们的一小部分，而月之暗面这样的 " 小龙 "，最新估值已经达到了 180 亿美元。

如果这次融资三亿美元的传闻属实，那对 DeepSeek 来说，至少有两道关已经迈过去了。

第一，DeepSeek 不再视融资为畏途。

服务器、数据、算力、商业化、人才、期权，每一项都不是纯研究机构可以长期绕开的东西。

尤其是人才成本，已经比一年前高了太多。

DeepSeek 过去可以靠技术理想、开源声望和梁文锋的个人号召力凝聚一批人，但当郭达雅在字节获得近亿的年包时，作为 DeepSeek 员工，能不能用期权分到公司的发展红利，这件事就显得格外重要。

某种程度来说，期权也给梁文锋减少了压力，让员工拿走员工应得的那部分，梁文锋自己也就无需过多操心了。

第二，DeepSeek 正在回归一家商业公司的正常发展路径。

公司的归公司。研究理想可以继续存在，但公司终究需要治理结构、估值体系、薪酬激励、商业化收入和长期预算。

过去 DeepSeek 被要求每一次发布都震撼世界。现在它需要做的，反而是成为一家正常公司。

DeepSeek 的底层模型能力仍然很强。

它在模型算法、工程效率、开源路线和降低推理成本上的贡献，仍然是中国 AI 过去一年最重要的技术事件之一。R1 证明了一个小团队也可以用更少资源、更开放路线，做出世界级模型。

然而事实上，今天的 AI 竞争已经不是单点模型能力的竞争。

DeepSeek 最强的是模型本身，同行则在模型之外做了更多事情。

最明显的是产品入口。

DeepSeek 曾经是国内 AI App 增长最快的名字，但到了 2025 年下半年，豆包已经在月活规模上反超 DeepSeek。QuestMobile 的报告显示，2025 年 8 月，豆包以约 1.57 亿月活登上中国原生 AI App 月活榜首，DeepSeek 退居第二。

字节透露，截止至目前，豆包在 2026 年 3 月的全渠道月活跃用户已突破 3.31 亿，是第 2 至第 5 名产品的月活总和。

这说明一件事，模型爆红可以带来巨大的第一波流量，长期用户规模要靠产品、场景、运营和生态入口留住。

字节的优势就在这里。豆包背后有抖音、剪映、火山引擎和内容生态，即梦承接创作需求，Seedance 2.0 又把视频生成能力推到市场焦点。

DeepSeek 虽说在模型社区里有声望，而在大众产品层面，它并没有形成豆包那种持续分发和高频使用能力。

多模态也是类似问题。

DeepSeek 做过 Janus-Pro，也做过 DeepSeek-OCR，但它还没有形成一个足够稳定、完整、强势的多模态产品体系。今天的 AI 竞争越来越强调文本、图像、语音、视频、工具和 Agent 的统一体验。OpenAI、Google、Anthropic 在往这个方向走，国内的字节、阿里、腾讯也在往这个方向走。

阿里和腾讯开始押注世界模型，就是一个很典型的信号。

阿里发布 Happy Oyster，强调可互动、可演绎、可探索的 AI 数字世界；腾讯发布并开源混元 3D 世界模型 2.0，面向文字、图片、视频输入生成和模拟 3D 世界。

这些未必立刻变成成熟商业收入，但它们代表了大厂正在把 AI 能力从聊天框、代码框，往更复杂的空间、视频、游戏和内容生产场景里推。

字节则是在视频生成上持续加码。

Seedance 2.0 发布后，市场关注点已经不只是 " 能不能生成一段视频 "，而是多镜头、音画同步、叙事节奏、人物动作和生产流程。这些能力一旦和剪映、抖音、电商广告、影视制作连接起来，就会形成 DeepSeek 目前很难复制的产品闭环。

Agent 和 AI 编程也是 DeepSeek 的短板。

DeepSeek 不是没有工具调用和 agent 能力，但它还没有在开发者心智里形成类似 Claude、GPT、Kimi、MiniMax、腾讯、阿里那样明确的生产力入口。

AI 编程正在成为大模型商业化最清晰的场景，开发者会选择效果好、稳定性强的。以 OpenClaw 为例，几乎没有人会用 DeepSeek 来养龙虾，因为效果实在是不尽人意。

这就是 DeepSeek 眼下面临的真实处境。

它不是不强，而是强得不够完整。

它在模型效率上仍然有优势，但在 App 入口、多模态、视频生成、世界模型、Agent、AI 编程、企业服务和生态分发上，都被同行拉开了距离。对一家过去以 " 技术奇迹 " 被记住的公司来说，这种落差尤其刺眼。

梁文锋这次融资，不能只理解成缺钱。

更准确地说，是梁文锋意识到，单靠基础模型上已经不足以支撑下一阶段竞争。

DeepSeek 需要更多，比如人才、服务器、以及一个更完整的商业生态。

DeepSeek 现在最紧迫的问题，是人才。

从 2025 年下半年开始，外界陆续看到几位核心成员离开。

参与早期大模型训练的王炳宣去了腾讯，DeepSeek-OCR 核心作者魏浩然离开，DeepSeek-R1 核心作者郭达雅去了字节。从幻方时期加入、参与 Janus-Pro 等多模态工作的阮翀，也在 2026 年 1 月官宣加入元戎启行。罗福莉也已加入小米，负责相关 AI 业务。

这是 DeepSeek 爆红之后必然要面对的市场结果。他们的核心研究员就会成为所有大厂和 AI 创业公司争夺的对象。

过去，DeepSeek 是一个理想主义团队。

它的人才吸引力来自技术挑战、开源声望、研究自由和梁文锋本人。但今天 AI 行业的人才定价已经完全不同了，顶尖的行业研究员拿到近亿年包已经成为常态。可 DeepSeek 没办法开出这样的价码。

所以对梁文锋来说，期权变得越来越重要。

DeepSeek 过去不融资，不对外定价，保持独立运作，短期看可以减少外部干扰。

但长期看，员工手里的期权很难被清晰定价。

别的公司有融资轮次、有上市预期、有二级市场价格，员工至少知道自己手里的东西大概值多少钱。

DeepSeek 如果没有外部估值，没有清晰激励体系，就很难让核心人才相信自己一定能分享到公司成长红利。

恒业资本创始合伙人江一表示，公司需要估值定价，因为大厂给人才开的不是单纯现金，而是现金加高估值期权。没有明确估值，DeepSeek 很难让员工准确判断自己手里的期权到底对应什么未来。

这也是 3 亿美元融资真正重要的地方。

它未必是为了立刻大规模烧钱。按照江一的看法，100 亿美元以下的估值对梁文锋来说是偏低。

正如文章开头提到的，如果估值过高，梁文锋自己也要背上更大的增长压力。因此，这一轮融资很可能不只是拿钱，更是给公司定价，给团队定价，也给未来的激励体系定价。

DeepSeek 早期的魅力，正来自它没有被资本市场推着走。江一提到，梁文锋本人的性格就是如此，他比较反感投资人干预公司决策。

对一个技术理想很强的创始人来说，融资意味着新的股东、新的约束、新的沟通成本，也意味着公司不可能再完全按照研究团队的节奏运转。

但这也是正常公司必须面对的代价。

公司的归公司，员工的归员工。

如果 DeepSeek 希望继续留住最顶尖的人，它就必须让团队成员看到可兑现的未来。不能只要求他们相信模型会越来越强，也要让他们相信，公司越来越值钱的时候，自己也能分到那部分发展红利。

DeepSeek 要回归正常公司，人才只是第一关。

第二关是服务稳定性。

2026 年 3 月底，DeepSeek 经历了长达 11 小时的宕机，这次宕机甚至登上热搜。模型能力再强，只要它面向海量用户和开发者提供服务，就必须接受商业化检验。服务器不稳，最简单、最直接的方法就是花钱买更多服务器，购买更多算力和冗余资源，建设更强的云服务与运维体系。

当然，工程优化、调度策略、模型压缩、缓存机制都重要。

但在高峰流量面前，很多问题最后仍然会落回资金投入。用户不会因为一家公司的训练故事足够漂亮，就能长期忍受不可用、排队过久或 API 波动。开发者也不会因为一个模型曾经震撼世界，就把核心业务压在不稳定的接口上。

好模型只是起点，稳定服务才是日常。

第三关是数据和训练成本。

江一提到，早期 DeepSeek 训练成本相对低，是因为团队在模型结构、工程效率和蒸馏等方法上做得足够极致。

但到了 V4 阶段，单轮训练成本可能已经大于 5 亿美元。

与此同时，Anthropic 等企业对蒸馏路径进行封锁之后，DeepSeek 下半年如果继续冲击第一梯队，就需要采购更多高质量数据集，训练成本会明显抬升。

DeepSeek 过去最被外界津津乐道的 " 低成本奇迹 "，不会自然延续到以后的模型里。

低成本训练证明了团队能力，但下一代基础模型仍然要面对很朴素的产业规律，即 Scaling Law。

更强模型通常需要更多高质量数据、更大规模算力、更复杂的后训练系统、更高强度的评测和安全对齐。基础模型很花钱，也很吃算力。越接近第一梯队，边际成本越高。

这还没有算上国产算力适配和合规成本。

江一提到，幻方量化去年收入不错，今年也保持较好水平，但国内围绕量化交易出现了不少监管和合规要求，相关调整本身就需要投入。

另一方面，DeepSeek 如果要适配国产算力，也需要工程团队、测试体系和长期磨合。这份投入不是一次性开支，而是持续消耗。

第四关是商业化。

过去 DeepSeek 的逻辑很清晰：开源模型制造影响力，API 收费承接开发者需求，优秀模型能力带来传播和调用。

但这套逻辑对今天的 DeepSeek 来说已经不够用了。

江一表示，梁文锋现在想给 DeepSeek 找到一个完整的商业体系，比如订阅制，以及不同档位的 API 收费。

生态不是把模型开源出去就自然长出来的，它需要稳定 API、开发者工具、企业服务、文档体系、计费体系、安全合规、客户成功和渠道合作。

DeepSeek 如果要从 0 到 1 撑起商业生态，就必须承担基础设施建设的成本。

单纯依赖开源声量和基础 API 收入，很难支撑一家具备全球影响力的基础模型公司继续向前。商业化不是背叛技术路线，而是技术路线进入长期竞争后必须补上的底座。

所以，DeepSeek 融资不是一个孤立事件。

它是服务器、数据、算力、人才、期权、商业化生态叠加在一起之后的必然结果。对于像 DeepSeek 这样，以模型能力立身的公司来说，这些事物反而比估值数字本身更关键。

也因此，DeepSeek 回到融资、估值、商业化这条 " 正常公司 " 的路径，并不是退步。

DeepSeek 回归正常，对 DeepSeek 是好事，对梁文锋也是好事。

融资不一定就代表梁文锋被资本裹挟，也可以意味着一家公司终于有能力承担更长期的竞争。

对用户和行业来说，也该告别 "DeepSeek 时刻 " 了。

真正健康的局面，应该是 DeepSeek 继续做 DeepSeek，其他模型也被看见、被比较、被承认。中国 AI 不应该永远等待一个名字再次震撼世界，而应该让很多公司在不同方向上一起往前走。

放过 DeepSeek，也放过人们自己的执念。

一家公司的成熟，常常不是从掌声最响的那一天开始，而是从掌声落下之后，它仍然愿意去修服务器、买数据、招人、谈客户、发账单、处理宕机、重写文档、把产品一点点变稳定开始。

如果 DeepSeek 真的走到这一步，它并不是失去特殊性。

它只是终于从一个被仰望的故事，回到了一家公司应该站立的地面。

宙世代

一起剪