DeepSeek 正在回归一家商业公司的正常发展路径。
DeepSeek 终于传出了融资消息。
据外媒报道,DeepSeek 正在寻求至少 3 亿美元的首轮外部融资,估值至少 100 亿美元。

字母榜向深度求索求证,但对方未予回应。
2025 年初 DeepSeek 爆火之后,投资人们曾密集寻找见梁文锋的机会,但 DeepSeek 长期没有开放融资窗口。
过去一年,DeepSeek 最特殊的地方,恰恰在于它不像一家典型 AI 公司。
它背后有幻方量化供血,梁文锋不急着融资,也不急着把公司推上估值、商业化和资本退出的流水线。
DeepSeek 对自己的定位,与其说是一家商业公司,不如说更像是一个完全独立于资本市场而运作的开源研究机构。
融资传闻出现后,市场马上闻风而动。投资人 估计已经把梁文锋电话打爆了, 甚至有人已经准备订机票,只为这一次能够 见到梁文锋,获得投资 DeepSeek 的机会。
然而,时间毕竟已经过去了一年,DeepSeek 自身和市场都出现了难以忽视和影响深远的变化。
过去一年,DeepSeek 当然不能说技术上已经落后。但如果和同行相比,很多同行已经做了很多 DeepSeek 没有做、或者没有做成体系的事情。
字节有豆包、有即梦、有 Seedance 视频生成模型;阿里和腾讯开始把世界模型推到台前;腾讯元宝、阿里千问都在往各自生态里嵌;智谱、MiniMax 已经登陆港股,并在二级市场上完成了新的估值重估。
资本市场的参照系也变了。
如果只看 DeepSeek 至少 100 亿美元的估值,它当然还是一家很贵的 AI 公司。
可放在今天的中国 AI 坐标系里,这个数字已经不再惊人。智谱、MiniMax 在港股高点的市值都曾突破 3000 亿港元,按部分市场口径折算,DeepSeek 的百亿美元估值只是它们的一小部分,而月之暗面这样的 " 小龙 ",最新估值已经达到了 180 亿美元。
如果这次融资三亿美元的传闻属实,那对 DeepSeek 来说,至少有两道关已经迈过去了。
第一,DeepSeek 不再视融资为畏途。
服务器、数据、算力、商业化、人才、期权,每一项都不是纯研究机构可以长期绕开的东西。
尤其是人才成本,已经比一年前高了太多。
DeepSeek 过去可以靠技术理想、开源声望和梁文锋的个人号召力凝聚一批人,但当郭达雅在字节获得近亿的年包时,作为 DeepSeek 员工,能不能用期权分到公司的发展红利,这件事就显得格外重要。
某种程度来说,期权也给梁文锋减少了压力,让员工拿走员工应得的那部分,梁文锋自己也就无需过多操心了。
第二,DeepSeek 正在回归一家商业公司的正常发展路径。
公司的归公司。研究理想可以继续存在,但公司终究需要治理结构、估值体系、薪酬激励、商业化收入和长期预算。
过去 DeepSeek 被要求每一次发布都震撼世界。现在它需要做的,反而是成为一家正常公司。
DeepSeek 的底层模型能力仍然很强。
它在模型算法、工程效率、开源路线和降低推理成本上的贡献,仍然是中国 AI 过去一年最重要的技术事件之一。R1 证明了一个小团队也可以用更少资源、更开放路线,做出世界级模型。
然而事实上,今天的 AI 竞争已经不是单点模型能力的竞争。
DeepSeek 最强的是模型本身,同行则在模型之外做了更多事情。
最明显的是产品入口。
DeepSeek 曾经是国内 AI App 增长最快的名字,但到了 2025 年下半年,豆包已经在月活规模上反超 DeepSeek。QuestMobile 的报告显示,2025 年 8 月,豆包以约 1.57 亿月活登上中国原生 AI App 月活榜首,DeepSeek 退居第二。
字节透露,截止至目前,豆包在 2026 年 3 月的全渠道月活跃用户已突破 3.31 亿,是第 2 至第 5 名产品的月活总和。
这说明一件事,模型爆红可以带来巨大的第一波流量,长期用户规模要靠产品、场景、运营和生态入口留住。
字节的优势就在这里。豆包背后有抖音、剪映、火山引擎和内容生态,即梦承接创作需求,Seedance 2.0 又把视频生成能力推到市场焦点。
DeepSeek 虽说在模型社区里有声望,而在大众产品层面,它并没有形成豆包那种持续分发和高频使用能力。
多模态也是类似问题。
DeepSeek 做过 Janus-Pro,也做过 DeepSeek-OCR,但它还没有形成一个足够稳定、完整、强势的多模态产品体系。今天的 AI 竞争越来越强调文本、图像、语音、视频、工具和 Agent 的统一体验。OpenAI、Google、Anthropic 在往这个方向走,国内的字节、阿里、腾讯也在往这个方向走。
阿里和腾讯开始押注世界模型,就是一个很典型的信号。
阿里发布 Happy Oyster,强调可互动、可演绎、可探索的 AI 数字世界;腾讯发布并开源混元 3D 世界模型 2.0,面向文字、图片、视频输入生成和模拟 3D 世界。
这些未必立刻变成成熟商业收入,但它们代表了大厂正在把 AI 能力从聊天框、代码框,往更复杂的空间、视频、游戏和内容生产场景里推。
字节则是在视频生成上持续加码。
Seedance 2.0 发布后,市场关注点已经不只是 " 能不能生成一段视频 ",而是多镜头、音画同步、叙事节奏、人物动作和生产流程。这些能力一旦和剪映、抖音、电商广告、影视制作连接起来,就会形成 DeepSeek 目前很难复制的产品闭环。
Agent 和 AI 编程也是 DeepSeek 的短板。
DeepSeek 不是没有工具调用和 agent 能力,但它还没有在开发者心智里形成类似 Claude、GPT、Kimi、MiniMax、腾讯、阿里那样明确的生产力入口。

AI 编程正在成为大模型商业化最清晰的场景,开发者会选择效果好、稳定性强的。以 OpenClaw 为例,几乎没有人会用 DeepSeek 来养龙虾,因为效果实在是不尽人意。
这就是 DeepSeek 眼下面临的真实处境。
它不是不强,而是强得不够完整。
它在模型效率上仍然有优势,但在 App 入口、多模态、视频生成、世界模型、Agent、AI 编程、企业服务和生态分发上,都被同行拉开了距离。对一家过去以 " 技术奇迹 " 被记住的公司来说,这种落差尤其刺眼。
梁文锋这次融资,不能只理解成缺钱。
更准确地说,是梁文锋意识到,单靠基础模型上已经不足以支撑下一阶段竞争。
DeepSeek 需要更多,比如人才、服务器、以及一个更完整的商业生态。
DeepSeek 现在最紧迫的问题,是人才。
从 2025 年下半年开始,外界陆续看到几位核心成员离开。
参与早期大模型训练的王炳宣去了腾讯,DeepSeek-OCR 核心作者魏浩然离开,DeepSeek-R1 核心作者郭达雅去了字节。从幻方时期加入、参与 Janus-Pro 等多模态工作的阮翀,也在 2026 年 1 月官宣加入元戎启行。罗福莉也已加入小米,负责相关 AI 业务。

这是 DeepSeek 爆红之后必然要面对的市场结果。他们的核心研究员就会成为所有大厂和 AI 创业公司争夺的对象。
过去,DeepSeek 是一个理想主义团队。
它的人才吸引力来自技术挑战、开源声望、研究自由和梁文锋本人。但今天 AI 行业的人才定价已经完全不同了,顶尖的行业研究员拿到近亿年包已经成为常态。可 DeepSeek 没办法开出这样的价码。
所以对梁文锋来说,期权变得越来越重要。
DeepSeek 过去不融资,不对外定价,保持独立运作,短期看可以减少外部干扰。
但长期看,员工手里的期权很难被清晰定价。
别的公司有融资轮次、有上市预期、有二级市场价格,员工至少知道自己手里的东西大概值多少钱。
DeepSeek 如果没有外部估值,没有清晰激励体系,就很难让核心人才相信自己一定能分享到公司成长红利。
恒业资本创始合伙人江一表示,公司需要估值定价,因为大厂给人才开的不是单纯现金,而是现金加高估值期权。没有明确估值,DeepSeek 很难让员工准确判断自己手里的期权到底对应什么未来。
这也是 3 亿美元融资真正重要的地方。
它未必是为了立刻大规模烧钱。按照江一的看法,100 亿美元以下的估值对梁文锋来说是偏低。
正如文章开头提到的,如果估值过高,梁文锋自己也要背上更大的增长压力。因此,这一轮融资很可能不只是拿钱,更是给公司定价,给团队定价,也给未来的激励体系定价。
DeepSeek 早期的魅力,正来自它没有被资本市场推着走。江一提到,梁文锋本人的性格就是如此,他比较反感投资人干预公司决策。
对一个技术理想很强的创始人来说,融资意味着新的股东、新的约束、新的沟通成本,也意味着公司不可能再完全按照研究团队的节奏运转。
但这也是正常公司必须面对的代价。
公司的归公司,员工的归员工。
如果 DeepSeek 希望继续留住最顶尖的人,它就必须让团队成员看到可兑现的未来。不能只要求他们相信模型会越来越强,也要让他们相信,公司越来越值钱的时候,自己也能分到那部分发展红利。
DeepSeek 要回归正常公司,人才只是第一关。
第二关是服务稳定性。
2026 年 3 月底,DeepSeek 经历了长达 11 小时的宕机,这次宕机甚至登上热搜。模型能力再强,只要它面向海量用户和开发者提供服务,就必须接受商业化检验。服务器不稳,最简单、最直接的方法就是花钱买更多服务器,购买更多算力和冗余资源,建设更强的云服务与运维体系。
当然,工程优化、调度策略、模型压缩、缓存机制都重要。
但在高峰流量面前,很多问题最后仍然会落回资金投入。用户不会因为一家公司的训练故事足够漂亮,就能长期忍受不可用、排队过久或 API 波动。开发者也不会因为一个模型曾经震撼世界,就把核心业务压在不稳定的接口上。
好模型只是起点,稳定服务才是日常。
第三关是数据和训练成本。
江一提到,早期 DeepSeek 训练成本相对低,是因为团队在模型结构、工程效率和蒸馏等方法上做得足够极致。
但到了 V4 阶段,单轮训练成本可能已经大于 5 亿美元。
与此同时,Anthropic 等企业对蒸馏路径进行封锁之后,DeepSeek 下半年如果继续冲击第一梯队,就需要采购更多高质量数据集,训练成本会明显抬升。
DeepSeek 过去最被外界津津乐道的 " 低成本奇迹 ",不会自然延续到以后的模型里。
低成本训练证明了团队能力,但下一代基础模型仍然要面对很朴素的产业规律,即 Scaling Law。
更强模型通常需要更多高质量数据、更大规模算力、更复杂的后训练系统、更高强度的评测和安全对齐。基础模型很花钱,也很吃算力。越接近第一梯队,边际成本越高。
这还没有算上国产算力适配和合规成本。
江一提到,幻方量化去年收入不错,今年也保持较好水平,但国内围绕量化交易出现了不少监管和合规要求,相关调整本身就需要投入。
另一方面,DeepSeek 如果要适配国产算力,也需要工程团队、测试体系和长期磨合。这份投入不是一次性开支,而是持续消耗。
第四关是商业化。
过去 DeepSeek 的逻辑很清晰:开源模型制造影响力,API 收费承接开发者需求,优秀模型能力带来传播和调用。
但这套逻辑对今天的 DeepSeek 来说已经不够用了。
江一表示,梁文锋现在想给 DeepSeek 找到一个完整的商业体系,比如订阅制,以及不同档位的 API 收费。
生态不是把模型开源出去就自然长出来的,它需要稳定 API、开发者工具、企业服务、文档体系、计费体系、安全合规、客户成功和渠道合作。
DeepSeek 如果要从 0 到 1 撑起商业生态,就必须承担基础设施建设的成本。
单纯依赖开源声量和基础 API 收入,很难支撑一家具备全球影响力的基础模型公司继续向前。商业化不是背叛技术路线,而是技术路线进入长期竞争后必须补上的底座。
所以,DeepSeek 融资不是一个孤立事件。

它是服务器、数据、算力、人才、期权、商业化生态叠加在一起之后的必然结果。对于像 DeepSeek 这样,以模型能力立身的公司来说,这些事物反而比估值数字本身更关键。
也因此,DeepSeek 回到融资、估值、商业化这条 " 正常公司 " 的路径,并不是退步。
DeepSeek 回归正常,对 DeepSeek 是好事,对梁文锋也是好事。
融资不一定就代表梁文锋被资本裹挟,也可以意味着一家公司终于有能力承担更长期的竞争。
对用户和行业来说,也该告别 "DeepSeek 时刻 " 了。
真正健康的局面,应该是 DeepSeek 继续做 DeepSeek,其他模型也被看见、被比较、被承认。中国 AI 不应该永远等待一个名字再次震撼世界,而应该让很多公司在不同方向上一起往前走。
放过 DeepSeek,也放过人们自己的执念。
一家公司的成熟,常常不是从掌声最响的那一天开始,而是从掌声落下之后,它仍然愿意去修服务器、买数据、招人、谈客户、发账单、处理宕机、重写文档、把产品一点点变稳定开始。
如果 DeepSeek 真的走到这一步,它并不是失去特殊性。
它只是终于从一个被仰望的故事,回到了一家公司应该站立的地面。


登录后才可以发布评论哦
打开小程序可以发布评论哦