腾讯科技 3小时前
4000亿估值的DeepSeek,怎么花融来的500亿
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_caijing1.html

 

深度求索(DeepSeek)创始人梁文锋。图片经由 AI 处理

6 月 29 日晚,DeepSeek 宣布 V4 正式版将于 7 月中旬正式上线。

公告中说明:为了更合理地配置资源、提升服务稳定性,正式版发布后将同步调整 API 定价策略,引入峰谷定价机制。

过去两周,和 DeepSeek 相关的还有两件大事:

一是 6 月 16 日,DeepSeek 完成了成立以来首轮外部融资,募资总额 510 亿元,估值将近 4000 亿元,打破创始人梁文锋立下 " 不融资、不上市、不商业化 " 的原则。

二是融资后仅十几天,6 月 27 日,DeepSeek 团队联合北京大学发布论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》,创始人梁文锋位列论文作者名单。

如果说 DeepSeek 上半场的任务是证明自己能够做出世界一流的大模型。下半场,当 " 资本 " 和 " 技术 " 相汇,DeepSeek 要拿着融资的钱,向世界证明,它是一家真正意义上的商业公司。

01 500 亿之后,DeepSeek 开始补人

融资以来,DeepSeek Harness 团队的新负责人崔添翼一刻没闲着。

6 月 25 日晚,DeepSeek 在社交平台发布大规模招聘信息,覆盖算法、研发、运维、产品、数据工程师及职能部门等 7 大类、共 33 个岗位,工作地点包括北京和杭州,所有岗位均接受实习。

在 DeepSeek 官网官号、Boss 直聘、X 和小红书等各类社交平台上,都能看到这位梁文锋的浙大校友、今年 3 月加入团队的负责人下场招人,顺便抽空 " 辟谣 "。

图为 崔添翼在小红书上回应 "DeepSeek 招人卡清华级学历,还卡豆包经历 " 的评论

此前,DeepSeek 更像一个沉默、低调、闷声干活的技术员,背靠梁文锋创办的量化私募基金 " 幻方量化 "。幻方量化 2025 年年化收益率 56.55%,管理规模超过 700 亿元,让 DeepSeek 不需要依赖外部资本。

在外界看来,DeepSeek 似乎 " 并不缺钱 "。

让梁文锋改变融资态度的潜在可能是,核心人才流失和外部抢人大战加速。

作为参照系,已经抢先上市的 " 大模型第一股 " 智谱,截至 6 月 30 日,总市值接近万亿港元,MiniMax 的市值也超过 1300 亿港元。

反观 DeepSeek,员工手里的期权仍是一张白纸,公司不融资、不上市、没有外部估值参考。

" 不融资,它的估值就不往上走。员工手上就算有期权也不会涨。相比智谱、MiniMax,以及一些其他大模型团队,要么估值暴涨,要么上市以后暴涨。那 DeepSeek 的员工肯定都留不住。" 一位接近 DeepSeek 的资深从业者谈及在此节点融资的原因时说。

留住人才的成本,也是一笔不小的开支。

2025 年,DeepSeek 最大的竞争优势来自一支百余人的高学历的 " 天才 " 团队。几十位顶尖研究员,加上一位极具技术理想主义色彩的创始人梁文锋,创造出了 DeepSeek-R1。

今年,一边是各互联网大厂持续高薪 " 挖 " 顶级 AI 研究员,另一边,市场对 AI 人才的需求激增,公开数据显示,算法岗位月薪的中位数普遍超过 2.4 万元,头部人才月薪超过 5 万元,AI 人才的溢价持续扩大。

前程无忧《2026 届校招市场 AI 人才需求报告》

在此次大规模招聘的岗位中,除了全栈开发 / 算法、AI 核心系统研发、运维、产品之外,值得关注的是,HR、法务、财务、采购、行政等职能部门也在扩招。

全方位 " 扩编 " 释放出的信号是,DeepSeek 还在补齐作为一家科技公司的组织能力。

从 " 产品驱动 " 迈向 " 组织驱动 ",这也是许多科技公司的必经之路——在组织逐步成熟、平台不断完善、人才激励机制建立之后,大规模的产品红利才开始释放。

完成 500 亿融资,一方面是留人需要,另一方面则为补全组织架构提供了基础条件,但在这个过程中,DeepSeek 能否 " 轻盈转身 ",在扩招后仍保持 " 小团队作战 " 精简高效和决策链的灵活敏捷?这是 DeepSeek" 下半场 " 要回答的第一个问题。

02 DeepSeek 走向重资产

在 6 月 25 日发布招聘信息的 33 个岗位中,有些岗位值得关注,即 IDC(Internet Data Center 互联网数据中心)数据中心团队,涉及基础设施建设。

早在 4 月中旬,DeepSeek 就在内蒙古乌兰察布发布了首批数据中心岗位,包括数据中心高级运维工程师和数据中心高级交付经理。到了 6 月,DeepSeek 又新增了 "IDC 设计规划工程师 " 岗位。

从数据中心运维、交付,再到设计规划,今年以来,DeepSeek 的人才布局已经从模型延伸至算力基础设施建设。

图为 DeepSeek IDC 数据中心团队招聘岗位信息

伴随着大模型进入规模化训练和推理阶段,AI 模型公司的竞争即将、也必然进入 " 基础设施 " 的硬件竞赛,这推动 DeepSeek 不得不和硅谷最前沿的头部大模型公司一样,加入到自建算力集群的重资产 " 烧钱 " 游戏当中。

根据公开数据显示,美国科技巨头 Alphabet、亚马逊、Meta 和微软,预计今年将总共投资约 6500 亿美元来扩大人工智能相关基础设施。Anthropic、OpenAI 也多次在公开披露的财务文件中强调,将持续加大算力基础设施投入。

例如,Anthropic 预计仅数据中心容量租赁,每月就将向 SpaceX 支付约 12.5 亿美元,一年就是 150 亿美元,还不包括 GPU 采购、网络、运维等。

工信部信息通信经济专家委员会委员盘和林在此前采访中指出,当前 AI 投资热潮之下,大模型企业融资已是大势所趋。" 不仅是 DeepSeek,谷歌也融资 800 亿美元,行业已进入重资本阶段。"

为了不在算力重资本建设上掉队,DeepSeek 必须在资金上 " 开源 ",拿到融资,继而投入算力、数据中心等基础设施建设。

值得注意的是,DeepSeek 建设算力基础设施,是在海外先进算力出口受限的情况下进行的,这意味着上述算力将由国产芯片驱动,而在 DeepSeek V4 发布时,DeepSeek 就在官方页面和技术报告里提到国产算力的探索。

5 月底,华为提出 " 韬(τ)定律 ",试图通过器件、芯片、系统等全栈协同优化突破摩尔定律放缓带来的瓶颈;国产大模型也正加速适配国产算力,国产算力探索的目标是—— " 自主可控的 AI 基础设施 "。

03 AGI 的前夜

对于 DeepSeek 这样的基础模型公司来说,仅有资本和组织不足支持长期领先,关键是持续产出原创技术。

一位资深算力从业者亦强调,DeepSeek 本轮大规模融资,就是为了给团队激励、留下核心人才," 只有足够的融资,才能训出好模型,才能奠定头部位置。"

论文是 DeepSeek 在新技术探索方面的一个重要缩影。

据不完全统计,近两年,DeepSeek 公开发表了约 27 篇核心技术论文,研究方向覆盖 MoE(混合专家)、强化学习、代码大模型、数学推理、多模态等等,几乎对应了其每一代核心模型和关键技术突破。

就在 6 月 27 日,DeepSeek 官方在 GitHub 上低调更新了一篇与 "DSpark" 新技术有关的论文。

论文中,DeepSeek 提出全新的推理加速框架 "DSpark",在不改变模型能力的前提下,大幅提升了大模型推理速度和系统吞吐

和此前不同,这篇论文并非迭代了新模型,而是在原有 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 基础上增加了一个推测解码模块,重点在于工程落地层面的优化。

DeepSeek 意图将 DSpark 部署在 DeepSeek-V4 线上服务系统、承接真实用户流量时,减少无效校验带来的算力浪费。

论文中提及," 在不改变底层模型架构的情况下,将生成速度提高了 60-85%。" 对于每天都要处理海量 API 请求的 AI 公司而言,算力成本每降低一点,利润空间就会增加一点。

据 VentureBeat 今年 2 月份的消息,模型训练的费用只会越来越高。Anthropic 的 CEO Dario Amodei 预测,未来一代前沿模型的培训成本将达到 50 亿至 100 亿美元。

上述资深算力从业者表示,DeepSeek 也将进入同样 " 烧钱 " 训练模型的阶段。

为了支持 DeepSeek 的模型训练迭代,融资是早晚的事。

更多的媒体解读道,在融资之后仅十几天便上线新论文,DeepSeek 似乎在证明公司的核心节奏没有变,研发团队依旧保持着高频输出。

不论是上新模型还是建设数据中心,亦或是从 " 天才实验室 " 转变为商业化运营的 AI 公司,DeepSeek 进化的尽头是 AGI。

在 2024 年接受《暗涌 Waves》采访时,梁文锋就明确表态:‌" 我们做的就是 AGI(通用人工智能)。语言大模型可能是通往 AGI 的必经之路。"

在免费阶段,用户对响应失败、对话中断、API 限流等问题尚可容忍。一旦 7 月 DeepSeek V4 正式版上线后,用户对稳定性的要求也随之提高,问题若持续存在,将直接影响用户是否愿意将 DeepSeek 接入真实工作流和业务系统。

来到付费端、开发者生态和企业场景,DeepSeek 的工程能力将面临更严格的考验,模型能否真正走向大规模应用,也是进入 AGI 时代必须跨越的一道槛。

当用户希望 DeepSeek 推动中国大模型降本增效时,它自己心里还算着一笔账:正处于 AGI 的关键时期,首要目的是留住人,其次是要持续训练模型、不断在技术层面迭代出新,数据中心的基础设施 " 仗 " 也不能输。

光靠梁文锋的量化私募基金幻方量化,还远远不够。

2026 年,DeepSeek 启动融资是必然的选择。正如 DeepSeek 于 6 月 25 日晚发布的招聘公告写道:

" 当今人类正处于 AGI 的前夜。"

下一步,DeepSeek 要面对的是更长期、更烧钱的 AGI 竞赛。能否像在 " 大模型 " 竞赛中出圈一样,继续在 AGI 的进程中 " 领跑 ",这是 DeepSeek" 下半场 " 要回答的第二个问题。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

北京大学 融资 创始人 社交平台 年化收益率
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论