创始人为高考状元,还管理百亿基金。
当全球资本市场还在讨论 OpenAI、Anthropic 与 xAI 的估值泡沫时,中国 AI 公司 DeepSeek,已经用一笔超过 70 亿美元的融资,把中国大模型产业推向了新的估值阶段。
6 月 16 日,多家媒体报道,DeepSeek 已完成首轮外部融资,总融资规模超过 500 亿元人民币(约 74 亿美元),公司估值突破 500 亿美元。这不仅是中国 AI 行业迄今最大规模的私募融资之一,也意味着 DeepSeek 正式成为中国估值最高的 AI 创业公司。
除了融资金额外,让资本市场侧目的,还有创始人梁文锋精心设计的交易架构。外部投资者资金须注入由其管理的有限合伙企业,而非直接投向 DeepSeek 主体;所有投资方股权设有五年锁定期,锁定期内不得转让;除国家人工智能产业投资基金外,外部投资方不享有公司投票权。
这套被业界称为 " 三重保险 " 的控制权防守术,让梁文锋在端出 500 亿资本盛宴之后,依然把公司的方向盘死死握在自己手里。
DeepSeek 的融资历程本身就是一部估值飙升的教科书。
2023 年 7 月,DeepSeek 正式成立,由量化私募巨头幻方量化孵化。创始人梁文锋从第一天起就划下一条清晰的红线:不接受外部融资,不稀释股权,不被任何人的商业化时间表绑架。
长达近三年时间,DeepSeek 坚持零外部股权融资原则,研发、算力采购、人才薪酬等成本均由母公司幻方量化自有经营收益全额承担。
这一 " 零融资 " 模式的成果在 2025 年初迎来爆发。1 月 20 日,DeepSeek 正式发布 R1 模型,并同步开源模型权重。该模型在数学、代码、自然语言推理等任务上性能比肩 OpenAI 的 o1 大模型正式版,训练成本却仅为 557.6 万美元。R1 的发布引爆全球市场,DeepSeek 一举登顶中美两国应用商店榜首。
但算力成本持续攀升、顶尖人才竞争加剧,过去那套依靠内部资源、保持研究驱动的模式越来越难以持续。
2026 年 4 月 17 日,"The Information" 率先曝光 DeepSeek 正启动首次外部融资,计划以超 100 亿美元估值募集至少 3 亿美元。
仅 5 天后,腾讯、阿里等巨头据传已进入投资洽谈,估值迅速攀升至超 200 亿美元。5 月初,国家集成电路产业投资基金(国家大基金)被报道正在洽谈领投,估值跳升至约 450 亿美元。6 月 3 日,融资接近完成的消息传出,投后估值最高触及 590 亿美元。
从 4 月 17 日首次传出的 100 亿美元,到最高 590 亿美元,再到 6 月 16 日正式确认的 500 亿美元。整整两个月,DeepSeek 估值翻了近五倍。
并且根据披露,本轮融资采用了极为少见的 " 有限合伙控制结构 ",即投资者并非直接持有 DeepSeek 股权,而是投资进入由创始人梁文锋控制的有限合伙平台;多数投资者不拥有投票权,同时需要接受长达五年的锁定期。
换句话说。DeepSeek 在融资后,依然高度掌握在创始团队手中。
即便如此,DeepSeek 依然十分抢手,本轮出资方阵容横跨互联网巨头、产业资本与知名投资机构。
梁文锋作为创始人个人出资约 200 亿元,为本轮最大单一出资方。这一数字背后是幻方量化的强大现金流支撑,幻方量化巅峰时期资产管理规模突破 700 亿元,据 " 私募排排网 " 数据显示,其 2025 年产品平均收益率达 56.55%,位列行业第二。按 700 亿管理规模、1% 管理费加 20% 业绩提成估算,年收入约 50 亿元。
其次为腾讯出资约 100 亿元。腾讯几乎投资了全部 AI 五强(DeepSeek、智谱、Kimi、MiniMax、阶跃星辰),此次在 DeepSeek 上同样押下重注。
宁德时代体系出资约 50 亿元,包括宁德时代及溥泉资本。还有网易、京东、Monolith 砺思资本、IDG 资本均分别出资约 30 亿元。正心谷投资、拾象科技分别出资约 15 亿元。
国家人工智能产业投资基金则是一个特殊的存在,其出资约 10 亿元,是唯一例外,可以直接注资 DeepSeek 主体,不受锁定期约束,并享有公司投票权。
值得注意的是,此前被传参与洽谈的阿里巴巴最终缺席。据 " 财闻 " 报道,有阿里内部人士表示 " 双方合作没谈拢 "。阿里巴巴希望将 DeepSeek 的技术深度接入其生态(如淘宝、高德、支付宝等),实现从云服务到模型的全链条协同。为此,阿里巴巴在谈判中要求获取相当比例的股权以及董事会决策权。
这与梁文锋对控制权的坚持形成根本冲突。最终从名单来看,阿里巴巴未能进入股东名单。
本轮融资完成后,DeepSeek 估值已升至约 500 亿美元。
这一估值水平已接近部分国际头部 AI 创业公司。作为对比,今年以来,美国 AI 公司 OpenAI、Anthropic、xAI 等均持续推进大规模融资。其中,Anthropic 在今年新一轮融资后估值达到约 615 亿美元。
从宣称不接受外部融资到获得 AI 行业迄今最大规模的私募融资,这一节奏变化背后,一个直接原因是行业资金需求正在快速上升。
目前,全球主要 AI 公司均在扩大资本支出。
OpenAI 持续推进数据中心建设;Anthropic 获得亚马逊和谷歌投资;马斯克旗下 xAI 则正在建设超级算力中心。公开数据显示,仅训练下一代大模型所需的 GPU、数据中心和电力投入,就已经进入百亿美元级别。
国内 AI 行业也在同步进入高投入阶段。
今年以来,包括阿里、腾讯、百度等互联网平台持续增加 AI 基础设施支出,多地智算中心项目密集启动。工信部此前披露的数据显示,国内智能算力规模近两年保持高速增长。
在这一背景下,DeepSeek 开始对外融资,被认为与算力扩张需求直接相关。
根据报道,DeepSeek 本轮融资的主要用途包括增强算力能力、扩大研发团队以及改善员工激励体系。
DeepSeek 目前作为行业头部有极高的关注度,但作为非公众公司,也有着极高的神秘度,营收体量、盈利情况等我们还不得而知。
但 DeepSeek 之所以受到行业追捧,与其商业模式的特殊性有着分不开的关系。
与 OpenAI 等闭源大模型厂商不同,DeepSeek 将模型权重向全球开发者开源,遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。但商业化的核心路径并非出售模型本身,而是通过 API 按量付费和企业订阅两种方式向 B 端客户提供服务。
API 调用服务是指开发者和企业按 Token 用量付费,这是最核心的收入来源。据 DeepSeek 官网显示,2025 年 1 月时,API 的定价每百万输入 tokens 1 元(缓存命中)/4 元(缓存未命中),每百万输出 tokens 16 元。这个收费相当于当时 Open AI o1 运行成本的约三十分之一。
事实上,AI 成本的下降是让 DeepSeek 能够从诸多大模型中脱颖而出的重要原因。DeepSeek 也因此被迅速冠以 "AI 界拼多多 " 之称。
" 在成本方面,DeepSeek 以较低的成本实现了高性能的 AI 模型,这使得其在市场竞争中具备了显著的优势。据相关报道,DeepSeek 仅用 OpenAI o1 模型 3%-5% 的成本就达到了同等性能,这种成本效益比无疑会吸引大量企业和个人用户选择其产品和服务。" 北京社科院副研究员王鹏表示。
"DeepSeek-V3 训练成本低,主要是因为它用了一些聪明的方法,比如只激活模型里需要的那部分,还有用更少的计算精度但不影响结果。具体策略包括,减少数据量,降低内存;精选数据,高效训练;知识蒸馏,加速学习。这样,它就可以用更少的电脑和时间来训练。在实际中,DeepSeek-V3 可以用于聊天机器人、教育辅导、自动化工作等很多场景。" 深度科技研究院院长张孝荣表示。
2025 年 3 月,DeepSeek 首次公布 V3/R1 推理系统的商业化数据。
根据官方披露,若所有 Token 的输入和输出全部按照 DeepSeek-R1 的定价计算,理论上每日总收入可达 56.2 万美元,日均 GPU 成本为 8.7 万美元,日盈利 47.5 万美元,成本利润率高达 545%。按此推算,年化理论收入约 2.05 亿美元。
不过 DeepSeek 方面也坦承,实际收入低于理论值。V3 定价更低、收费服务只占一部分、夜间还有折扣。若考虑 V3 定价、夜间打折等因素,付费 token 占比 50% 情况下测算成本利润率有望达到 108%。
随着 AI 大战的发展,目前各个平台也进入了 " 卷价格战 " 的阶段。
2026 年 5 月 22 日,在低价的基础上,DeepSeek 宣布 V4-Pro 模型 API 价格永久下调 75%,缓存命中输入价格降至 0.025 元 / 百万 Token,未命中输入 3 元 / 百万 Token,输出 6 元 / 百万 Token。
原定 6 月恢复原价的限时优惠直接变成了永久降价。这一价格在全球范围内处于绝对低位。
2026 年 5 月下旬,全球最大 AI 模型 API 聚合平台 OpenRouter 数据显示,DeepSeek-V4-Flash 单周调用量达 3.43 万亿 Token,环比暴涨 66%,首次登顶全球第一。
但从全球竞争格局来看,差距仍然显著。据 Counterpoint Research 数据,2026 年第一季度,全球大语言模型用户总数突破 38 亿,总收入约 207 亿美元,Anthropic 以 31.4% 的收入份额位居榜首,OpenAI 和谷歌分别以 29% 和 12.1% 紧随其后。
国内市场中,豆包以 3.45 亿月活用户遥遥领先,千问以 1.66 亿紧随其后,DeepSeek 以 1.27 亿位居第三。
在受到全球关注的 DeepSeek 背后,是一位 " 数学神童 "" 高考状元 " 的 " 知识造富 " 故事。
梁文锋出生于 1985 年,来自湛江市吴川市,从小成绩优异,在吴川一中完成了初中、高中学业,在初中时期就学完了高中数学,自学大学的数学。2002 年,梁文锋以吴川一中 " 高考状元 " 的成绩考上浙江大学本科电子信息工程专业,于 2006 年考取浙江大学信息与通信工程专业研究生。
毕业后,2013 年,梁文锋与大学同学徐进共同创立了杭州雅克比投资管理有限公司,并在 2015 年成立了杭州幻方科技有限公司,主要致力于通过数学和 AI 进行量化投资。所谓量化投资,就是用设定的数学模型和 AI 进行自动投资,由机器和 AI 做决策。
图源:罐头图库
2017 年,幻方量化宣称实现投资策略全面 AI 化。2018 年幻方量化首次获得私募金牛奖。直到 2021 年,幻方量化的管理规模突破千亿。巅峰时期,私募行业还有 " 北九坤,南幻方 " 之称。
不过,也是在这一年,幻方量化业绩出现波动,低风险对冲产品出现亏损,其中有些年内跌幅超 8%。还创出了 10.66% 的历史最大回撤。
2021 年 12 月 28 日,幻方量化在官微发布说明,向投资者致歉,解释称 " 长周期持股波动和量化策略同质化严重,是其近期表现不佳的主要原因,公司正在调整策略以适应市场环境变化。"
2022 年,幻方量化整体收益率仅 0.38%。到 2023 年 10 月,据 " 搜狐财经 " 报道,幻方量化市场人士回应称," 幻方量化当前的基金管理规模是 400 多亿元,这个规模目前来看是策略比较合适的规模。"
天眼查显示,幻方量化的机构主体为浙江九章资产管理有限公司,由梁文锋持股 85%,郑达韡、徐进分别持股 7.5%。
图源:天眼查
" 我们看到的是中国 AI 不可能永远处在跟随的位置。我们经常说中国 AI 和美国有一两年差距,但真实的 gap 是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。" 梁文锋在接受 " 暗涌 waves" 采访时表示。
据 " 量子位 " 报道,梁文锋已向潜在投资者明确表示,公司将继续优先推进突破性人工智能研究,追求通用人工智能(AGI),而非短期商业化变现。
此次融资,正如一位网友所感叹的:" 腾讯和京东拿出了数十亿美元,却没有投票权,而且 5 年内不能退出。这足以说明梁文锋现在拥有多大的谈判筹码。除非你已经是这个赛道里‘非投不可’的唯一玩家,否则没人能拿到这样的融资条款。"
在 AGI 的漫长赛道上,这或许只是一个开始。你对 DeepSeek 的故事有何看法?欢迎下方留言讨论。


登录后才可以发布评论哦
打开小程序可以发布评论哦