市鉴 3小时前
自研造血控权、全栈技术突围,DeepSeek开辟国产大模型发展新范式
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

2026 年 6 月,一则总额超 500 亿元的首轮融资消息搅动全球 AI 产业。创始人梁文锋个人出资 200 亿元成为最大出资方,腾讯、宁德时代、国家级 AI 产业基金等产业资本齐聚,投后估值突破 3380 亿元,创下中国 AI 企业单轮融资纪录。

不同于互联网大厂下设 AI 实验室、普通科创公司依靠风险投资持续输血的主流成长路径,脱胎于幻方量化的 DeepSeek 走出了一条辨识度极高的发展道路。

成立三年,全程依靠母公司量化业务现金流支撑研发,没有引入任何外部资本;完成大额融资后,又通过一套特殊股权设计牢牢攥住技术发展的主导权,一边持续迭代开源通用大模型积累全球开发者,一边落地自有零碳算力集群,面向能源、制造、金融、政务输出私有化行业解决方案。资本、技术、商业化三条主线彼此支撑,共同构筑起这家企业自主可控的核心底色。

重塑 AI 产业资本规则创始人 200 亿重仓守住自研主导根基

国内绝大多数 AI 初创企业的成长路径,是依靠多轮外部风投持续输血,投资方通过股权、董事会席位深度干预研发节奏与商业化目标,短期盈利诉求时常与底层技术长期攻坚形成冲突。DeepSeek 本轮 500 亿元首轮融资,彻底打破行业通行规则,其核心设计逻辑是产业资本出钱、创始人掌权、国资战略兜底,为国产自主大模型提供全新资本样本。

从企业溯源来看,DeepSeek 的内生造血根基来自创始人梁文锋创立的幻方量化。2015 年,浙大工科背景的梁文锋创办幻方量化,依靠机器学习量化策略迅速跻身国内私募 " 四大天王 ",巅峰时期管理规模突破千亿元,多年稳定收益积累充足自有资金。2023 年,梁文锋正式独立拆分成立深度求索,此后三年间未引入任何外部投资,模型训练、算力采购、研发团队薪酬全部由幻方量化经营利润全额承担,累计自研投入超百亿元,形成区别于同行的" 自给自足 "发展模式。

随着 V3、R1、V4 系列万亿参数大模型迭代加速,自建万卡级智算中心、全球扩招算法人才带来算力成本持续攀升,叠加核心研发人员被互联网大厂高薪挖角的人才竞争压力,梁文锋启动首轮外部融资,但从出资结构到股权约束层层设防,杜绝资本短期干预。

出资明细清晰划分三层主体:第一,创始人梁文锋个人出资 200 亿元,占募资总额近 40%,为单一最大出资方;第二,产业龙头资本,腾讯出资 100 亿、宁德时代体系 50 亿,京东、网易、IDG、砺思资本各 30 亿,正心谷、拾象科技各 15 亿;第三,唯一直投主体国家人工智能产业投资基金注资 10 亿元,承担产业安全监督职能。

整套交易架构最具颠覆性的设计,是市场化投资方无投票权、无董事会席位。除国家级 AI 基金直接入股主体公司并享有表决权限外,腾讯、宁德时代等全部市场化资本资金,统一注入梁文锋全权管理的有限合伙企业,外部投资人仅拥有分红权、财务知情权与后续优先投资权,无权干预技术路线、人才招聘、资金投放核心决策。同时协议设置五年强制股权锁定期,锁定期内禁止股权转让、份额质押,通过穿透式资金核查机制过滤境外背景短线投机资本,明确不搭建 VIE 境外上市架构,从源头保障国产 AI 底层自主权。

股权穿透结果显示,完成融资后梁文锋通过直接持股 + 合伙企业 GP 双重架构,合计掌控企业 84.29% 股权与近乎 100% 经营表决权。

业内分析师将这套模式定义为 " 融而不控 ":产业资本输出场景、算力、渠道资源,但放弃企业治理权;创始人以 200 亿自有资金完成信用背书,锚定长期 AGI 研发目标,不必为迎合资本诉求压缩基础模型投入。对比阿里、字节、百度大厂自研模式,DeepSeek 既摆脱集团业务协同束缚,又规避初创企业资本绑架难题,形成第三方独立头部大模型全新发展范式。

从 R1 推理到 V4 开源旗舰全栈自主,构建成本与性能双重壁垒

如果说特殊资本架构是 DeepSeek 的护城河,自研算法与全栈适配能力则是其核心竞争力。公司摒弃 " 租赁第三方算力、微调开源底座 " 的轻量化路线,坚持从底层架构、预训练、推理优化到国产芯片适配全链路自研,形成覆盖通用对话、深度推理、代码、多模态完整产品矩阵,在全球开源赛道站稳第一梯队。

2025 年初推出的 R1 深度推理模型,是 DeepSeek 一战成名的标志性产品。该模型大幅缩小与海外顶级闭源模型在数学、逻辑推演领域的差距,推理调用成本仅为海外旗舰模型三十分之一,上线初期引发海外科技板块震荡,市场意识到国产模型可依靠算法效率突破算力成本桎梏。

2025 年迭代的 V3 系列 685B 参数 MoE 混合专家模型,进一步确立两大差异化优势:一是激活稀疏架构大幅降低推理算力消耗,同等任务算力开销仅为同类模型 1/10;二是全面完成寒武纪、海光、华为昇腾国产芯片全栈适配,成为国内少数可脱离海外 GPU 完成完整训推闭环的万亿参数模型。

2026 年 4 月封闭内测、6 月全面开放商用的 V4-Pro 旗舰模型,将国产开源能力推向新高度。1.6 万亿总参数量刷新开源模型规模纪录,标配 128K 超长上下文窗口,在代码生成、长文本解析两大领域性能超越 GPT、Claude 主流闭源产品,单百万 Token 调用价格不足海外模型十分之一。

底层技术层面,团队创新采用同策略蒸馏、生成式奖励模型 GRM 架构,解决多专家模型能力冲突退化问题,显存占用相较前代缩减 90%,推理延迟大幅降低。同时公司坚持全系列基础模型开源商用授权,对中小开发者、中小企业免费开放基础权重,快速扩大全球开发者基本盘,Hugging Face 平台月调用量稳居国产模型首位,海外独立开发者社区规模持续追赶 Llama 生态。

技术自主的另一关键支点是自建算力底座。区别于多数企业租赁云厂商算力的模式,DeepSeek 规划内蒙古乌兰察布国家级零碳智算集群,依托东数西算政策红利与低价绿电资源,远期规划 30 万 P 算力规模,一期 2026 年内投产。宁德时代 50 亿配套资金专项投入机房储能、高压直流供电系统,打造" 绿电 - 储能 - 智算 "一体化算力体系,机房 PUE 低至 1.2,电力成本较东部一线城市算力中心降低近一半。算力路线实行双线并行,短期采用海外高端 GPU 保障训练产能,长期逐步切换国产算力芯片,构建进退可控、不受海外芯片封锁制约的算力安全体系。

政企、制造、金融多维渗透,开源生态构筑长期增长曲线

技术与资本的最终落脚点,是规模化商业化落地。DeepSeek 采用" 开源引流 + 私有化行业定制 + 政企专属部署 "三层商业模式,避开 C 端流量红海,聚焦 B 端、G 端高价值产业场景,依托模型低成本优势快速渗透能源、制造、金融、政务核心赛道,形成稳定可持续现金流。

能源央企是落地规模最大的板块。目前国家电网、中石油、中核、国家能源集团等十余家能源央企完成内部系统接入,将 V3、R1 模型融合自有行业大模型,应用于油藏地质数据分析、电网故障预警、核电运维文档解析、风光储能调度等场景。中国石油通过模型完成地震勘探海量图纸自动识别,大幅缩短油藏评估周期;电力企业依托超长文本能力处理十年级运维档案,设备故障预判准确率提升 35%。依托与宁德时代资本协同,双方联合开发电池产线 AI 调度、储能智能调控专用微调模型,同步落地新能源工厂全流程智能化改造方案,实现资本合作与业务落地双向赋能。

制造业领域形成标杆合作矩阵,先后与三一重工、美的集团落地工业质检、产线排程 AI 系统。工业专用微调模型针对车间弱光、高反光复杂工况优化视觉识别能力,零部件缺陷检测准确率达 99.3%,智能排程算法将设备综合利用率从 72% 提升至 89%。农业数字化场景同步铺开,多模态模型结合卫星遥感、田间传感器数据,实现病虫害提前 14 天预警,精准灌溉系统节水增效,在黑龙江水稻、新疆棉花基地形成可复制标准化方案。

金融赛道是 DeepSeek 天然优势场景,依托母公司幻方量化多年金融算法积累,模型在量化策略开发、财报智能分析、风险预警、代码自动生成领域适配度突出。国内头部券商、量化私募批量接入 API 服务,替代海外闭源模型完成投研数据回测、交易代码开发;依托 R1 强数学推理能力,大幅降低机构 AI 建模算力成本,形成差异化竞争优势。

开源生态则承担长期增长底盘功能。公司持续放宽商用开源协议,小微企业免费使用基础模型,大型企业按需采购私有化部署、专属微调、算力托管增值服务,全球数百万开发者基于 DeepSeek 底座搭建垂直应用,形成海量第三方解决方案。海外市场同步稳步拓展,东南亚、中东、拉美开发者优先选择低成本国产开源模型,降低当地 AI 产业入门门槛,间接推动国产大模型技术出海,对冲海外闭源模型全球垄断格局。

多元业务矩阵也夯实了企业长期发展的盈利根基,商业模式具备充足可持续性。线上推理服务长期保持 85% 以上的稳定毛利率,面向政府、大型企业的私有化部署项目,又能带来周期稳定、回款可靠的中长期订单;而持续壮大的开源生态,还能不断摊薄前端市场获客成本,形成良性循环。

据悉,此轮的 500 亿元融资,其中 125 亿元将专项投入行业方案打磨与开发者生态扶持,企业将以此为抓手深耕中小制造企业、县域政务等下沉市场,挖掘数字化转型增量,进一步拓宽自身业绩增长空间。

结语

在国产大模型激烈竞争的当下,DeepSeek 走出一条极具样本价值的独立发展路径:以量化业务内生造血完成早期技术积累,通过创新股权架构平衡产业资本与技术自主权,依靠全栈自研算法、自建零碳算力构建硬技术壁垒,以分层商业化模式实现产业规模化落地。梁文锋 200 亿个人重仓的融资设计,本质是国产 AI 创业者对 " 技术自主优先 " 路线的坚定选择,区别于大厂资源捆绑、初创企业资本妥协的固有模式。

短期来看,随着国内大厂加大 AI 人才投入,V3、多模态核心研发人员陆续跳槽至小米、字节等企业,核心人才流失持续考验团队稳定性。与此同时,在通用复杂多模态、前沿具身智能领域,与海外头部闭源模型仍存在 3-6 个月技术差距,多模态前沿技术追赶仍是企业需要突破的短板。

长期维度,依托低成本推理、完整开源生态、国产算力适配三大独有优势,DeepSeek 已形成难以短期复制的技术壁垒。未来,随着内蒙古智算集群投产、V4 系列模型持续迭代、政企行业方案规模化复制,叠加全球开源生态持续扩张,DeepSeek 有望成为平衡国内外 AI 格局、支撑国内算力与大模型自主可控的核心载体,其" 自有资金压舱、产业资本赋能、技术路线自主 "的发展模式,跳出行业普遍困境,也为国产 AI 探索出一条技术自主权不受资本裹挟的全新成长路径。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 融资 创始人 腾讯 宁德时代
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论