杭州Deepseek获得510亿元融资,老板梁文锋出资约200亿!

据投融湾获悉，近日，杭州深度求索人工智能基础技术研究有限公司（下文简称：Deepseek）的首轮融资已经有了结果。创始人梁文锋出资约 200 亿元；腾讯出资约 100 亿元；宁德时代体系出资约 50 亿元，其中包括宁德时代及溥泉资本；网易、京东、Monolith 砺思资本、IDG 资本分别出资约 30 亿元；正心谷资本、拾象科技分别出资约 15 亿元，国家人工智能产业投资基金出资约 9.8 亿元。整体融资规模约 510 亿元，折合约 75 亿美元，投后估值接近 4000 亿元。

Deepseek 创立于 2023 年 7 月，公司总部位于浙江省杭州市拱墅区。Deepseek 是国内原生通用人工智能底层大模型全栈自研企业，依托幻方量化多年算力、深度学习工程积累，专注混合专家（MoE）架构通用大模型、多模态模型、推理智能体基础技术研发，定位全球普惠型高性能 AGI 基础设施提供商。

创始人梁文锋

Deepseek 的创始人是梁文锋，浙江大学毕业，拥有信息与电子工程学系学士和硕士学位。早年深耕高性能并行计算、GPU 集群调度、深度学习底层工程优化，创办幻方量化，搭建国内早期万卡级私有智算集群，是国内最早大规模投入万亿级算力基建的民营企业家。2023 年，独立杭州深度求索。

五大产品线，全部完成多轮迭代

Deepseek 的核心产品分为五大产品线，覆盖通用语言大模型、代码专用模型、数学推理智能体、多模态模型、商业化服务产品，全部完成多轮迭代。其中，DeepSeek-V4 通用旗舰大模型是公司当前的主力产品，共分为 V4-Pro、V4-Flash 两个版本。DeepSeek-R1 推理智能体模型是轻量化专用数学推理模型，强化分步逻辑推理、数理计算、复杂解题能力，推理成本极低，可在中端服务器、国产算力卡稳定部署，2025 年发布后登顶全球开源推理模型榜单。

DeepSeek-Coder 代码大模型是垂直专用代码生成产品，覆盖全主流编程语言、大型工程代码库重构、软件漏洞检测、自动化单元测试，支持百万行代码一次性解析处理，国内软件研发企业、互联网技术团队广泛商用，开源版本支持本地私有化部署，无商用授权费用。DeepSeek-VL 多模态大模型是图文统一理解生成模型，支持图片解析、图表数据分析、图文问答、简单图像生成，打通文本与视觉模态融合，面向工业质检、文档 OCR 智能解析、图文内容创作场景。

核心技术以稀疏 MoE 架构为核心底层路线

Deepseek 以稀疏 MoE 架构为核心底层路线，解决传统稠密大模型训练、推理成本极高、算力门槛高企的行业痛点。其中，自研 MoE 混合专家稀疏架构采用创新动态激活专家模块机制，解决传统大模型 " 参数堆砌、算力浪费、推理昂贵 " 的行业痛点。

MLA 多头潜在注意力 +KV 极致缓存压缩技术能大幅降低长文档分析、知识库智能体硬件门槛，老旧 GPU、国产中端算力芯片均可流畅运行百万上下文模型。全栈国产 AI 芯片深度适配框架是自主开发模型推理编译层，原生适配华为昇腾、寒武纪、海光国产算力硬件，无需依赖英伟达 CUDA 生态，打破海外算力软件生态封锁。大规模高质量多语种训练数据治理技术是自研分布式数据采集、清洗、去重、质量分级系统，大幅提升预训练数据处理效率，保障模型中文理解。

破万亿的巨大市场空间

据推算，2026 年，国内大模型产业整体市场规模将超过 2200 亿元。到 2030 年，这一规模更是将突破万亿。这么大的市场空间，国内具备万亿参数 MoE 大模型完整自研、万卡算力自建、全系列开源能力的独立企业却还不足 5 家。

作为国内少有的实现 " 底层模型架构自研—万卡级智算集群自建—多系列模型迭代—开源生态搭建—企业商业化交付 " 全闭环的独立大模型厂商，杭州深度求索依托自研 MoE 稀疏架构技术路线，已然成为国内开源大模型赛道的龙头企业。

宙世代

一起剪

相关标签