胡华成 5小时前
杭州Deepseek获得510亿元融资,老板梁文锋出资约200亿!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

据投融湾获悉,近日,杭州深度求索人工智能基础技术研究有限公司(下文简称:Deepseek)的首轮融资已经有了结果。创始人梁文锋出资约 200 亿元;腾讯出资约 100 亿元;宁德时代体系出资约 50 亿元,其中包括宁德时代及溥泉资本;网易、京东、Monolith 砺思资本、IDG 资本分别出资约 30 亿元;正心谷资本、拾象科技分别出资约 15 亿元,国家人工智能产业投资基金出资约 9.8 亿元。整体融资规模约 510 亿元,折合约 75 亿美元,投后估值接近 4000 亿元。

Deepseek 创立于 2023 年 7 月,公司总部位于浙江省杭州市拱墅区。Deepseek 是国内原生通用人工智能底层大模型全栈自研企业,依托幻方量化多年算力、深度学习工程积累,专注混合专家(MoE)架构通用大模型、多模态模型、推理智能体基础技术研发,定位全球普惠型高性能 AGI 基础设施提供商。

创始人梁文锋

Deepseek 的创始人是梁文锋,浙江大学毕业,拥有信息与电子工程学系学士和硕士学位。早年深耕高性能并行计算、GPU 集群调度、深度学习底层工程优化,创办幻方量化,搭建国内早期万卡级私有智算集群,是国内最早大规模投入万亿级算力基建的民营企业家。2023 年,独立杭州深度求索。

五大产品线,全部完成多轮迭代

Deepseek 的核心产品分为五大产品线,覆盖通用语言大模型、代码专用模型、数学推理智能体、多模态模型、商业化服务产品,全部完成多轮迭代。其中,DeepSeek-V4 通用旗舰大模型是公司当前的主力产品,共分为 V4-Pro、V4-Flash 两个版本。DeepSeek-R1 推理智能体模型是轻量化专用数学推理模型,强化分步逻辑推理、数理计算、复杂解题能力,推理成本极低,可在中端服务器、国产算力卡稳定部署,2025 年发布后登顶全球开源推理模型榜单。

DeepSeek-Coder 代码大模型是垂直专用代码生成产品,覆盖全主流编程语言、大型工程代码库重构、软件漏洞检测、自动化单元测试,支持百万行代码一次性解析处理,国内软件研发企业、互联网技术团队广泛商用,开源版本支持本地私有化部署,无商用授权费用。DeepSeek-VL 多模态大模型是图文统一理解生成模型,支持图片解析、图表数据分析、图文问答、简单图像生成,打通文本与视觉模态融合,面向工业质检、文档 OCR 智能解析、图文内容创作场景。

核心技术以稀疏 MoE 架构为核心底层路线

Deepseek 以稀疏 MoE 架构为核心底层路线,解决传统稠密大模型训练、推理成本极高、算力门槛高企的行业痛点。其中,自研 MoE 混合专家稀疏架构采用创新动态激活专家模块机制,解决传统大模型 " 参数堆砌、算力浪费、推理昂贵 " 的行业痛点。

MLA 多头潜在注意力 +KV 极致缓存压缩技术能大幅降低长文档分析、知识库智能体硬件门槛,老旧 GPU、国产中端算力芯片均可流畅运行百万上下文模型。全栈国产 AI 芯片深度适配框架是自主开发模型推理编译层,原生适配华为昇腾、寒武纪、海光国产算力硬件,无需依赖英伟达 CUDA 生态,打破海外算力软件生态封锁。大规模高质量多语种训练数据治理技术是自研分布式数据采集、清洗、去重、质量分级系统,大幅提升预训练数据处理效率,保障模型中文理解。

破万亿的巨大市场空间

据推算,2026 年,国内大模型产业整体市场规模将超过 2200 亿元。到 2030 年,这一规模更是将突破万亿。这么大的市场空间,国内具备万亿参数 MoE 大模型完整自研、万卡算力自建、全系列开源能力的独立企业却还不足 5 家。

作为国内少有的实现 " 底层模型架构自研—万卡级智算集群自建—多系列模型迭代—开源生态搭建—企业商业化交付 " 全闭环的独立大模型厂商,杭州深度求索依托自研 MoE 稀疏架构技术路线,已然成为国内开源大模型赛道的龙头企业。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

人工智能 深度学习 融资 杭州 创始人
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论