寒武纪Day 0适配DeepSeek V4意味着什么

经济观察报记者钱玉娟任晓宁

4 月 24 日，深度求索（DeepSeek）发布了旗舰模型 V4 的预览版本并同步开源。

已经上线的 DeepSeek V4 模型分为 Pro 和 Flash 两个版本，Pro 版本的参数为 1.6 万亿，激活 490 亿，预训练数据 33 万亿；而 Flash 版本的参数为 2840 亿，激活 130 亿，预训练数据 32 万亿。两个版本模型的上下文都是 1M（百万词元）。

经历了长达 15 个月的 " 静默期 " 和多次更新传闻，DeepSeek V4 终于亮相。然而，这并非一次轻盈的亮相。

在 V4 两个版本模型对 API 访问的价格介绍中，DeepSeek 用一行小字表明了现实的骨感：受限于高端算力，目前 V4 Pro 的服务吞吐能力有限，预计下半年昇腾 950 超节点批量上市后，Pro 的价格会大幅下调。

随后，华为计算发文表示，昇腾一直同步支持 DeepSeek 系列模型，本次双方更是通过芯模技术协同，实现了昇腾超节点的全系列产品支持 DeepSeek V4 系列模型。

由华为昇腾代表的国产高端算力，与 DeepSeek 的模型算法进行协同适配，不再犹抱琵琶半遮面。

DeepSeek 在同步发出的 V4 技术报告中称：" 我们在英伟达 GPU 和华为昇腾 NPU 两个平台上均验证了细粒度 EP（专家并行）方案。" 这是 DeepSeek 第一次在正式文档中把华为昇腾和英伟达并列写进硬件验证清单。

一位从事大模型研究的高校学者还是从 DeepSeek 的小字说明中判断：" 国产算力支持下的 DeepSeek V4 大规模商用仍需时间。"

该学者早就发现 DeepSeek 在产品端的算力紧缺。2026 年初至今，DeepSeek 曾突发多次服务中断，备受关注的便是 3 月 30 日— 31 日的连续宕机事件。

在他看来，DeepSeek 在一众国产大模型厂商中，以底层工程极限优化著称，即便在产品服务出现宕机风险时，也未公开提及其在芯片等物理设备方面的缺口问题，而今在新模型亮相之初就袒露算力受限，一定程度上揭示了国产模型厂商在国产算力适配上存在着阵痛。

Day 0 适配

一位与 DeepSeek 有模型服务合作的供应商人士认为，V4 之所以姗姗来迟，深层原因在于算力架构的重构。

AI 开源社区与模型托管平台 Hugging Face 的亚太生态负责人王铁震指出，目前各家国产大模型都在积极展开国产算力适配，而 DeepSeek 在过去超一年时间的 V4 研发中，也在试图大规模采用国产芯片替代方案。眼下，DeepSeek 除了持续推进与华为昇腾算力的适配，还与包括寒武纪、沐曦等在内的众多国产算力厂商展开适配。

王铁震透露，行业内尤其关注国产大模型与国产算力是否达到 "Day 0" 适配。

"Day 0 相当于大模型上线的当天，算力已完成全链路兼容、性能优化、稳定性验证。开发者开箱即用，零等待、零额外适配即可直接训练 / 推理该模型。" 一位国产芯片厂商内部人士透露，过去只有英伟达的算力芯片能做到与各家模型的 Day 0 适配，其他 GPU 往往要滞后数月。

就在 DeepSeek V4 官方信息发布后，寒武纪通过其官方公众号表示，已基于 vLLM 推理框架完成对 DeepSeek V4 已上线两个模型版本的 Day 0 适配。

寒武纪与 DeepSeek 最新模型完成 Day 0 适配，意味着国产 GPU 已经具备了与英伟达高端算力芯片同等的生态响应速度。而前述国产芯片厂商内部人士表示，其所在厂商也在与 DeepSeek V4 进行产品适配。在此之前，已经完成与十几个国产大模型的 Day 0 适配。

今年初，电信天翼云自主研发的 " 息壤 " 智算平台宣布完成了国产算力芯片与 DeepSeek V3 系列大模型的深度适配优化，伴随 DeepSeek 的模型迭代与更新，智算平台的优化适配也在进行中。

聚焦中国 AI 市场，国产大模型此前多依赖英伟达 CUDA 生态，而今算法要全面适配国产算力，需要对底座架构进行重构。

前述大模型研究学者与国产芯片厂商内部人士有个共识，算力自主可控是必然趋势，他们将上述芯模技术底层的重构理解为 " 算力平替 " 的过程。从 DeepSeek V4 耗时长达一年多的研发进程，不难窥见这个过程的艰难。

" 不只是简单的代码迁移，MoE（混合专家模型）架构在国产芯片上的通信延迟优化是世界级难题。" 某头部模型厂商的技术工程师分析，DeepSeek 选择在此时坦承吞吐有限，本质上也是在等待国产芯片 " 超节点 " 范式的成熟。

多模态缺失

4 月 24 日上午，在 DeepSeek V4 预览版上线后，不仅半导体芯片国产替代板块个股大涨，与国产算力及 DeepSeek 相关的概念股均出现异动。

截至收盘，寒武纪（688256.SH）报 1352.5 元 / 股，涨超 2.2%。同步走强的还有相关概念股，像龙芯中科（688047.SH）收盘报 153.86 元 / 股，同样涨超 2 个点。以主营大数据服务及数据安全的拓尔思（300229.SZ），作为 DeepSeek 概念股，在 24 日午前涨至 18.9 元 / 股，仅短短 5 分钟后便出现下跌，跌幅超过 2%‌。收盘报 18.34 元 / 股，较当日开盘价涨幅不及 1%。

前述头部模型厂商技术工程师认为，此前传闻 DeepSeek V4 会有多模态版本，可以具备支持图片、视频理解与生成等能力，而今上线的预览版本能力，依然固守文本生成与推理领域。

形成鲜明对比的是，就在 DeepSeek V4 上线的前几个小时，OpenAI 发布了新一代大模型 GPT-5.5，其能力展示中特别突出了对工具调用的多模态视觉理解能力。

即使不对标 GPT、Gemini 等海外头部模型，在 2026 年的国产大模型战场上，阿里千问、腾讯混元等均已实现 " 全模态一体化 "。而 V4 已上线的两个模型版本仍走单模态路线，前述头部模型厂商技术工程师推测，DeepSeek 在多模态识别能力上或出现短板。

" 多模态需要指数级的算力和更复杂的数据工程。" 他认为，这极为考验模型厂商的生态布局。他所在的头部大厂不断挖角 DeepSeek 的技术人才。" 我们团队的数据负责人就来自 DeepSeek。"

这种核心人才的流失是令人担忧的。多位受访者确信 DeepSeek 在国产模型第一梯队中的技术护城河，但也提出，继核心科学家罗福莉入职小米、郭达雅转投字节跳动后，内部负责核心数据工程、多模态预训练的关键人士流失，或令其模型在多模态能力开发创新方面遇到更大困难。

前述模型技术工程师分析，模型缺乏多模态识别能力或将意味着该厂商错失大量实时视频交互、视觉分析等高价值商业场景。

V4 预览版的发布，让市场看到了国产模型与算力在底层架构上的协同进展，但这并不意味着 DeepSeek 可以松口气。在大模型万亿参数和全模态竞争的当下，它还需要交出一份答卷，在下半年昇腾 950 超节点到位前，顶着多模态应用技术的压力，它的模型服务、产品迭代，甚至是人才组织架构，能否保持稳定。

前述模型技术工程师透露，在腾讯、阿里等巨头有意与 DeepSeek 接洽首轮外部融资事宜外，近期数家推动国产替代相关动作的国资型产业投资基金，也在与 DeepSeek 展开深度洽谈。在其看来，研发进度缓慢的 DeepSeek，在算力资源之外，也对外来资金表现出极度渴求。

宙世代

一起剪