闪崩“掉链子”、新模型难产、月活1.56亿不及去年,DeepSeek怎么了?

出品｜搜狐科技

作者｜郑松毅

编辑｜杨锦

国内头部 AI 大模型平台 DeepSeek，又崩了！

从 3 月 29 日晚上开始， DeepSeek 突发大规模服务中断，网页端和 APP 端同时无法正常使用，用户反复刷新均出现报错提示。网友在线催更：" 到底什么时候修好？深夜聊人生突然掉线，谁懂这种崩溃感。"

官方状态页显示，故障始于北京时间 3 月 29 日 21:35，平台曾于 23:23 短暂恢复，但仅 1 小时后再次崩溃。30 日 00:20 技术团队开始深度调查，01:24 再次实施修复方案，但未能解决问题，直至 3 月 30 日 9:13 才恢复正常，持续宕机时间约 12 小时。

截至发稿，DeepSeek 方面仍未发布正式公告说明宕机的具体原因、受影响用户规模以及相关补偿方案，这也让外界对此次故障的真相充满猜测。

模型崩了，是因用户激增还是另有隐情？

针对宕机原因，目前业内存在两个主流猜测：" 用户过多挤崩服务器 " 和 " 平台更新新模型 "。

搜狐科技让马斯克点赞的 Kimi 模型打探下情况，得到的答复主要指向用户激增，算力跟不上：

有业内观点认为，DeepSeek 的免费策略是宕机的诱因。大模型运营成本极高，免费模式让平台算力扩容有限。大量免费用户无差别抢占资源，遇到卡顿后又反复点击重试，形成 " 流量雪崩 "，进一步加重了服务器负担。

乍一听解释合理，但 " 用户激增 " 的说法真的立得住脚么？

最新一期 " 全媒介之星 " 中国 TOP 20 AI 应用榜单显示，经历过春节期间红包大战后，中国 AI 的格局已被重新洗牌。其中，并未见 DeepSeek 出现猛烈的用户增长态势。

数据显示，截止 2026 年 2 月，豆包稳居月活、声量双榜第一，紧随其后的是千问和元宝。而 DeepSeek 月活约为 1.56 亿，仅排名第 6 位，不及去年 Q1 的 1.94 亿巅峰水平。

也有部分业内人士提出了不同的猜想，认为此次宕机可能与 DeepSeek 新模型更新有关。据传，DeepSeek V4 多模态模型原计划在 4 月发布，该版本支持 100 万 tokens 超长上下文，具备多模态原生推理能力，被视为平台提升竞争力的关键升级。

" 大模型版本更新时，通常需要进行灰度测试、架构适配等操作，过程中出现阶段性服务中断是有可能的。"

一位参与过模型研发的业内人士向搜狐科技驳斥了这种猜想，" 但正常情况下，平台会提前发布维护公告，告知用户具体影响时间，不会出现这种无预警、反复修复的情况。"

除了以上猜想，业内也出现了其他潜在诱因说法。比如 DeepSeek 采用的 MoE 混合专家架构，虽然能降低训练成本，但推理阶段需要动态激活子模型，对实时算力调度要求极高，高峰时段容易出现资源争抢，引发全局拥堵。

此外，网传故障期间 DeepSeek 曾遭遇 DDoS 攻击（大量无效请求挤占带宽），原因是 DeepSeek 开源 + 低价击穿了 AI 大佬的定价体系，闭源技术溢价消失有人打击报复，不过这一消息尚未得到官方证实。

甚至还有网友把 " 锅 " 甩到了华为芯片上，认为是国产芯片大面积不适配模型造成，但这一说法也遭到众多声音反对。

业内建议：" 不要把鸡蛋都放一个篮子 "

值得注意的是，此次宕机并非 DeepSeek 首次 " 掉链子 "。

根据公开信息，DeepSeek 至少发生过 7 次服务器中断情况。2025 年 1 月，伴随新版模型上线与用户量激增，平台遭遇全面宕机，官方一度限制境外手机号注册以缓解压力；同年 5 月、7 月、8 月再次发生服务器崩溃，故障持续数小时并造成部分用户对话记录丢失。

此前官方发布的故障公告显示，宕机主要原因有两点：一是模型开源后用户访问量超出预期， GPU 集群出现节点崩溃；二是模型开源后的适配优化不足，部分用户高频调用的代码调试、长文本推理功能，与服务器架构存在兼容性问题，进一步加剧了服务卡顿，最终引发宕机。

当然，宕机也不是 DeepSeek 独有的问题，ChatGPT 上线初期也曾多次出现大规模宕机。此外，近期 " 养龙虾 " 热潮导致国内模型 API 调用量激增，多家厂商已开始限流：MiniMax 宣布高峰时段实施动态限流，智谱、阿里云推出涨价举措。

业内人士普遍建议，在 AI 基础设施尚未成熟阶段，无论是企业还是个人，为保障正常和安全使用，都应建立多模型备份策略，不要依赖单一 AI 模型工作。

至于 V4，从目前行业流传的消息来看，已经进入了发布前的最后倒计时。

关于 DeepSeek V4 的核心能力，业内的猜测高度一致。其中最受关注的是百万级上下文窗口——预计将从 V3.2 版本的 128K tokens 跃升至 100 万 tokens，提升近 8 倍。相当于模型能一次性读完多部专业书籍、大型代码库，彻底解决了长文本处理的痛点。在多模态能力方面，V4 预计将支持文本、图像等多种格式，在形状准确性和细节丰富度上将有出色表现。

除此之外，智能体能力也是 V4 的核心亮点，让模型能更高效地完成复杂任务。同时业内传言 V4 将全链路适配华为昇腾，助力国产化 AI 生态的构建。

该来的总会来，还是码住期待等 V4 放大招吧。

宙世代

一起剪

相关标签