每日新闻摘录 11小时前
闪崩“掉链子”、新模型难产、月活1.56亿不及去年,DeepSeek怎么了?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

出品|搜狐科技

作者|郑松毅

编辑|杨锦

国内头部 AI 大模型平台 DeepSeek,又崩了!

从 3 月 29 日晚上开始, DeepSeek 突发大规模服务中断,网页端和 APP 端同时无法正常使用,用户反复刷新均出现报错提示。网友在线催更:" 到底什么时候修好?深夜聊人生突然掉线,谁懂这种崩溃感。"

官方状态页显示,故障始于北京时间 3 月 29 日 21:35,平台曾于 23:23 短暂恢复,但仅 1 小时后再次崩溃。30 日 00:20 技术团队开始深度调查,01:24 再次实施修复方案,但未能解决问题,直至 3 月 30 日 9:13 才恢复正常,持续宕机时间约 12 小时。

截至发稿,DeepSeek 方面仍未发布正式公告说明宕机的具体原因、受影响用户规模以及相关补偿方案,这也让外界对此次故障的真相充满猜测。

模型崩了,是因用户激增还是另有隐情?

针对宕机原因,目前业内存在两个主流猜测:" 用户过多挤崩服务器 " 和 " 平台更新新模型 "。

搜狐科技让马斯克点赞的 Kimi 模型打探下情况,得到的答复主要指向用户激增,算力跟不上:

有业内观点认为,DeepSeek 的免费策略是宕机的诱因。大模型运营成本极高,免费模式让平台算力扩容有限。大量免费用户无差别抢占资源,遇到卡顿后又反复点击重试,形成 " 流量雪崩 ",进一步加重了服务器负担。

乍一听解释合理,但 " 用户激增 " 的说法真的立得住脚么?

最新一期 " 全媒介之星 " 中国 TOP 20 AI 应用榜单显示,经历过春节期间红包大战后,中国 AI 的格局已被重新洗牌。其中,并未见 DeepSeek 出现猛烈的用户增长态势。

数据显示,截止 2026 年 2 月,豆包稳居月活、声量双榜第一,紧随其后的是千问和元宝。而 DeepSeek 月活约为 1.56 亿,仅排名第 6 位,不及去年 Q1 的 1.94 亿巅峰水平。

也有部分业内人士提出了不同的猜想,认为此次宕机可能与 DeepSeek 新模型更新有关。据传,DeepSeek V4 多模态模型原计划在 4 月发布,该版本支持 100 万 tokens 超长上下文,具备多模态原生推理能力,被视为平台提升竞争力的关键升级。

" 大模型版本更新时,通常需要进行灰度测试、架构适配等操作,过程中出现阶段性服务中断是有可能的。"

一位参与过模型研发的业内人士向搜狐科技驳斥了这种猜想," 但正常情况下,平台会提前发布维护公告,告知用户具体影响时间,不会出现这种无预警、反复修复的情况。"

除了以上猜想,业内也出现了其他潜在诱因说法。比如 DeepSeek 采用的 MoE 混合专家架构,虽然能降低训练成本,但推理阶段需要动态激活子模型,对实时算力调度要求极高,高峰时段容易出现资源争抢,引发全局拥堵。

此外,网传故障期间 DeepSeek 曾遭遇 DDoS 攻击(大量无效请求挤占带宽),原因是 DeepSeek 开源 + 低价击穿了 AI 大佬的定价体系,闭源技术溢价消失有人打击报复,不过这一消息尚未得到官方证实。

甚至还有网友把 " 锅 " 甩到了华为芯片上,认为是国产芯片大面积不适配模型造成,但这一说法也遭到众多声音反对。

业内建议:" 不要把鸡蛋都放一个篮子 "

值得注意的是,此次宕机并非 DeepSeek 首次 " 掉链子 "。

根据公开信息,DeepSeek 至少发生过 7 次服务器中断情况。2025 年 1 月,伴随新版模型上线与用户量激增,平台遭遇全面宕机,官方一度限制境外手机号注册以缓解压力;同年 5 月、7 月、8 月再次发生服务器崩溃,故障持续数小时并造成部分用户对话记录丢失。

此前官方发布的故障公告显示,宕机主要原因有两点:一是模型开源后用户访问量超出预期, GPU 集群出现节点崩溃;二是模型开源后的适配优化不足,部分用户高频调用的代码调试、长文本推理功能,与服务器架构存在兼容性问题,进一步加剧了服务卡顿,最终引发宕机。

当然,宕机也不是 DeepSeek 独有的问题,ChatGPT 上线初期也曾多次出现大规模宕机。此外,近期 " 养龙虾 " 热潮导致国内模型 API 调用量激增,多家厂商已开始限流:MiniMax 宣布高峰时段实施动态限流,智谱、阿里云推出涨价举措。

业内人士普遍建议,在 AI 基础设施尚未成熟阶段,无论是企业还是个人,为保障正常和安全使用,都应建立多模型备份策略,不要依赖单一 AI 模型工作。

至于 V4,从目前行业流传的消息来看,已经进入了发布前的最后倒计时。

关于 DeepSeek V4 的核心能力,业内的猜测高度一致。其中最受关注的是百万级上下文窗口——预计将从 V3.2 版本的 128K tokens 跃升至 100 万 tokens,提升近 8 倍。相当于模型能一次性读完多部专业书籍、大型代码库,彻底解决了长文本处理的痛点。在多模态能力方面,V4 预计将支持文本、图像等多种格式,在形状准确性和细节丰富度上将有出色表现。

除此之外,智能体能力也是 V4 的核心亮点,让模型能更高效地完成复杂任务。同时业内传言 V4 将全链路适配华为昇腾,助力国产化 AI 生态的构建。

该来的总会来,还是码住期待等 V4 放大招吧。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

搜狐科技 马斯克 kimi ai 春节
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论