连续两次降价后,DeepSeek 又在 4 月 28 日将限时优惠延长至 5 月 31 日。
4 月的最后一个周末,DeepSeek 先对 DeepSeek-V4-Pro(以下简称 "V4-Pro")限时 2.5 折,再将全系列模型,输入缓存命中的价格降至首发价格的 1/10。即在促销期间,V4-Pro 输入缓存命中价格从 1 元 / 百万 tokens 跌至 0.025 元 / 百万 tokens。
此前,国内 AI 行业正处在涨价周期,大模型公司智谱三度提价,月之暗面新模型的输入和输出价格不同程度上涨,云厂商也动作一致,百度智能云、腾讯云、阿里云调价,理由是同一套:全球算力需求激增,硬件成本上涨。
过去一年,大模型从 " 价格战 " 打到 " 涨价潮 ",没人真正赚到钱,营收和净亏损齐涨。DeepSeek 用 0.025 元抛出了一个问题,当推理成本可以被持续压缩,大模型公司的护城河,究竟是更便宜的 token,还是更不可替代的价值?

DeepSeek 的降价来得低调,但并不含蓄。
4 月 24 日,DeepSeek 全新系列模型 DeepSeek-V4 的预览版本正式上线并同步开源。该模型按大小分为两个版本:V4-Pro 参数较大,1.6T;V4-flash 参数 284B。两个版本支持的上下文长度都是 100 万。" 从现在开始,1M(100 万)上下文将是 DeepSeek 所有官方服务的标配 ",DeepSeek 特别加粗强调。
当天,DeepSeek 公布了两个版本模型的价格,V4-Pro 输入(缓存命中)价格 1 元 / 百万 tokens,输入(缓存未命中)价格 12 元 / 百万 tokens,输出价 24 元 / 百万 tokens。同样情况下,V4-flash 的价格分别是 0.2 元 / 百万 tokens、1 元 / 百万 tokens 和 2 元 / 百万 tokens。
次日,降价开始,且不止一次。
4 月 25 日,DeepSeek 开启 V4-Pro 模型的限时特惠活动,API 价格享受 2.5 折优惠,优惠期限至 5 月 5 日。4 月 26 日,DeepSeek 全系列模型输入缓存命中的价格降到原价的 1/10。
DeepSeek 研究员陈德里在社交平台提醒," 输入缓存(命中)的折扣是永久的,折扣促销活动将持续到 5 月 5 日 "。
4 月 28 日,DeepSeek 又将 V4-Pro 的 2.5 折限时优惠,从 5 月 5 日延长至 5 月 31 日。
按此计算,在 5 月 31 日之前,V4-Pro 模型百万 tokens 的输入(缓存命中)价格从原来的 1 元降到了 0.025 元。5 月 31 日之后,也只有 0.1 元。这是 DeepSeek 这波降价活动中,折扣幅度最大的一项。
何为缓存命中,与缓存未命中有什么区别?
一位头部云厂商工程师向北京商报记者解释," 简单说,缓存命中是指模型‘记得’你之前问过类似的内容,可以直接调用记忆回答不参与推理,收费便宜。缓存未命中相反,意思是模型第一次见这个内容,需要从头算一遍,所以收费贵 "。
资本市场快速反应。4 月 27 日,即 DeepSeek 降价后的第一个交易日,智谱和 MiniMax 的股价出现不同程度下滑。
这个价格不是凭空出现的。
根据官方技术解读,DeepSeek-V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。
这与外部观察一致。CHIP 中国实验室主任罗国昭向北京商报记者分析称,DeepSeek V4 降价 " 更大程度上跟模型算法优化、同等性能的算力消耗降低有关,和定位同样的大模型相比,V4 的优势是在更多参数、更高性能情况下的更低价格 "。他也谈及硬件成本,但强调 " 与采购国产芯片只有宏观的相关性,没有直接和实时的关联 "。
另一家大模型厂商从业者楚清(化名)则提供了另一种解释:" 看上去是 DeepSeek 在全栈适配国产算力方面领先,所以敢于定低价 "。他的观点建立在 DeepSeek 模型价位表下的一行小字:" 受限于高端算力,目前 Pro 的服务吞吐十分有限,预计下半年昇腾 950 超节点批量上市后,V4-Pro 的价格会大幅下调 "。
一个值得注意的插曲是,4 月 24 日也就是 DeepSeek 模型上新当天,华为计算宣布:昇腾一直同步支持 DeepSeek 系列模型,本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持 DeepSeek V4 系列模型。
DeepSeek 也将华为昇腾和英伟达一起写进 DeepSeek-V4 技术报告:" 我们在英伟达 GPU 和华为昇腾 NPU 平台上验证了细粒度 EP(专家并行)方案。"
4 月 28 日,摩根士丹利亚太研究团队发布的最新行业报告《China's AI Path: More Bang For The Buck》也提到,中国模型的 " 性价比 " 优势集中体现在:以美国同行 15% — 20% 的推理成本实现同等智能水平。报告将工程效率提升归因于三大方向:架构层面的稠密模型与 MoE、注意力机制改进;后训练层面的强化学习与模型蒸馏,以及推理基建层面的硬件优化与 KV cache(一种缓存机制)效率。新近发布的 DeepSeek-V4 被视为最新例证。
不过,摩根士丹利还是大幅上调中国两大前沿 AI 公司目标价,其中,MiniMax 目标价由 990 港元上调至 1100 港元,行业评级维持 "In-Line",并明确预期,MiniMax 在 M3 模型升级后将启动重大价格上调,这或成为下一阶段 ARR(会计收益率)催化剂。
从企业层面看,DeepSeek 的降价暂时没有等来同行跟进。
4 月 28 日,北京商报记者就会否跟进降价,采访了智谱、MiniMax、百度智能云、阿里云、腾讯云,截至发稿,以上几家公司相关人士均未回应。
楚清从技术层面解释了这种分化的原因:" 其他公司如果没有和国产算力提前优化适配的话,短期内成本降不下来。"
文渊智库创始人王超的判断更聚焦于价格本身的长期趋势:"token 降价是技术的进步,否则不可能实现。最近不管是算力、token、芯片、内存的价格都在上涨,处在一个小周期上涨的阶段,但大周期肯定是要下降的。"
作为智能体赛道的一员,猎豹移动董事长兼 CEO 傅盛更关注另一条路径的可能性。
他在试用 V4 系列模型后认为,"V4 把国产 AI 大模型,无论开源还是闭源的性能又提高到一个更高的水平,直逼全球最强模型。虽然还有 3 — 6 个月差距,但已经足够好用了。更重要的是,DeepSeek 可能正在引领国产 AI 走出一条和美国 AI 不同的道路 "。
这些判断并不矛盾,DeepSeek 用技术降本验证大周期下降的方向,而智谱、MiniMax 们在用涨价对冲小周期上涨的压力,但从业者都明白核心护城河一定不只是价格这一单一要素,DeepSeek 已经给出了它的答案,但行业还在沉默中等待更多人表态。


登录后才可以发布评论哦
打开小程序可以发布评论哦