北京商报 6小时前
DeepSeek“发牌”,新一轮token价格战打什么
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

连续两次降价后,DeepSeek 又在 4 月 28 日将限时优惠延长至 5 月 31 日。

4 月的最后一个周末,DeepSeek 先对 DeepSeek-V4-Pro(以下简称 "V4-Pro")限时 2.5 折,再将全系列模型,输入缓存命中的价格降至首发价格的 1/10。即在促销期间,V4-Pro 输入缓存命中价格从 1 元 / 百万 tokens 跌至 0.025 元 / 百万 tokens。

此前,国内 AI 行业正处在涨价周期,大模型公司智谱三度提价,月之暗面新模型的输入和输出价格不同程度上涨,云厂商也动作一致,百度智能云、腾讯云、阿里云调价,理由是同一套:全球算力需求激增,硬件成本上涨。

过去一年,大模型从 " 价格战 " 打到 " 涨价潮 ",没人真正赚到钱,营收和净亏损齐涨。DeepSeek 用 0.025 元抛出了一个问题,当推理成本可以被持续压缩,大模型公司的护城河,究竟是更便宜的 token,还是更不可替代的价值?

逆行者

DeepSeek 的降价来得低调,但并不含蓄。

4 月 24 日,DeepSeek 全新系列模型 DeepSeek-V4 的预览版本正式上线并同步开源。该模型按大小分为两个版本:V4-Pro 参数较大,1.6T;V4-flash 参数 284B。两个版本支持的上下文长度都是 100 万。" 从现在开始,1M(100 万)上下文将是 DeepSeek 所有官方服务的标配 ",DeepSeek 特别加粗强调。

当天,DeepSeek 公布了两个版本模型的价格,V4-Pro 输入(缓存命中)价格 1 元 / 百万 tokens,输入(缓存未命中)价格 12 元 / 百万 tokens,输出价 24 元 / 百万 tokens。同样情况下,V4-flash 的价格分别是 0.2 元 / 百万 tokens、1 元 / 百万 tokens 和 2 元 / 百万 tokens。

次日,降价开始,且不止一次。

4 月 25 日,DeepSeek 开启 V4-Pro 模型的限时特惠活动,API 价格享受 2.5 折优惠,优惠期限至 5 月 5 日。4 月 26 日,DeepSeek 全系列模型输入缓存命中的价格降到原价的 1/10。

DeepSeek 研究员陈德里在社交平台提醒," 输入缓存(命中)的折扣是永久的,折扣促销活动将持续到 5 月 5 日 "。

4 月 28 日,DeepSeek 又将 V4-Pro 的 2.5 折限时优惠,从 5 月 5 日延长至 5 月 31 日。

按此计算,在 5 月 31 日之前,V4-Pro 模型百万 tokens 的输入(缓存命中)价格从原来的 1 元降到了 0.025 元。5 月 31 日之后,也只有 0.1 元。这是 DeepSeek 这波降价活动中,折扣幅度最大的一项。

何为缓存命中,与缓存未命中有什么区别?

一位头部云厂商工程师向北京商报记者解释," 简单说,缓存命中是指模型‘记得’你之前问过类似的内容,可以直接调用记忆回答不参与推理,收费便宜。缓存未命中相反,意思是模型第一次见这个内容,需要从头算一遍,所以收费贵 "。

资本市场快速反应。4 月 27 日,即 DeepSeek 降价后的第一个交易日,智谱和 MiniMax 的股价出现不同程度下滑。

0.025 元的支撑

这个价格不是凭空出现的。

根据官方技术解读,DeepSeek-V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。

这与外部观察一致。CHIP 中国实验室主任罗国昭向北京商报记者分析称,DeepSeek V4 降价 " 更大程度上跟模型算法优化、同等性能的算力消耗降低有关,和定位同样的大模型相比,V4 的优势是在更多参数、更高性能情况下的更低价格 "。他也谈及硬件成本,但强调 " 与采购国产芯片只有宏观的相关性,没有直接和实时的关联 "。

另一家大模型厂商从业者楚清(化名)则提供了另一种解释:" 看上去是 DeepSeek 在全栈适配国产算力方面领先,所以敢于定低价 "。他的观点建立在 DeepSeek 模型价位表下的一行小字:" 受限于高端算力,目前 Pro 的服务吞吐十分有限,预计下半年昇腾 950 超节点批量上市后,V4-Pro 的价格会大幅下调 "。

一个值得注意的插曲是,4 月 24 日也就是 DeepSeek 模型上新当天,华为计算宣布:昇腾一直同步支持 DeepSeek 系列模型,本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持 DeepSeek V4 系列模型。

DeepSeek 也将华为昇腾和英伟达一起写进 DeepSeek-V4 技术报告:" 我们在英伟达 GPU 和华为昇腾 NPU 平台上验证了细粒度 EP(专家并行)方案。"

4 月 28 日,摩根士丹利亚太研究团队发布的最新行业报告《China's AI Path: More Bang For The Buck》也提到,中国模型的 " 性价比 " 优势集中体现在:以美国同行 15% — 20% 的推理成本实现同等智能水平。报告将工程效率提升归因于三大方向:架构层面的稠密模型与 MoE、注意力机制改进;后训练层面的强化学习与模型蒸馏,以及推理基建层面的硬件优化与 KV cache(一种缓存机制)效率。新近发布的 DeepSeek-V4 被视为最新例证。

谁会接招

不过,摩根士丹利还是大幅上调中国两大前沿 AI 公司目标价,其中,MiniMax 目标价由 990 港元上调至 1100 港元,行业评级维持 "In-Line",并明确预期,MiniMax 在 M3 模型升级后将启动重大价格上调,这或成为下一阶段 ARR(会计收益率)催化剂。

从企业层面看,DeepSeek 的降价暂时没有等来同行跟进。

4 月 28 日,北京商报记者就会否跟进降价,采访了智谱、MiniMax、百度智能云、阿里云、腾讯云,截至发稿,以上几家公司相关人士均未回应。

楚清从技术层面解释了这种分化的原因:" 其他公司如果没有和国产算力提前优化适配的话,短期内成本降不下来。"

文渊智库创始人王超的判断更聚焦于价格本身的长期趋势:"token 降价是技术的进步,否则不可能实现。最近不管是算力、token、芯片、内存的价格都在上涨,处在一个小周期上涨的阶段,但大周期肯定是要下降的。"

作为智能体赛道的一员,猎豹移动董事长兼 CEO 傅盛更关注另一条路径的可能性。

他在试用 V4 系列模型后认为,"V4 把国产 AI 大模型,无论开源还是闭源的性能又提高到一个更高的水平,直逼全球最强模型。虽然还有 3 — 6 个月差距,但已经足够好用了。更重要的是,DeepSeek 可能正在引领国产 AI 走出一条和美国 AI 不同的道路 "。

这些判断并不矛盾,DeepSeek 用技术降本验证大周期下降的方向,而智谱、MiniMax 们在用涨价对冲小周期上涨的压力,但从业者都明白核心护城河一定不只是价格这一单一要素,DeepSeek 已经给出了它的答案,但行业还在沉默中等待更多人表态。

北京商报记者 魏蔚

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里云 逆行者 腾讯云 ai 社交平台
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论