量子位 16小时前
DeepSeek V4永久降价!缓存命中再打1折,实测编程成本骤降83%
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

DeepSeek 两天连续两次降价!

输入输出 2.5 折的基础上,命中缓存的输入折上折再打 1 折。

划重点了,输入缓存的折扣没有规定时限哦~

DeepSeek 研究员陈德里也确认,输入缓存是永久降价,还打上了 AGIforEveryone 标签。

有学者表示,这将彻底改变人们处理 AI 记忆的方式。

原来发布时候的 " 迈入百万上下文普惠时代 " 是这个意思啊?

那么打折后到底省了多少钱?

只能说,比表面看起来还要更多。

实测编程整体节省 83%

首先,Agent 编程任务场景下,输入的比例远高于输出。

而且 DeepSeek 的缓存优化本来就做得好,V4-Pro 的输入缓存命中率约 95%,V4-Flash 约 91%。

也就是说,真实花费的绝大部分 token,都是按输入(命中缓存)计算的。

在这一点上,V4-Pro 每百万 token 只比 V4-Flash 贵了 0.5 分钱。

此前量子位测试消耗约 3500 万 token,花费 31.73 元。

把数据发给 DeepSeek,让他计算一遍,与真实花费相差无几。

但是!

按照打折后的新价格计算,只需要花 5.34 元了。

整体节省约 83%,只花打折前 17% 的成本,就能获得同样的产出。

实际测试打折后消耗了 1300 万的 V4-Pro token。

缓存命中率稍有提升到了约 96%,输出 token 的占比与打折前测试的也差不多。

实际使用 1300 万 token,花费 2.36 元,也基本符合计算结果。

价格屠夫回来了

降价引发行业震动,DeepSeek 不是第一次干了。

这种商业策略与他们的技术理念高度一致,通过底层架构和算法的持续创新来压低模型推理成本,并将这些成本优势迅速转化为市场竞争力

早在 2024 年 8 月,DeepSeek 就给 V3 降价,引发阿里云、字节等大厂更近,引发第一轮 token 价格战。

R1 发布后,更是通过夜间空闲时段额外打折的方法,让价格战进一步升温。

这一次 V4 在开启价格战,对海外用户的心理冲击力还要更大。

如果按美元标价,小数点后有几位都快数不清楚了。

有网友总结,学生和 AI 初学者、小型企业都将受益匪浅。

最后,别忘了那行小字。

期待下半年,DeepSeek 大规模部署华为算力后,价格还能给大家什么惊喜。

参考链接:

[ 1 ] https://x.com/deepseek_ai/status/2048440764368347611?s=20

[ 2 ] https://x.com/victor207755822/status/2048442362800804159

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

谁会代表 2026 年的 AI?

龙虾爆火,带动一波 Agent 与衍生产品浪潮。

但真正值得长期关注的 AI 公司和产品,或许不止于此。

如果你正在做,或见证着这些变化,欢迎申报。

让更多人看见你。 https://wj.qq.com/s2/25829730/09xz/

一键关注 点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

命中率 ai 编程
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论