500 家企业逃离 Claude,DeepSeek 把 token 价格打穿了!

Claude Fable 5，每百万输出 token，50 美元。

上线三天，卒。

DeepSeek-V4-Pro，0.87 美元。

五十七分之一。

Anthropic 最强模型没了，但 AI 领域的价格战没停，反而愈演愈烈。

据报道，全球已经有超过 500 家企业从闭源模型切换到了开源模型。其中最大的赢家，是 DeepSeek。

过去半年，硅谷开始流行一个词，「tokenmaxxing」。

Token + max，疯狂刷 token。

今年 4 月和 5 月，大约 300 家上市公司在财报电话会上讨论了 AI token 的成本问题。一年前，这个数字是 93 家。

云存储公司 Box CEO 说，token 预算已经成了公司内部「最重要、也最激烈」的话题。加拿大皇家银行 CEO 透露，公司 token 用量半年内暴增 500%。

老板要求全员拥抱 AI，员工开始比赛谁用的 token 多。有的公司内部甚至搞了个排行榜，叫「Claudeonomics」，按 token 消耗量给员工排名。

AI 编程工具 Factory 的 CEO Matan Grinberg 透露了一个细节。一家顶级金融机构的高管向他吐槽，员工每月 token 开销高达几十万美元。有人拿最贵的旗舰模型回答最简单的问题，甚至用来闲聊。

「如果你女儿需要补习代数，大概率是不需要请爱因斯坦当家教的。」

然后账单来了。

Uber 去年 12 月开始全员推广 Claude Code。三个月后，工程团队的使用率从 32% 飙升到了 84%。到今年 4 月，全年 AI 预算就已经花光了。每个工程师每月的 API 费用在 500 到 2000 美元之间。

Uber COO 公开质疑，「投入和产出之间的关联性，目前还没有建立起来。」

Meta 也在调整。CTO Andrew Bosworth 在内部提醒员工，「不要为了用 AI 而用 AI，token 用量不等于工作成果。」

微软 6 月底之前将收回部分团队的 Claude Code 权限，统一切换到自家 GitHub Copilot CLI。截止日期 6 月 30 号，财年最后一天。

最扎心的一组数据，来自 Entelligence AI。

这家公司分析了 2000 多家企业的代码库，范围覆盖超过 100 万次代码提交。

先说结论。「企业花在 AI token 上的每一块钱，只有 1 毛 8 最终变成了用户手里的产品。」

剩下的钱去哪了？44% 花在修复 AI 自己写出来的 bug。27% 用在了返工和重写。11% 消耗在代码审查。

还有一组数字。每周写的代码里，四分之一直接就被扔掉了。代码提交量 12 周内翻了 2.6 倍，但回滚量同样增长了 3.7 倍。

代码产出在涨。无效代码可能涨得更快。

OpenAI CEO Sam Altman 6 月初在一场企业客户活动上表示，token 成本「突然变成了一个大问题」。他引用了一位客户的吐槽，「我公司第一季度就花光了全年预算，能不能让 AI 便宜点？」

OpenAI 最大的一个企业客户，每月消耗大约 1000 亿个 token。几年前，全球用得最多的客户每月才 10 万个。

增长了 100 万倍。

但企业的反应不只是「省钱」。

还有「换人」。

AI 助手创业公司 Lindy 的创始人 Flo Crivello 说，两个月前开始测试 DeepSeek-V4 模型。结果发现，处理邮件、管理日程、记录会议，效果不输 Claude Sonnet 4.6。邮件分类甚至更好。

关键是，便宜了 10 倍。

Lindy 最终把全部 AI 用量切换到了 DeepSeek，只有内部编程任务还在用 Anthropic 更强的模型。每年能省下几百万美元。

这不是个案。在 AI 开发平台 Vercel 上，DeepSeek 的 token 份额从 4 月的不到 1%，飙升到了 5 月的 17%。在 OpenRouter 上，DeepSeek 从 5 月中旬开始成为使用量最大的 AI 公司。开源模型的使用量增速，是闭源模型的 4 倍。

国产模型占了平台 token 总量的近一半。一年前，这个数字不到 2%。

在 Vercel 的 AI 编程场景里，DeepSeek 处理了 49% 的工作量，但只花了 4% 的钱。Anthropic 处理了 28% 的工作量，却花了 70%。

同一个平台，同一类任务。DeepSeek 干了将近一半的活，Anthropic 占了大部分成本。

不只是 DeepSeek。阿里 Qwen 系列下载量接近 10 亿次，占到全球开源模型下载量的一半以上。开源 AI 的生态，正在以肉眼可见的速度壮大。

不是所有企业都一刀切。更多公司选择了「混合使用模型」。

Factory 搭建了一套自动调度系统。AI Agent 接到任务后，简单任务用便宜模型，复杂任务调用 Claude 或 GPT。据称这套系统最多可以把 AI 成本降低 95%。Factory 今年 4 月完成了 1.5 亿美元 C 轮融资，估值 15 亿美元。

Matan Grinberg 说，最近几周他的电话要被金融、电信行业的高管打爆了。所有人都在问同一个问题，怎么降低 AI 支出。

前谷歌云负责人 Andrew Moore 创办的 Lovelace AI，思路也类似。「我们的 AI Agent 现在特别抠门。它们知道怎么从最便宜的模型里榨出结果。搞不定的时候，才临时跳到更贵的模型上。」

还有一家专门检测代码 bug 的创业公司 Detail。创始人 Dan Robinson 表示，已经把 90% 的工作量从 Claude 和 Gemini 转移到了自研模型和智谱的 GLM 系列上。

开源模型曾经是「平替」。现在它们变成了「首选」。

OpenAI 感受到了压力。

据报道，OpenAI 正在考虑大幅降低 token 价格。我们之前聊过，OpenAI 认为自己有优势，过去一年花了大量资金锁定低价算力，打价格战有底气。

Anthropic 发言人这样自证，「企业越来越在意的是完成一个任务的总成本，不是每个 token 的单价。旗舰模型处理复杂任务时用的 token 更少，总成本不一定高。」

这话其实有一定道理。据研究者估计，闭源模型在能力上仍然领先开源四到六个月。一些复杂任务用旗舰模型反而更划算，因为小模型需要反复试错，总 token 消耗未必更少。

但就连那些已经尝到甜头的公司也开始紧张了。一家靠 Claude 省下了 500 万美元的软件公司透露，公司正在考虑给 Opus 设门槛，想用就得先证明便宜模型搞不定。

市场已经用脚投票了。

微软近期发布了一套更小、更高效的 AI 模型。英伟达推出了 Nemotron 系列，定位平价替代。连芯片公司都在帮企业省钱。

一份投行研报追踪的全球 AI 支出指数连续 7 天下跌，创下今年以来最长下跌纪录。报告里写道，「即使是最强大的技术，也必须经历成本曲线、产能约束和边际收益递减的考验。」

AI 本身的需求并没有放缓。

谷歌在今年开发者大会上公布，谷歌云每月处理超过 3200 万亿个 token，是一年前的 7 倍。

增长没停。是增长的方式变了。

不再是一个大模型打天下。大模型负责思考，小模型负责干活。便宜模型处理大部分任务，旗舰模型只在关键时刻上场。

这可能是更有「性价比」的方式。

我是木易，Top2 + 美国 Top10 CS 硕，现在是 AI 产品经理。

宙世代

一起剪

相关标签