资讯动态 1小时前
500 家企业逃离 Claude,DeepSeek 把 token 价格打穿了!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

Claude Fable 5,每百万输出 token,50 美元。

上线三天,卒。

DeepSeek-V4-Pro,0.87 美元。

五十七分之一。

Anthropic 最强模型没了,但 AI 领域的价格战没停,反而愈演愈烈。

据报道,全球已经有超过 500 家企业从闭源模型切换到了开源模型。其中最大的赢家,是 DeepSeek。

过去半年,硅谷开始流行一个词,「tokenmaxxing」。

Token + max,疯狂刷 token。

今年 4 月和 5 月,大约 300 家上市公司在财报电话会上讨论了 AI token 的成本问题。一年前,这个数字是 93 家。

云存储公司 Box CEO 说,token 预算已经成了公司内部「最重要、也最激烈」的话题。加拿大皇家银行 CEO 透露,公司 token 用量半年内暴增 500%。

老板要求全员拥抱 AI,员工开始比赛谁用的 token 多。有的公司内部甚至搞了个排行榜,叫「Claudeonomics」,按 token 消耗量给员工排名。

AI 编程工具 Factory 的 CEO Matan Grinberg 透露了一个细节。一家顶级金融机构的高管向他吐槽,员工每月 token 开销高达几十万美元。有人拿最贵的旗舰模型回答最简单的问题,甚至用来闲聊。

「如果你女儿需要补习代数,大概率是不需要请爱因斯坦当家教的。」

然后账单来了。

Uber 去年 12 月开始全员推广 Claude Code。三个月后,工程团队的使用率从 32% 飙升到了 84%。到今年 4 月,全年 AI 预算就已经花光了。每个工程师每月的 API 费用在 500 到 2000 美元之间。

Uber COO 公开质疑,「投入和产出之间的关联性,目前还没有建立起来。」

Meta 也在调整。CTO Andrew Bosworth 在内部提醒员工,「不要为了用 AI 而用 AI,token 用量不等于工作成果。」

微软 6 月底之前将收回部分团队的 Claude Code 权限,统一切换到自家 GitHub Copilot CLI。截止日期 6 月 30 号,财年最后一天。

最扎心的一组数据,来自 Entelligence AI。

这家公司分析了 2000 多家企业的代码库,范围覆盖超过 100 万次代码提交。

先说结论。「企业花在 AI token 上的每一块钱,只有 1 毛 8 最终变成了用户手里的产品。」

剩下的钱去哪了?44% 花在修复 AI 自己写出来的 bug。27% 用在了返工和重写。11% 消耗在代码审查。

还有一组数字。每周写的代码里,四分之一直接就被扔掉了。代码提交量 12 周内翻了 2.6 倍,但回滚量同样增长了 3.7 倍。

代码产出在涨。无效代码可能涨得更快。

OpenAI CEO Sam Altman 6 月初在一场企业客户活动上表示,token 成本「突然变成了一个大问题」。他引用了一位客户的吐槽,「我公司第一季度就花光了全年预算,能不能让 AI 便宜点?」

OpenAI 最大的一个企业客户,每月消耗大约 1000 亿个 token。几年前,全球用得最多的客户每月才 10 万个。

增长了 100 万倍。

但企业的反应不只是「省钱」。

还有「换人」。

AI 助手创业公司 Lindy 的创始人 Flo Crivello 说,两个月前开始测试   DeepSeek-V4   模型。结果发现,处理邮件、管理日程、记录会议,效果不输   Claude Sonnet 4.6。邮件分类甚至更好。

关键是,便宜了 10 倍。

Lindy 最终把全部 AI 用量切换到了 DeepSeek,只有内部编程任务还在用 Anthropic 更强的模型。每年能省下几百万美元。

这不是个案。在 AI 开发平台 Vercel 上,DeepSeek 的 token 份额从 4 月的不到 1%,飙升到了 5 月的 17%。在 OpenRouter 上,DeepSeek 从 5 月中旬开始成为使用量最大的 AI 公司。开源模型的使用量增速,是闭源模型的 4 倍。

国产模型占了平台 token 总量的近一半。一年前,这个数字不到 2%。

在 Vercel 的 AI 编程场景里,DeepSeek 处理了 49% 的工作量,但只花了 4% 的钱。Anthropic 处理了 28% 的工作量,却花了 70%。

同一个平台,同一类任务。DeepSeek 干了将近一半的活,Anthropic 占了大部分成本。

不只是 DeepSeek。阿里 Qwen 系列下载量接近 10 亿次,占到全球开源模型下载量的一半以上。开源 AI 的生态,正在以肉眼可见的速度壮大。

不是所有企业都一刀切。更多公司选择了「混合使用模型」。

Factory 搭建了一套自动调度系统。AI Agent 接到任务后,简单任务用便宜模型,复杂任务调用 Claude 或 GPT。据称这套系统最多可以把 AI 成本降低 95%。Factory 今年 4 月完成了 1.5 亿美元 C 轮融资,估值 15 亿美元。

Matan Grinberg 说,最近几周他的电话要被金融、电信行业的高管打爆了。所有人都在问同一个问题,怎么降低 AI 支出。

前谷歌云负责人 Andrew Moore 创办的 Lovelace AI,思路也类似。「我们的 AI Agent 现在特别抠门。它们知道怎么从最便宜的模型里榨出结果。搞不定的时候,才临时跳到更贵的模型上。」

还有一家专门检测代码 bug 的创业公司 Detail。创始人 Dan Robinson 表示,已经把 90% 的工作量从 Claude 和 Gemini 转移到了自研模型和智谱的   GLM   系列上。

开源模型曾经是「平替」。现在它们变成了「首选」。

OpenAI 感受到了压力。

据报道,OpenAI 正在考虑大幅降低 token 价格。我们之前聊过,OpenAI 认为自己有优势,过去一年花了大量资金锁定低价算力,打价格战有底气。

Anthropic 发言人这样自证,「企业越来越在意的是完成一个任务的总成本,不是每个 token 的单价。旗舰模型处理复杂任务时用的 token 更少,总成本不一定高。」

这话其实有一定道理。据研究者估计,闭源模型在能力上仍然领先开源四到六个月。一些复杂任务用旗舰模型反而更划算,因为小模型需要反复试错,总 token 消耗未必更少。

但就连那些已经尝到甜头的公司也开始紧张了。一家靠 Claude 省下了 500 万美元的软件公司透露,公司正在考虑给 Opus 设门槛,想用就得先证明便宜模型搞不定。

市场已经用脚投票了。

微软近期发布了一套更小、更高效的 AI 模型。英伟达推出了 Nemotron 系列,定位平价替代。连芯片公司都在帮企业省钱。

一份投行研报追踪的全球 AI 支出指数连续 7 天下跌,创下今年以来最长下跌纪录。报告里写道,「即使是最强大的技术,也必须经历成本曲线、产能约束和边际收益递减的考验。」

AI 本身的需求并没有放缓。

谷歌在今年开发者大会上公布,谷歌云每月处理超过 3200 万亿个 token,是一年前的 7 倍。

增长没停。是增长的方式变了。

不再是一个大模型打天下。大模型负责思考,小模型负责干活。便宜模型处理大部分任务,旗舰模型只在关键时刻上场。

这可能是更有「性价比」的方式。

我是木易,Top2 + 美国 Top10 CS 硕,现在是 AI 产品经理。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 加拿大皇家银行 ceo 上市公司 金融机构
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论