当下Tech 昨天
当 Token 越来越便宜,账单为什么越来越贵
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

Django 框架联合创始人 Simon Willison,大概是今天世界上最懂 Claude Code 和 Codex 的开发者之一。

过去 30 天,他消耗了价值 2180.16 美元的 token,实际支付只有 200 美元。

很多人看到的是划算。

Simon 看到的却是另一件事。

因为这笔便宜,正在消失。

OpenAI 已经把 Codex 从按消息估算改回按 token 计费;Anthropic 没有提高 Opus 4.7 的挂牌价格,却通过新的 tokenizer 让同样文本最多多切 35% token。过去被平台补贴掉的那部分成本,正在一点点回到用户账单上。

对 Simon 来说,这意味着一个非常具体的变化:过去 200 美元烧掉 2000 多美元 token 的日子,正在成为历史,而不会再成为一种长期模式。未来某一天,他消耗的那 2180 美元,很可能真的需要支付 2180 美元。

对任何重度开发者来说,这都不是一个轻松的消息。

问题在于,这件事几乎不可避免。

企业已经率先感受到了这种变化。

据 The Information 报道,Uber 进入 2026 年没几个月就烧穿了全年 AI 预算,主因是 Claude Code。4 月 23 日,OpenAI 发布 GPT-5.5,输入和输出价格从 GPT-5.4 的 2.5/15 美元提高到 5/30 美元;Anthropic 虽然维持 Opus 4.7 的挂牌价格不变,但 Willison 估算其有效成本约为 Opus 4.6 的 1.4 倍。

一个明涨,一个暗涨。

如果只看这些新闻,很容易得出一个结论:AI 越来越贵了。

问题是,这个结论恰恰与过去几年最重要的研究结果相反。

a16z 合伙人 Guido Appenzeller 给这条曲线起过一个名字:LLMflation。

2021 年,每百万 token 60 美元的 GPT-3 级能力,今天只需要 0.06 美元。

武汉大学 Mingdeng Du 团队今年 3 月统计 OpenRouter 318 个模型和 Epoch AI 3237 条记录后发现,过去六年,token 价格整体下降约 600 倍。经济档模型价格半衰期只有 1.10 年,中档模型 1.55 年,都快过摩尔定律。

如果只看成本,今天的大模型行业根本不像在涨价。

更像在经历一场历史上罕见的通缩。

于是问题来了。

如果成本在塌,账单为什么越来越贵?

因为企业今天付的钱,很多讨论把这两笔钱混在一起,于是永远算不明白这笔账。

先看第一笔。

Claude Code 修一个 Bug,不是在聊天框里回答问题。它要读代码仓库、分析依赖关系、调用工具、运行测试、理解报错,再把结果重新送回模型推理。用户最后看到的可能只是几百行代码改动,背后滚过去的却是几十万 token。

推理模型也是如此。

行业测算显示,一些复杂推理任务里,模型内部消耗的 token 可以达到最终输出的几十倍甚至上百倍。

所以 Uber 的预算失控,未必意味着浪费。

也可能意味着另一件事:AI 开始真正干活了。

过去几年,人们习惯把大模型当搜索引擎、聊天机器人或者写作助手。今天越来越多企业把它当工程师、分析师、运营人员和客服团队使用。

任务变复杂了。

消耗自然会上升。

买法拉利的人不会抱怨油耗。

不是因为他不在乎钱。

而是买法拉利,本身就是为了那套性能。

今天很多 Agent 任务也是一样。代码审查、复杂运维、金融分析、合同审核,这些场景里,顶级 Agent 和顶级模型往往是绑定关系。你当然可以换一个便宜五倍的模型,但结果很可能一起打折。

这部分钱,买的是能力。

它没有白花。

如果故事到这里结束,那么结论会很简单:AI 更能干了,所以 AI 更贵了。

可问题偏偏出在这里。

过去几年最重要的研究结果,讲的恰恰是另一件事。

AI 并没有变贵。

AI 正在经历一场前所未有的降价。

很多人记住了武汉大学那篇论文里的六年降价 600 倍。

真正值得看的,却不是这组数字。

而是那条没有降下来的曲线。

论文把模型分层以后发现,经济档和中档模型都在沿着同一条轨迹下滑。能力越来越普及,价格越来越接近成本。

如果故事到这里结束,那么 AI 最终会变成一种标准化商品。

就像云服务器、电力或者带宽。

问题在于,偏偏有一部分模型不遵守这个规律。

论文对旗舰模型价格做指数拟合,得到的 R ² 只有 0.031。

翻译成人话就是:

降价规律到了这里,几乎失效了。

与此同时,推理模型相对于普通模型还存在平均 31.5 倍溢价。

这不是统计误差。

这是市场结构。

普通能力越来越便宜。

不可替代的能力没有。

OpenAI 把 GPT-5.5 的价格提高一倍,Anthropic 让 Opus 4.7 通过 tokenizer 提高有效价格,都发生在这条曲线之外。

于是一个有意思的现象出现了。

同样叫 token。

有些 token 正在迅速商品化。

有些 token 正在迅速硬通货化。

前者的价格越来越接近成本。

后者的价格越来越接近稀缺性。

这也是为什么 GPT-5.5 和 DeepSeek 可以同时存在,而且都合理。

前者卖的是当前最强能力。

后者卖的是已经被验证、正在扩散的能力。

两者都在 AI 市场里。

但遵循的是两套不同的定价原则。

看到这里,一个问题自然会冒出来。

既然顶级模型最终都会扩散,既然今天的 GPT-5.5 迟早会变成明天的普通能力,为什么还要有人拼命往塔尖冲?

因为塔尖最大的价值,从来不是卖贵。

而是定义什么叫先进。

汽车行业就是这样。

一辆 5 万元的车和一辆 500 万元的车,都能把人从 A 点送到 B 点。后者当然更贵。但豪车存在的意义,从来不只是让富人消费。

ABS、ESP、主动安全、智能驾驶,很多后来成为行业标配的东西,最早都出现在最贵的那批车上。等技术成熟,再进入更大的市场。

豪车赚到的钱是一回事。

更重要的是,它定义了行业下一步往哪里走。

AI 也是一样。

最新的架构、最长的上下文、最复杂的推理链、最激进的训练方法,都会首先出现在塔尖模型里。它们中的绝大多数会失败,少数成功的部分再被蒸馏、压缩、工程化,最后进入更便宜的产品。

塔尖不是为了卖得更贵而提价。

而是稀缺性和不可替代性,本身就是最刚性的价格支撑。

只要一个模型代表当前最先进能力,它的价格就不再完全由成本决定。

决定价格的,是有多少人需要它,以及有多少人能够替代它。

这也是美国前沿模型公司真正捍卫的东西。

不是某一个版本。

而是 " 最先进模型 " 这个位置本身。

美国以全球 AI 创新第一策源地自居。无论是否喜欢这个说法,至少在今天,它仍然掌握着最强闭源模型、最强商业化产品和最强融资能力。

既然掌握这个位置,价格自然不会跟着成本一起跌。

因为它卖的已经不是 token。

而是不可替代性。

美国前沿收的那笔租,不是利润,是赌注的本金。

SpaceX 的 S-1 招股文件里写着:Anthropic 自 2026 年 5 月起向它采购 COLOSSUS 与 COLOSSUS II 的算力,合约到 2029 年 5 月,每月最高约 12.5 亿美元,而这只是它供应商名单里的一家。

从价格与成本那道缝里挤出来的钱,转手喂进机房。

这种承诺只在一个前提下成立:

它赌自己手里那点不可替代性,未来几年塌不下来。

中国押的也是同一道题。

只是方向不同。

很多人把中国模型理解成低价路线。

这是一种误读。

如果只是低价,中国不会出现 DeepSeek 的百亿美元融资,不会出现智谱持续冲击更强编码能力,也不会出现腾讯混元结束两年单边降价、重新提高 API 价格。

中国企业同样在争夺塔尖。

因为没有人愿意永远接受别人的价格锚点。

真正的区别在于,中国更相信技术扩散。

DeepSeek 把 V4-Pro 永久降到原价四分之一,百万 token 输入输出合计约 5.27 美元,是 GPT-5.5 的七分之一、Claude Opus 4.7 的六分之一,同时推进约 100 亿美元融资。小米 MiMo-V2.5 系列永久降价,最高降幅 99%。火山引擎披露,豆包大模型日均 token 已突破 120 万亿,三个月翻倍。

这些动作背后不是简单的价格战。

而是一种产业判断。

过去二十年,中国最成功的产业几乎都遵循同一条路径。

新能源车如此。

动力电池如此。

光伏如此。

先追赶最先进技术,再把先进技术工程化、规模化、商品化,最后把原本属于少数人的能力带进大众市场。

AI 正在重复这条路径。

塔尖当然重要。

但体积最大的市场,从来不在塔尖。

中国赌的是,塔尖能力扩散的速度,会快于塔尖收租的速度。

而这道墙现在有多厚,没人知道。

智谱 4 月 7 日开源的 GLM-5.1,编程能力做到 Claude Opus 4.6 的 94.6%,MIT 协议商用零限制,训练全程跑华为昇腾、没有一张英伟达卡。

今天这场看上去在争 token 价格的争论,争的不是价格。

争的是 AI 的不可替代性还能维持多久。

美国赌的是这道墙足够厚。

中国赌的是这道墙会越来越薄。

等答案揭晓,两边的下注里,必有一笔成为再也收不回的沉没成本。

  —— END ——

作者|胡喆

    交流 / 互动 欢迎添加我的个人微信

胡喆

科技财经作家、数字产业资深观察家、品牌专家。

公众号「胡说成理」创办人、超头部自媒体撰稿人。

数字产业资深观察家,曾任雷锋网副总编、《电脑报》新闻中心主任多年,后应邀加入百度多年,成为百度历史上第一位 CEO 品牌专任负责人;亦较早服务于 UCWeb 的创业,后投身移动互联网创业企业任联合创始人、市场副总裁等。

品牌研究专家,受聘为分众传媒终身顾问、百度、妙可蓝多、问界汽车等企业和品牌的 CEO 品牌顾问、企业文化品牌顾问,作品被收入于《人心红利》《抢占心智》等著作中。

互联网史名作《沸腾新十年》联合作者,该书曾获得豆瓣、当当等权威图书平台的 "2022 年中国财经商管图书 Top10" 荣誉。

中国首部存储产业史《第四支柱:中国存力崛起录》作者。

热门推荐

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

创始人
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论