
* 该文章由特工宇宙编辑团队,与 TokenDance 数据团队共同撰写。
你自己,或者你的公司,还在加大 Token 的投入吗?
最近,几个大厂关于 Token 这件事,态度集体变了。
Meta 在 30 天内消耗 60 万亿 Token、账单超 1 亿美元后,开始强制限额。微软也直接取消了大部分内部 Claude Code 授权。
不止国外如此,国内大厂也开始收紧预算:
据爆料,有腾讯员工 6 月的 Token 配额从约 13500 人民币被砍到 1400 多人民币,降幅接近 90%。小红书上也有其他大厂员工吐槽,自己所在大厂也在偷偷收紧员工的配额。

而这一切发生的背景是:Token 单价已经跌到了三年前的 1%。
越便宜,反而越烧不起???
从所有大厂的集体狂欢,到所有大厂的集体态度转向,这中间到底发生了什么?

Tokenmaxxing 已死
如果回顾这件事,时间线要拉得更长一些。
2025 年下半年开始,硅谷掀起了一股「AI 用量大即代表先进性」的风潮。
首先是 Meta 把 AI 使用纳入员工绩效考核,然后 Google CEO 把 AI 强制使用范围从工程师扩大到全部非技术部门。
后来更进一步,各个硅谷大厂内部排行榜遍地开花:
Meta 搞了「Claudeonomics」排行榜,前 250 名获封 Token Legend;亚马逊搞了 KiroRank,按团队排名鼓励使用;Uber 也有内部 AI 使用排行榜,按团队活跃度公开比较。
终于,到了 2026 年 3 月,这股风潮终于有了自己的名字——「Tokenmaxxing」,最大化 Token 消耗量。
值得一提的是,黄仁勋在今年 3 月份 GTC 2026 主题演讲中提出「Token 应列入工程师薪资结构」,将算力 Token 定位为科技人才的核心配套福利。
大会收官后他在《All-In》播客采访中更进一步,给这股行业浪潮点了把火:「如果一名年薪 50 万美元的工程师在 Token 上的支出低于 25 万美元,那将令人非常担忧」..
老黄的两套言论叠加发酵后,硅谷开始认真讨论 Token 作为第四薪酬支柱的可能性。
......
视角回到国内,今年 3 月腾讯率先跟团,被曝出给员工配备人均 22 万预算的 AI 大礼包,网友纷纷感叹「壕无人性」,同期国内各个大厂,也开始纷纷提高给员工的 AI 预算,生怕掉队。
一时间,硅谷卷用量,国内卷预算,Tokenmaxxing 成了全球大厂的集体信仰。
但吊诡的是,当「Tokenmaxxing」这个标签走红的时刻,恰好就是它崩盘的开始。
Meta 排行榜上有员工单月烧掉近 50 万美元,而其排行榜也上线两天就被迫下线。亚马逊发现员工为了刷榜让 AI Agent 执行完全无意义的任务,KiroRank 也关闭了。
今年 4 月,Uber CTO 公开承认公司仅用 4 个月就烧光了 2026 全年 AI 预算。
到了 5 月,微软开始清退 Claude Code 授权,引导工程师回到自家 GitHub Copilot。
到了 6 月,腾讯被曝开始下调 Token 额度,The Economist 和 Business Insider 几乎同一周发出深度报道,JPMorgan 发布研报称「AI Token 成本正在吞噬企业利润」。
至此,全球大厂的态度集体变了:
「Tokenmaxxing」这个词从诞生到过时,只活了三个月。

为什么 Token 降价也烧不起
便宜,也不等于就省钱。
回到开头的问题:为什么 Token 单价跌了 99%,企业更烧不起了?
答案藏在一个经济学的现象里。
GPT-4 在 2023 年发布时,每百万 Token 输入定价 30 美元。到今天,大量可用级推理模型已经降到几毛钱甚至更低。
但与此同时,企业的 AI 使用方式也发生了根本变化:从简单的问答对话,转向了 Agent 协作、代码生成、多轮复杂工作流。单次任务的 Token 消耗是简单问答的十倍甚至百倍。
单价降 99%,用量涨 100 倍,结果是一个反直觉的答案:企业对 Token 的总成本不降反升。
而这个结论,未来也会继续适用:高盛预测 Agentic AI 的 Token 消耗量将增长 24 倍,但 Gartner 预测到 2030 年推理成本只下降约 90%。增速远超降幅。
这个现象在经济学里有个现成的名字:杰文斯悖论。
19 世纪英国人发现蒸汽机效率提升后,煤炭消耗不减反增,因为效率提升只带来了更多需求。
AI Token 正在重演同一个剧本。
更要命的是,底层物理成本越来越贵了:高带宽内存价格半年涨了 50% 以上,先进封装产能排到年底,B200 芯片租用费翻倍至近 6 美元 / 小时,今年三月阿里云 AI 算力产品最高涨价 34%。
而在销售侧,模型厂商也在承受压力:本来想靠低价卷一波市场,但是他们最终发现用户一个个的都是 " 白眼狼 " ——模型低价换不来用户黏性,用户要的不是便宜,而是能力。
所以结果就是:企业扛不住成本,模型厂商扛不住亏损。
而当供需两端同时见顶,Tokenmaxxing 的故事就讲不下去了。

Token 排行榜催生的荒诞剧
不过,比上述纯粹的成本问题更值得关注的,是 Tokenmaxxing 文化带来的一系列荒诞剧情。
「用量等于价值」这个 KPI 逻辑,在组织行为层面产生了一系列意想不到的后果:国外有亚马逊员工为了冲分,让 AI 反复执行毫无意义的任务。国内有某新能源汽车公司的员工,为消耗额度用 AI 续写《红楼梦》。
Entelligence.AI 对 2444 家企业的研究也给出了一组残酷的数字:每投入 1 美元 AI Token 费用,仅 18 美分产生了触达用户的实际价值。44 美分用于修复 AI 引入的 Bug,27 美分流向返工,11 美分被审查消耗。
Uber COO 分享了对这个现象的判断:Token 消耗和给用户的功能没有关系。很难把员工个人生产力的提升和公司整体的业务影响联系起来。
而当一个 KPI 体系奖励的是消耗量本身,作弊和浪费就是必然结果。
更关键的问题是,企业的高预算换不来利润的高价值:比如部分程序员,使用 AI 之后产出效率更低。
这是因为:许多程序员复盘时发现自己看不懂 AI 写的代码。
METR 的研究量化了这个影响:使用 AI 工具的资深开发者完成任务耗时比不使用 AI 的开发者多 19%,因为不断修复 Bug 和 AI 生成代码违背预期导致的返工,吞噬了效率提升。
于是,大厂对 Token 的态度转向,就成为一种必然。

真正的问题是 AI 治理
回看这整个过程,会发现一个结论越来越清晰:
大厂面临的真正问题,不是让员工使用 AI 提效的初心,而是企业对 AI 治理的管理层面的结构化失败。
Tokenmaxxing 的根本错误在于:它把 AI 当作福利来分配,而非生产资料来治理。
国内大厂期望给每个人发不限量的 Token,等同于给每个人发不限量的预算,然后期待大家自觉用在正确的地方。
但这在管理学上,没有任何先例能成功。
TechNews 有一个观察揭露了这个现象的本质:AI 没有帮企业省钱,只是把给员工的薪水换成了给 AI 公司的 Token 费用。
简单来说,真正赚钱的不是使用 AI 的企业,而是卖 Token 的 AI 公司。
事实也确实如此,调研显示:仅 14% 的 CFO 表示能看到 AI 投资有清晰可衡量的回报。Gartner 调查了 350 家年收入超 10 亿美元的企业,结论是「AI 驱动的裁员投资回报率为零」。
所以回顾整个故事,是一个淘金热结构:
卖铲子的人赚了钱,而淘金的人还在算账。
......
当大厂对 Token 的紧缩态度已经开始。未来会去向何处呢?
整体是从粗放走向精细管理的过程,目前有几个方向已经能看清未来 Token 管理的轮廓。
第一,分层管理正在成为标配。
据传,腾讯目前对待 Token 的做法是:全员统一额度改为按工作任务动态调配;而阿里、蚂蚁则按岗位给出差异化额度,据传产研岗月约 7000 元;字节则是自家 Trae 和自研 Agent,员工可免费使用,用户外采 Token 可部分报销(比如一些部门可报销 50%)。
「自研免费 + 标准额度 + 项目申请 + 外采部分报销」的架构,大概率会在未来一两年成为行业通行做法。
第二,从 Tokenmaxxing 思维,到关注 TokenValue。
这个转变有可能是 Token 紧缩的根本性出路:
当衡量标准从「用了多少」变成「产出了多少」,预算天花板就不再是约束,而是筛选器。
真正高 ROI 的员工和用法,自然会获得资源倾斜,低效消耗则被自然淘汰。
第三,模型选择在加速多元化。
成本压力下,一些大厂开始引入 DeepSeek 等性价比模型,同时推动「提示词路由」,把不同需求分配给不同成本的模型。由此得益的是许多中国厂商的开源模型,也在这一轮紧缩中获得了新的市场空间。

写在最后
从「Token 用得越多越好」到「每个 Token 都要算账」。
大厂对 Token 态度的集体转向,标志着 AI 从狂热期进入治理期。
但治理期真正考验的不是谁更省钱,而是谁能在约束条件下找到 AI 真正创造价值的方式。
毕竟,从「不限量供应」到「精打细算」,中间不是一道选择题,而是一道管理题:哪些岗位的 1000 块钱 Token 能换回 10000 块钱产出?
这个问题谁先答出来,或许,谁就拿到下一阶段的入场券。


登录后才可以发布评论哦
打开小程序可以发布评论哦