对于 Token 这件事，大厂的态度集体变了！

* 该文章由特工宇宙编辑团队，与 TokenDance 数据团队共同撰写。

你自己，或者你的公司，还在加大 Token 的投入吗？

最近，几个大厂关于 Token 这件事，态度集体变了。

Meta 在 30 天内消耗 60 万亿 Token、账单超 1 亿美元后，开始强制限额。微软也直接取消了大部分内部 Claude Code 授权。

不止国外如此，国内大厂也开始收紧预算：

据爆料，有腾讯员工 6 月的 Token 配额从约 13500 人民币被砍到 1400 多人民币，降幅接近 90%。小红书上也有其他大厂员工吐槽，自己所在大厂也在偷偷收紧员工的配额。

而这一切发生的背景是：Token 单价已经跌到了三年前的 1%。

越便宜，反而越烧不起？？？

从所有大厂的集体狂欢，到所有大厂的集体态度转向，这中间到底发生了什么？

Tokenmaxxing 已死

如果回顾这件事，时间线要拉得更长一些。

2025 年下半年开始，硅谷掀起了一股「AI 用量大即代表先进性」的风潮。

首先是 Meta 把 AI 使用纳入员工绩效考核，然后 Google CEO 把 AI 强制使用范围从工程师扩大到全部非技术部门。

后来更进一步，各个硅谷大厂内部排行榜遍地开花：

Meta 搞了「Claudeonomics」排行榜，前 250 名获封 Token Legend；亚马逊搞了 KiroRank，按团队排名鼓励使用；Uber 也有内部 AI 使用排行榜，按团队活跃度公开比较。

终于，到了 2026 年 3 月，这股风潮终于有了自己的名字——「Tokenmaxxing」，最大化 Token 消耗量。

值得一提的是，黄仁勋在今年 3 月份 GTC 2026 主题演讲中提出「Token 应列入工程师薪资结构」，将算力 Token 定位为科技人才的核心配套福利。

大会收官后他在《All-In》播客采访中更进一步，给这股行业浪潮点了把火：「如果一名年薪 50 万美元的工程师在 Token 上的支出低于 25 万美元，那将令人非常担忧」..

老黄的两套言论叠加发酵后，硅谷开始认真讨论 Token 作为第四薪酬支柱的可能性。

......

视角回到国内，今年 3 月腾讯率先跟团，被曝出给员工配备人均 22 万预算的 AI 大礼包，网友纷纷感叹「壕无人性」，同期国内各个大厂，也开始纷纷提高给员工的 AI 预算，生怕掉队。

一时间，硅谷卷用量，国内卷预算，Tokenmaxxing 成了全球大厂的集体信仰。

但吊诡的是，当「Tokenmaxxing」这个标签走红的时刻，恰好就是它崩盘的开始。

Meta 排行榜上有员工单月烧掉近 50 万美元，而其排行榜也上线两天就被迫下线。亚马逊发现员工为了刷榜让 AI Agent 执行完全无意义的任务，KiroRank 也关闭了。

今年 4 月，Uber CTO 公开承认公司仅用 4 个月就烧光了 2026 全年 AI 预算。

到了 5 月，微软开始清退 Claude Code 授权，引导工程师回到自家 GitHub Copilot。

到了 6 月，腾讯被曝开始下调 Token 额度，The Economist 和 Business Insider 几乎同一周发出深度报道，JPMorgan 发布研报称「AI Token 成本正在吞噬企业利润」。

至此，全球大厂的态度集体变了：

「Tokenmaxxing」这个词从诞生到过时，只活了三个月。

为什么 Token 降价也烧不起

便宜，也不等于就省钱。

回到开头的问题：为什么 Token 单价跌了 99%，企业更烧不起了？

答案藏在一个经济学的现象里。

GPT-4 在 2023 年发布时，每百万 Token 输入定价 30 美元。到今天，大量可用级推理模型已经降到几毛钱甚至更低。

但与此同时，企业的 AI 使用方式也发生了根本变化：从简单的问答对话，转向了 Agent 协作、代码生成、多轮复杂工作流。单次任务的 Token 消耗是简单问答的十倍甚至百倍。

单价降 99%，用量涨 100 倍，结果是一个反直觉的答案：企业对 Token 的总成本不降反升。

而这个结论，未来也会继续适用：高盛预测 Agentic AI 的 Token 消耗量将增长 24 倍，但 Gartner 预测到 2030 年推理成本只下降约 90%。增速远超降幅。

这个现象在经济学里有个现成的名字：杰文斯悖论。

19 世纪英国人发现蒸汽机效率提升后，煤炭消耗不减反增，因为效率提升只带来了更多需求。

AI Token 正在重演同一个剧本。

更要命的是，底层物理成本越来越贵了：高带宽内存价格半年涨了 50% 以上，先进封装产能排到年底，B200 芯片租用费翻倍至近 6 美元 / 小时，今年三月阿里云 AI 算力产品最高涨价 34%。

而在销售侧，模型厂商也在承受压力：本来想靠低价卷一波市场，但是他们最终发现用户一个个的都是 " 白眼狼 " ——模型低价换不来用户黏性，用户要的不是便宜，而是能力。

所以结果就是：企业扛不住成本，模型厂商扛不住亏损。

而当供需两端同时见顶，Tokenmaxxing 的故事就讲不下去了。

Token 排行榜催生的荒诞剧

不过，比上述纯粹的成本问题更值得关注的，是 Tokenmaxxing 文化带来的一系列荒诞剧情。

「用量等于价值」这个 KPI 逻辑，在组织行为层面产生了一系列意想不到的后果：国外有亚马逊员工为了冲分，让 AI 反复执行毫无意义的任务。国内有某新能源汽车公司的员工，为消耗额度用 AI 续写《红楼梦》。

Entelligence.AI 对 2444 家企业的研究也给出了一组残酷的数字：每投入 1 美元 AI Token 费用，仅 18 美分产生了触达用户的实际价值。44 美分用于修复 AI 引入的 Bug，27 美分流向返工，11 美分被审查消耗。

Uber COO 分享了对这个现象的判断：Token 消耗和给用户的功能没有关系。很难把员工个人生产力的提升和公司整体的业务影响联系起来。

而当一个 KPI 体系奖励的是消耗量本身，作弊和浪费就是必然结果。

更关键的问题是，企业的高预算换不来利润的高价值：比如部分程序员，使用 AI 之后产出效率更低。

这是因为：许多程序员复盘时发现自己看不懂 AI 写的代码。

METR 的研究量化了这个影响：使用 AI 工具的资深开发者完成任务耗时比不使用 AI 的开发者多 19%，因为不断修复 Bug 和 AI 生成代码违背预期导致的返工，吞噬了效率提升。

于是，大厂对 Token 的态度转向，就成为一种必然。

真正的问题是 AI 治理

回看这整个过程，会发现一个结论越来越清晰：

大厂面临的真正问题，不是让员工使用 AI 提效的初心，而是企业对 AI 治理的管理层面的结构化失败。

Tokenmaxxing 的根本错误在于：它把 AI 当作福利来分配，而非生产资料来治理。

国内大厂期望给每个人发不限量的 Token，等同于给每个人发不限量的预算，然后期待大家自觉用在正确的地方。

但这在管理学上，没有任何先例能成功。

TechNews 有一个观察揭露了这个现象的本质：AI 没有帮企业省钱，只是把给员工的薪水换成了给 AI 公司的 Token 费用。

简单来说，真正赚钱的不是使用 AI 的企业，而是卖 Token 的 AI 公司。

事实也确实如此，调研显示：仅 14% 的 CFO 表示能看到 AI 投资有清晰可衡量的回报。Gartner 调查了 350 家年收入超 10 亿美元的企业，结论是「AI 驱动的裁员投资回报率为零」。

所以回顾整个故事，是一个淘金热结构：

卖铲子的人赚了钱，而淘金的人还在算账。

......

当大厂对 Token 的紧缩态度已经开始。未来会去向何处呢？

整体是从粗放走向精细管理的过程，目前有几个方向已经能看清未来 Token 管理的轮廓。

第一，分层管理正在成为标配。

据传，腾讯目前对待 Token 的做法是：全员统一额度改为按工作任务动态调配；而阿里、蚂蚁则按岗位给出差异化额度，据传产研岗月约 7000 元；字节则是自家 Trae 和自研 Agent，员工可免费使用，用户外采 Token 可部分报销（比如一些部门可报销 50%）。

「自研免费 + 标准额度 + 项目申请 + 外采部分报销」的架构，大概率会在未来一两年成为行业通行做法。

第二，从 Tokenmaxxing 思维，到关注 TokenValue。

这个转变有可能是 Token 紧缩的根本性出路：

当衡量标准从「用了多少」变成「产出了多少」，预算天花板就不再是约束，而是筛选器。

真正高 ROI 的员工和用法，自然会获得资源倾斜，低效消耗则被自然淘汰。

第三，模型选择在加速多元化。

成本压力下，一些大厂开始引入 DeepSeek 等性价比模型，同时推动「提示词路由」，把不同需求分配给不同成本的模型。由此得益的是许多中国厂商的开源模型，也在这一轮紧缩中获得了新的市场空间。

写在最后

从「Token 用得越多越好」到「每个 Token 都要算账」。

大厂对 Token 态度的集体转向，标志着 AI 从狂热期进入治理期。

但治理期真正考验的不是谁更省钱，而是谁能在约束条件下找到 AI 真正创造价值的方式。

毕竟，从「不限量供应」到「精打细算」，中间不是一道选择题，而是一道管理题：哪些岗位的 1000 块钱 Token 能换回 10000 块钱产出？

这个问题谁先答出来，或许，谁就拿到下一阶段的入场券。

宙世代

一起剪

相关标签