文 | 《硅谷观察》栏目 郑峻
AI 时代什么最贵?在经历了此前哄抢显卡和争夺人才的热潮之后,现在看来是算力,是 Token 成本。不仅普通企业只能省吃俭用,连科技巨头都没有余粮了。"Tokenmaxxing" 迅速变成了一个笑话。
云服务公司 Box CEO 亚伦 · 莱维(Aaron Levie)表示,他近期参加了一场有众多顶级企业高管的晚宴,发现商界领袖们讨论最多的话题,不是宏观经济议题,而是他们企业的 Token 成本。

莱维所说的并不令人意外。Uber 的 CTO 普拉文 · 内帕利 · 纳加(Praveen Neppalli Naga)上个月坦承:公司将 Claude Code 部署给约 5000 名工程师后,短短四个月内就将全年 AI 预算烧光殆尽,让他措手不及。
Uber 高层的本意是推广工程师们普及 AI 工具,从这个角度来看,他们达到了目的。上个月 Uber 工程师的 Claude Code 月使用率已飙至 95%。但高层并没有考虑到另一面,单个工程师每月产生的 API 成本高达 500 到 2000 美元。
面对着目瞪口呆的 Token 预算,即便是 Uber 这样市值 1500 亿美元的大企业都不得不紧急制定严苛的分级管理,限制员工的使用流量,像当年节省纸张一样精打细算着每一个 Token 的成本。
科技巨头都烧不起了
令人意外的是,收紧 AI 预算的不仅有 Uber 这样的中型企业,甚至还包括了微软和亚马逊的超级云计算巨头。
去年年底,微软最核心的 Experiences and Devices 部门——覆盖 Windows、Microsoft 365、Outlook、Teams 及 Surface 全线产品的核心工程团队——率先在内部大规模推行 Claude Code。
虽然微软对外强调并没有将 AI 使用量纳入员工绩效考核体系,但他们内部却流传着一份开发部门负责人朱莉娅 · 刘松(Julia Liuson)的内部备忘录,称 AI 的使用 " 不再是可选项,而是每个岗位、每个级别的核心要求 "。
但仅仅六个月后,这场实验就不得不被紧急叫停。这并不是因为效果不好,而是员工们用得太爽,用量太猛,才让 IT 部门猝不及防。就在本周,微软开始着手关闭大部分内部 Claude Code 授权。数以千计的工程师被强制迁移回微软自家的 GitHub Copilot CLI,以便进行成本管控。
然而,更触目惊心的案例来自 Axios 本周的独家报道。一家科技巨头因为没有对员工的 Claude 许可证设置使用上限,在短短一个月内烧掉了 5 亿美元。这不是一个抽象的数字:5 亿美元相当于许多中型科技公司的全年营收。
虽然报道没有实名,但外界普遍认为这说的是亚马逊,因为亚马逊此前在公司内部大力推行 AI 工具,并将开发者的 AI 使用量纳入内部排行榜考核,要求超过 80% 的开发者每周必须使用 AI。
这套考核机制迅速催生了一个新词:Tokenmaxxing ——专指员工为了刷高排行榜数据而人为制造无意义 AI 消耗的行为。亚马逊员工们用 MeshClaw 自动化那些根本不需要 AI 的日常任务,让 AI 智能体在后台空转,只为让自己的 token 消耗数字好看。
面对每个月高达 5 亿美元的天价 Token 账单,亚马逊高管最终意识到,员工大量使用 AI 是为了提升排名,而不是解决实际业务问题。

就在上周,亚马逊放弃了 AI 使用量考核,要求员工高效使用 AI 工具。一位亚马逊高管甚至告诫旗下员工,不要单纯地为了使用 AI 而使用 AI。这种态度和此前形成了鲜明对比。
同样的刷 Token 闹剧也在 Meta 上演。Meta 首席人力官贾内尔 · 盖尔(Janelle Gale)明确宣布,AI 使用情况与业务影响力将从 2026 年起正式纳入绩效考核体系,顶尖员工的奖金上限将超过年薪的 200%。
Meta 甚至要求员工必须在办公电脑上安装一套软件,在详细追踪他们的 AI 使用情况的同时,也为 AI 自动化办公提供训练数据。Meta CTO 安德鲁 · 博斯沃思(Andrew Bosworth)曾公开表示,目标是未来开发能够自主执行工作任务的 AI 代理。
博斯沃思表示,他最顶尖的工程师花在 AI Token 上的钱相当于自己的年薪,并以此作为生产力倍增的证据。在这套指挥棒下,Token 消耗量从一个工程指标悄然蜕变为职场晋升的通货。

Meta 内部甚至出现了一个名为 "Claudeonomics" 的非官方排行榜,追踪全公司约 8.5 万名用户的 Token 消耗量。结果在 30 天的统计窗口内,该排行榜显示的总使用量超过 60 万亿个 Token。排行榜曝光两天后,因 " 内部数据遭外部获取 " 而紧急下线。
账单让企业瞬间清醒
这种烧不起 Token 的戏剧性局面似乎反转得太快。因为就在不久之前,科技企业还在纷纷鼓励旗下员工全面转型 AI,为员工提供无限度的 Token 额度。
在今年 3 月的英伟达 GTC 期间,黄仁勋公开表示,计划为英伟达每一个员工提供每年 50 万美元的 Token 额度。黄仁勋甚至强调,如果哪个员工在年底前没有把这 50 万美元的 Token 额度用完,他甚至会感到 " 失望 ",因为这意味着员工没有充分利用 AI 来重塑自己的工作方式。
在这场科技巨头争相向华尔街讲述 AI 转型故事的时候,Token 消耗量被当成 AI 落地深度的代理指标。Token 消耗得越多,就越证明 AI 渗透进了工作流。于是,消耗量本身成了目标,生产力反而成了附带品。
但现实情况是,将 AI 使用量纳入绩效考核只会带来毫无意义的 Token 浪费。根据美国软件智能平台 Jellyfish 的估算,在轻度使用 AI 的情况下,合并一次拉取请求的成本仅为 0.28 美元,但在重度使用 AI 的情况下,这一成本可能瞬间就会急剧飙升到 89.32 美元。Token 消耗得更多了,但交付的产品并没有变多,只是带来了更大的账单。
科技媒体 Axios 用一个词精准概括了当下的企业 AI 困境:sticker shock ——价格虚高综合征。那些曾经急于拥抱 AI 的企业,正在集体面对膨胀的 IT 成本、难以量化的生产力提升,以及员工日益滋长的怀疑情绪。
高盛最新预测显示,随着企业和消费者大规模采用 AI 智能体,到 2030 年全球 Token 消耗量可能增长 24 倍,达到每月 120 千万亿(Quadrillion)。这是一个令人眩晕的数字——但数字本身并不创造价值。研究公司 Mavvrik 的调查显示,85% 的企业 AI 成本预测误差超过 10%;84% 的企业表示,AI 支出已将公司毛利率压低了 6 个百分点以上。
Gartner 的预测则让人彻底清醒:即便到 2030 年 AI 推理成本下降近 90%,企业 AI 总账单也不会因此变得便宜。原因很简单——智能体工作流所消耗的 token 量,是普通单次对话的数百倍乃至数千倍;消费量的增长速度,完全足以淹没单价下降带来的红利。
" 首席产品官们不应该把商品 Token 的通缩,误读为前沿推理能力的普惠化,"Gartner 高级分析师威尔 · 萨默(Will Sommer)如此警告。
那些曾经以 " 打开 AI、看看会发生什么 " 为策略的公司,正在补课——补那些本该在推广前就该建立的治理体系和成本管控机制。
Token 账单正在倒逼企业重新思考一个最基本的问题:AI 到底在为我解决什么问题?这个问题,在采购许可证之前就应该回答。现在,市场用账单替他们给出了答案。
Uber COO 安德鲁 · 麦克唐纳(Andrew Macdonald)对此直言不讳:"AI 成本越来越难以合理化。" 这与他们 CTO 早先的表态形成了一组沉重的呼应:Uber 的 CEO 甚至公开表示,他看不出极端的 Token 消耗量与真正交付有价值的产品之间存在任何明确的关联。

重新开始雇佣员工
虽然很多企业正在以 "AI 可以替代人工 " 为由推行裁员,但 Token 成本急剧上涨与 AI 回报低效已经让一些企业开始踩起了急刹车。
瑞典金融科技巨头 Klarna 曾是 AI 替代人工最激进的鼓吹者。2024 年,该公司 CEO 塞巴斯蒂安 · 西米亚特科夫斯基(Sebastian Siemiatkowski)宣称 AI" 已经能胜任人类所有的工作 ",并以此为由冻结招聘、裁减约 1200 名员工,员工总数从 2022 年的 5500 人骤降至 3400 人。
然而到了 2026 年初,Klarna 开始悄然反转:重新启动人工客服招募,并亲口承认决策失误—— " 成本不幸成为过于主导的评估因素,结果是服务质量的下降 "。AI 的确快,但它不擅长处理愤怒客户、复杂纠纷和需要共情的场景。Klarna 用一次耗资巨大的回头路,给整个行业立下了一块警示碑。
澳大利亚联邦银行(CBA)的案例同样典型。2025 年 7 月,这家澳洲最大银行宣布用 AI 语音机器人替代 45 名客服员工,理由是 AI 已能自动处理大量简单来电。然而现实迅速打脸:机器人上线后,客服来电量不降反升,顾客投诉激增,剩余员工被迫大量加班,管理层甚至亲自下场接听客服热线。仅仅一个月后,联邦银行向被裁员工公开道歉并支付补偿,宣布撤回裁员决定,邀请这 45 人悉数返岗。澳大利亚金融业工会将此称为 " 一次巨大的胜利 "。
这两起事件,折射出 AI 时代一个尚未被充分正视的结构性陷阱:企业在规划 AI 替代方案时,往往只算了 " 省下多少人工成本 ",却漏算了 AI 失效后的善后成本——顾客流失、品牌受损、重新招募培训,以及向员工赔付补偿。
研究机构 Orgvue 和 Forrester 的联合调查显示,那些急于用 AI 替代人力的企业中,有 55% 事后表示后悔。Token 可以很便宜,但用 Token 替代人所付出的隐性代价,往往远比账单上的数字昂贵得多。
这场反转来得比任何人预期的都快。从黄仁勋在 GTC 舞台上宣布 " 员工烧不完 50 万美元 Token 我会失望 ",到亚马逊高管告诫员工 " 不要为了用 AI 而用 AI",前后不过几个月。硅谷对 Token 的态度,完成了一次 180 度的弧线。
但这并不意味着 AI 时代结束了,而是意味着它真正开始了。此前那个 " 大水漫灌 " 式的推广阶段,本质上是一场以算力浪费为代价的组织实验——企业用真金白银买单,用员工的时间陪跑,用客户的信任背书。现在账单摆上桌面,该算清楚的事终于到了要算的时候:哪些场景真的需要 AI,哪些只是在为排行榜表演。
Gartner 那句话值得所有决策者贴在办公室墙上:不要把 Token 的降价,误读为 AI 能力的普惠。真正的问题从来不是 Token 贵不贵,而是每一个被消耗掉的 Token,究竟在为谁创造价值。


登录后才可以发布评论哦
打开小程序可以发布评论哦