Tech星球 3小时前
从不限量到自费上班,互联网公司们付不起Token账单了
index.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

点击  Tech 星球  > 点击右上角 " ··· " > 设为星标

  Tech 星球(微信 ID:tech618

|王琳

封面图源| 元宝 AI

全员 Token-maxxing(把 Token 用量拉到极限)还没俩月,互联网公司急速调转船头。

6 月 5 日,腾讯已在内部宣布调整 AI Token 额度。核心的变化是,全员统一额度改为按工作任务动态调配。通知明确表示,总投入只增不减,对能用 AI 带来显著提效和价值产出的同学,保障   Token 额度,不搞   Token 消耗量排名,不贩卖焦虑。

大公司们对 Token 额度的快速消耗甚至超过了他们自己的预期。今年 4 月,Uber 首席技术官普拉文 · 纳加(Praveen Naga)表示,公司在 4 个月内就将 2026 年的 AI 预算花光了,Uber 2025 年的研发支出达到 34 亿美元。Meta 员工在 30 天内消耗了 60.2 万亿个 AI token,成本超过了 1 亿美元。

国内亦是如此。5 月 20 日,《崩坏》系列 AI NPC & Gameplay 技术团队负责人郑银河透露,有员工为了实现项目,建了几十个 Agent 共同协作,结果一晚上烧了价值 200 万元的 Token。

曾经,为了践行 AI 策略,不少公司希望员工最大程度去调用 AI 工具,甚至搞 Token 用量排名,以此作为升职、加薪的标准之一,但当看到天价 Token 账单后,互联网公司们懵了。

3 天用掉 90% 额度,大厂狂砍 Token 用量

腾讯此次 Token 额度动态调整并没有提前通知,这让一些员工感到措手不及。一位腾讯研发人员称,自己根本不够用,发布通知到当天,就发现自己有 10% 的额度了,用 claude 就是挺不住得烧。

Tech 星球了解到,此次调整涉及到包括实习生、外包、正式员工在内的所有人员。目前,只有混元大模型对所有人免费。这样的调整在一些人看来在情理之中。" 用脚指头想也知道,怎么可能一直超多超量供应 ",一位腾讯员工评论道。

一位腾讯大数据方向的外包员工告诉 Tech 星球,以前他们使用大模型是积分制,有 100000 积分,就没有关注具体 Token 量,但是够一个月使用。现在外包只能申请混元大模型,混元是没有 Token 限制的。

但混元在所有基础大模型中表现并不优异。凭借在 " 强推理 +256K 超长上下文 " 的能力,Hy3 preview 曾连续登顶 OpenRouter 全球周榜,但整体能力上,尤其复杂任务时,比如编程等,Hy3 和 DeepSeek V4 Flash、Claude Sonnet 4.6 等模型依然存在差距。

但 Token 的调整对每个事业部每个人的体感不一样,有人只剩 100 美元,有人则有 1 万多元人民币。

一位腾讯实习生告 Tech 星球,调整前,自己只有 100 美元,调整后算起来有 200 美元了,市面上的先进模型都能用,但 200 美元确实不够用,写代码的话一天多的时候就能用 50 美元。一位腾讯 AI 预研游戏员工称,自己目前还有 12600 元,而同事有 2.1 万元。还有一些人则表示,Token 直接砍半了。

一位腾讯后端研发称,虽然目前 Token 额度有所缩减,但自己所在的组并不受影响,不够就可以向上级申请。

此前,腾讯传出为每位员工发放价值约 22 万元的 Token 套餐。按照腾讯集团 2026 年 Q1 财报中提到的 114848 名员工计算,腾讯每年需要支付 252 亿元费用。作为对比,其 2025 年的研发费用为 857.5 亿元。

但现在,即便是财大气粗的腾讯也要开始算细账了,而这只是行业的缩影。Tech 星球了解到,国内主流大厂都会要求员工优先使用内部大模型,内部大模型对员工基本免费,甚至一些公司还屏蔽了竞对的模型。但是最终内部模型产出的效果可能依然比不上海外模型。

一位字节跳动员工向 Tech 星球介绍,公司内部并不强制用 AI,"Token 额度对大厂是很大的负担,不少互联网公司不同岗位不同部门额度存在差异,并且在字节如果 AI 相关的技术研发岗位如果额度不够,还可以内部审批去外面单独采购 ",他补充道。

一位美团员工表示,并没有听到内部会有额度限制,但自己的额度是完全够用的。一位百度员工则称,内部根据部门不同额度限制的情况也会有差异。

破除 Token 盲目崇拜

大厂或者还在犹豫是否削减 Token 额度,但更多中小型互联网公司已经撑不住了。

广州一家做跨境支付的企业决定削减员工的 Token 用量:从上不封顶到人均每月 500 美元。而此前一个月,他们消耗掉了 40 万美元的 Token。

" 这完全不够用了 ",上述公司的一位程序员告诉 Tech 星球。他所在的公司竟然出现互相借 Token 想象,比如一位后端开发者 2 天就消耗掉 370 美元的 Token,额度报警,该开发者开始向他借 Token 用。

以前大大小小的互联网公司们践行 Token-maxxing,生怕错过 AI 浪潮。于是,员工们拼命研究如何消耗 Token。一位上述员工分享道,尤其后端程序员,研发了各种封装包、skill,每个业务有一堆提效工具,一些程序员一开就是好几个 agent,一小时就能烧掉上亿 Token。这导致新规发布前,一些程序员就已经超出预算 1000 多美元。消耗 1 亿 Token,如果使用目前编程主流选择 Claude   Sonnet 4.6,需要至少花费 2000 元,最高甚至达到 1 万元。

事实上,Token 浪费的情况确实存在。一位新能源汽车员工称,公司每个月给他 1000 美元的 Token 额度,他根本用不完,为了消耗,只能用 AI 写原创小说,比如续写《红楼梦》。

上海某老牌互联网公司员工告诉 Tech 星球,公司以前是不限的,但现在公司开始统一管理大家的 Token 额度,每个人都需要走钉钉审批申请 Token,每个人的额度是几百元到 1000 元不等。

这样的情况开始变得普遍。北京某腰部互联网公司员工称,原来大家可以不限额使用 Claude Code,公司报销。现在是开放了 Anthropic 的 API 接口,每个人每月是 1000 元额度,并且让大家优先使用更便宜的国产大模型。

但现实是,便宜的大模型只能胜任一些简单的代码补全类任务,一旦遇到复杂任务,需要多轮次反复交互,甚至不如自己手搓。" 我现在已经开始自己买额度了,1000 元的额度可能根本用不了一周。"

一些公司则要求全栈 AI 化,这导致 Token 用量大幅度上升。广州某游戏公司员工称,之前 Token 全员免费,自己一个月用了小 3 万 Token,部门人人超标,之后就只能用 DeepSeek 的模型了。

上海一位程序员在社交平台分享道,自己的部门只有 4 个人,但一个月就消耗掉了 6 万元 Token。现在技术老大直接采买了 DeepSeek 的 Token 让技术切换。

Token-maxxing 的另外一个结果是,在复盘的时候,不少程序员发现看不懂自己写的代码,甚至都找不到代码在哪里,为什么要这么写。公司的管理者们发现,即便使用了 AI,整体的运营效率并没有提升,甚至当大模型需要排队时,反而影响重要产品的节奏。

百度创始人李彦宏在今年的 AI 开发者大会上首次提出日活智能体数(Daily Active Agents,简称 DAA),DAA 大致对应移动互联网时代通用的日活用户数(DAU), 它看起来,比单纯看 Token 消耗量更能体现平台和生态真实繁荣程度的度量。

从不设上限的肆意挥霍,到如今精打细算的 " 配额制 " 与 " 国产替代 ",互联网公司对 AI 的盲目崇拜正在经历一场必经的祛魅。

欢迎按指引星标 Tech 星球

第一时间接收文章更新

加入交流群 & 内容转载 & 合作相关

Tech 星球小助手 | 微信:miniworld007

评论
大家都在看