
" 未来,我们公司的每一位工程师都需要有一份年度 token 预算。他们年薪大概几十万美元,我可能还会额外给他们配上一笔相当于年薪一半价值的 token,因为这能让他们的效率提升 10 倍。" 黄仁勋在 GTC 上的这番话,点出了硅谷正在出现的一个新现实:token,正在成为吸引人才的新筹码。
" 这已经成了硅谷招聘中的一种新工具:这份工作会配多少 token?原因很清楚:每一个能拿到 token 的工程师,生产力都会更高。" 他补充道。
类似的趋势,也开始在国内涌现。社交媒体上有消息称,阿里内部已经开始向员工发放 token 额度,悟空、Qoder 可以免费使用,外部 AI 开发工具的费用也可以报销。
Levels.fyi 数据专家 Hakeem Shibly 还注意到,在一份软件工程师的薪酬申报中,"Copilot 订阅 " 已经被列入员工福利。这看起来只是一个很小的变化,却有很强的象征意义:过去硅谷吸引人才,主要靠工资、奖金和期权;而现在,AI 访问权限,正在逐渐成为第四项标准化福利。
Token 之所以变得越来越重要,原因并不复杂。随着生成式 AI 工具越来越深地嵌入软件开发流程,底层模型的调用成本,正逐渐成为影响生产力的关键变量。
那么,一个重度 AI 用户到底会花掉多少钱?
根据 Theory Ventures 的 Tomasz Tunguz 分享的数据,他个人的 AI 推理成本,按年化计算,已经冲到了 10 万美元。
一开始,他的使用量并不高。六个月前,他每个月在 Claude 上只花 200 美元;后来又增加了三个 agent 订阅:Codex、Gemini 和 Claude Code,月支出上升到 600 美元。再往后,他开始用 AI 系统化处理待办事项,每天完成的任务数提升到 31 个,随之而来的,是每天 92 美元的推理账单。此后,他在浏览器 agent 上又额外增加了每月 400 美元的花费。短短两个季度里,他的推理支出年化水平,就从 7200 美元涨到 4.3 万美元,最终突破 10 万美元。
最后,为了控制成本,Tunguz 花了一个周末迁移到开源模型上。经过一轮调优后,新方案的表现已经与原方案几乎没有差别,但成本只剩原来的 12%。
按照 Levels.fyi 的数据,收入位于前 25% 的软件工程师,年薪大约是 37.5 万美元。Tunguz 估算,如果再叠加每年 10 万美元的推理成本,那么一个工程师的完全成本就会上升到 47.5 万美元。换句话说,未来一个工程师超过 20% 的总成本,可能都来自 AI 使用本身。
这意味着,对 CFO 来说,AI 开支很快就会变成一项必须被单独追踪的新型人力成本。随着员工对 AI 的使用越来越深,这笔钱已经不只是 " 软件订阅费 ",而是会直接影响公司的整体现金消耗。
而对公司管理层来说,最核心的问题则变成了:这笔 AI 支出到底换来了多少回报?如果云基础设施通常用 " 每小时 GPU 使用带来的毛利润 " 来衡量,那么在员工侧,Tunguz 认为对应的指标应该是:每一美元推理成本,到底换来了多少有效产出。
Tunguz 给出的答案是:一年花 1.2 万美元,可以换来每天完成 31 个任务的能力提升。
他最近在 LinkedIn 上写道:" 如果一个工程师一年要烧掉 10 万美元算力成本,那他最好能把生产力提升到 8 倍以上。"
模型评估公司 Arena 的 AI 能力负责人 Peter Gostev 甚至提出,OpenAI 和 Anthropic 或许应该建立专门的招聘网站,让客户在发布岗位时,除了标注薪资区间,还能直接写明这个岗位对应的 token 预算。
" 如果这一趋势继续下去,那么 2026 年很可能会成为一个标志性年份:工程师在谈判薪酬时,不再只谈美元和股权,而是会把 token 一起谈进去。"Tomasz 说," 未来会不会真的出现‘拿 token 发工资’的情况?到了 2026 年,你大概率就会开始遇到这种事。"
token 之所以越来越重要,还因为它背后所对应的是更底层的资源争夺:算力。
随着生成式 AI 工具越来越深入软件开发、产品运营乃至组织协作流程,模型运行成本已经不只是一个财务问题,更成为生产力分配问题。
现在,许多公司都在内部强力推动 AI 使用,甚至以裁员、重组等方式倒逼员工提升 AI 协作能力。硅谷资深开发者 Steve Yegge 就认为,如今衡量一家公司的一个关键指标,或许就是 token 的消耗量。因为这个数字代表着公司的工程师在主动尝试新工作流,非技术岗位也在摸索如何使用 AI。只要大家还在尝试,就一定会经历失败,也会在失败中学习。
为了推动内部采用,一些公司已经开始直接给员工发放 AI 补贴。例如,据 InfoQ 独家了解到,领英每月提供了 2000 美元的额度,国内昆仑万维此前也宣布提供每月 100 美元的支持。
但更早之前,软件工程师和 AI 研究人员之间,其实就已经围绕 GPU 资源展开过长期争夺。这类 AI 算力往往会按照项目优先级被精细化分配。而到了今天,这种争夺正在进一步外显:一些求职者在面试时,已经会主动询问,如果加入公司,自己究竟能分到多少 AI 算力预算。
此前,Meta 就曾被曝出,不同模型团队之间因为算力资源发生过激烈冲突,甚至有员工因此离职。国内阿里千问核心负责人林俊旸的离职也有部分该原因。Google 的情况更能说明问题:即便是掌握全球顶级 AI 基础设施的公司,也因为内部算力紧张,不得不由专门的算力分配委员会来协调。这意味着,算力分配已经不再只是工程调度问题,而是升级为了组织治理问题。
" 现在越来越多候选人在面试中会问,如果加入团队,他们能获得多少专属推理算力来使用 Codex。"OpenAI Codex AI 编程工程负责人 Thibault Sottiaux 最近就在 X 上写道。他还补充说,单个用户的使用量增长速度,远快于整体用户数量的增长,这说明 AI 算力正变得越来越稀缺,也越来越有价值。
这种稀缺性,正在改变工程师对工作和报酬的理解。OpenAI 总裁 Greg Brockman 的说法非常直接:" 你能获得多少推理算力,正越来越直接地决定整体的软件生产力。"
换句话说,大厂内部真正稀缺的,已经不只是 GPU 本身,而是 " 谁有资格优先使用 GPU"。在不远的未来,获得 AI 资源的重要性,可能会和拿到高薪、厚股权一样重要。 对于 AI 时代的程序员来说,如果拿不到足够多的算力支持,你能够写出来的软件、跑出来的实验、推进的项目,可能都会远远落后于那些拥有更大预算的人,这会直接影响你的职业前景。
而这背后最值得警惕的,是一种新的不平等正在形成。
过去,工程师之间的差距,主要来自经验、执行力、行业知识、架构能力和业务理解。现在,另一种分化正在迅速出现:同样都是高级工程师,同样都懂如何与 AI 协作,但一个人可以高频调用最强模型,拥有更高的 token 上限、更低的调用延迟、更少的审批限制;另一个人却只能在有限额度、受限模型和受限工作流里勉强发挥。那么,两个人的实际产出,很可能会在极短时间内被迅速拉开。
这意味着," 会不会用 AI",正在转变为 " 有没有资格多用 AI"。
这已经不再是单纯的技术问题,而是组织资源配置问题。谁的项目更重要,谁更接近核心业务,谁更值得被投资,未来可能不只是体现在团队规模和奖金上,也会体现在推理预算和模型访问权上。
在 "token 故事 " 不断升温的背景下,很多用户最直接的担忧是:未来 token 会不会越来越贵?
如果以 OpenClaw 带来的 token 消耗激增为例,至少从短期看,价格上涨趋势已经很明显。
OpenRouter 平台数据显示,OpenClaw 的 token 消耗量从 2026 年 2 月 3 日的 806 亿,在一个月内飙升到 3 月 4 日的 3580 亿,增长约 4.4 倍;截至 3 月 2 日当周,OpenRouter 平台周度 token 调用量已达到 14.8 万亿,两个月内增长约 160%,而 OpenClaw 贡献了其中绝大部分增量。根据 Anthropic 的数据,AI Agent 的 token 消耗量最高可达普通聊天交互的 15 倍。
Token 消耗的快速上升,最直接的后果就是:大模型厂商开始涨价。
腾讯云智能体开发平台自 2026 年 3 月 13 日起调整部分模型计费策略,GLM5、MiniMax2.5、Kimi2.5 等模型结束免费公测,转为正式商用并按调用量收费。与此同时,混元系列模型 Tencent HY2.0Instruct 与 Tencent HY2.0Think 的价格也进行了调整。其中,Tencent HY2.0Instruct 的输入、输出价格涨幅超过 450%,Tencent HY2.0Think 的输入、输出价格也有所上调,套餐用户则可以通过套餐抵扣部分费用。
智谱在两个月内也已经两次提价。2 月 12 日,智谱推出新一代旗舰模型 GLM-5,并在第二天上调 GLM Coding Plan 套餐价格,涨幅 30% 起。3 月 16 日,智谱又发布面向 OpenClaw 的基座模型 GLM-5-Turbo,并将 API 价格进一步上调 20%。有媒体统计,相较于 GLM-4.7,GLM-5 平均涨价约 50%;在此基础上,GLM-5-Turbo 又比 GLM-5 提高 20%,相对 GLM-4.7 的平均涨幅已达到 83%。

3 月 18 日,阿里云也宣布 AI 算力、存储等产品最高涨价 34%,其中包括:平头哥真武 810E 等算力卡产品上涨 5%-34%,文件存储产品 CPFS(智算版)上涨 30%。此前 1 月份,海外云厂商已经有了一轮涨价。
有网友总结自己最近 " 养小龙虾 " 的体验时说得很直白:"token 消耗量不是线性增长,而是指数型放大。agent 一旦成熟,拼的就不再是聊天,而是持续干活。所以,真正可怕的是睡后 token。睡后 token 可能是 AI 投资里最重要、也最容易被低估的变量。"
长期看,如果 token 这套故事真的要走向大众化,那么价格最终大概率必须像 " 水电煤 " 一样足够便宜。反过来,这也会逼着大厂持续寻找方法压缩模型成本、提升推理效率。但在短期内,价格究竟会上涨还是下跌,关键取决于议价权在谁手里。
从更宏观的视角看,token 叙事的兴起,也非常符合 AI 供应链上游大厂的利益。
今年以来,英伟达股价表现持续强于其他超大市值科技公司,仍然是 AI 浪潮中最大的受益者之一。在黄仁勋的逻辑里,一个新的等式已经成立:在 AI 世界里,算力就是营收。因为没有算力,就无法生成 token;没有 token,就无法带来收入增长。因此,算力本身就等于营收能力。
换句话说,算力其实是在替这个世界 " 印 " token,而 token 正在被塑造成 AI 时代真正的货币。
Sam Altman 这些年反复兜售的,也是一套类似的构想:未来发放的未必是钱,而是 tokens。
在 2024 年 5 月的 All-In 播客里,Altman 曾提出一个设想:未来更合理的分配方式,也许不是 " 全民基础收入 ",而是 " 全民基础算力 "。在他的描述里,每个人都可以分到一部分 GPT-7 的算力份额,既可以自己使用,也可以转卖,甚至可以捐出去用于癌症研究。你拥有的不再只是美元,而是生产力本身的一部分。
这显然并不是他一时兴起的想法。在同年 5 月的 Theo Von 播客里,Altman 进一步描绘了相似的蓝图:如果全世界每年可以生成天文数字级别的 token,那么其中一部分进入传统资本分配体系,另一部分则平均分给全球 80 亿人,让每个人都拥有一笔属于自己的 token 份额。这几乎就是某种 " 全球版全民基本财富 " 的想象。
本质上,他是在尝试把 OpenAI 所创造的虚拟额度,包装成一种新的财富形式。
也正因如此,外界开始出现不少质疑。有人认为,所谓 " 用 AI token 当钱发 " 的想法,某种程度上反映了一种焦虑:当外部融资环境变化、内部现金消耗居高不下时,企业天然会希望找到一种更轻、更灵活、也更有利于自身的补偿货币。
有网友的评价就很尖锐:" 听起来很新潮,但说穿了,这根本不是什么创新。它不过是 company scrip 的数字化翻版——公司自己发行、只能在自己体系内部流通的‘钱’。这种东西在人类商业史上早就不陌生了,结局也一向不体面:它本质上就是一种剥削工具。在美国,用 company scrip 给工人发工资,早在 1938 年就已经被认定为违法。"
而在国内,类似思路也开始被更正式地制度化。阿里已经成立 Alibaba Token Hub(ATH)事业群,由 CEO 吴泳铭亲自挂帅,目标是建立一个以 " 创造 Token、输送 Token、应用 Token" 为核心的统一调度中心。摩根士丹利也第一时间发布点评,指出 ATH 事业群的财务驱动逻辑,与 Minimax、智谱等纯模型公司高度相似,未来有可能在现有分部估值框架之外,成为独立的估值组成部分。
阿里背后的判断是:未来大量数字化工作将由数以百亿计的 AI Agent 支撑,而 token 正是驱动这些 Agent 运转的基础燃料,也是人类与数字世界交互的重要载体。
虽然角度略有不同,但国内外大厂如今正在做的事情,都指向了同一个方向:围绕 token,改写生产力关系并为其套上金融逻辑。


登录后才可以发布评论哦
打开小程序可以发布评论哦