发token当工资？工程师不只拿现金和期权，开始按token分身价了

作者 | 褚杏娟

" 未来，我们公司的每一位工程师都需要有一份年度 token 预算。他们年薪大概几十万美元，我可能还会额外给他们配上一笔相当于年薪一半价值的 token，因为这能让他们的效率提升 10 倍。" 黄仁勋在 GTC 上的这番话，点出了硅谷正在出现的一个新现实：token，正在成为吸引人才的新筹码。

" 这已经成了硅谷招聘中的一种新工具：这份工作会配多少 token？原因很清楚：每一个能拿到 token 的工程师，生产力都会更高。" 他补充道。

类似的趋势，也开始在国内涌现。社交媒体上有消息称，阿里内部已经开始向员工发放 token 额度，悟空、Qoder 可以免费使用，外部 AI 开发工具的费用也可以报销。

Levels.fyi 数据专家 Hakeem Shibly 还注意到，在一份软件工程师的薪酬申报中，"Copilot 订阅 " 已经被列入员工福利。这看起来只是一个很小的变化，却有很强的象征意义：过去硅谷吸引人才，主要靠工资、奖金和期权；而现在，AI 访问权限，正在逐渐成为第四项标准化福利。

要拿 token 发工资了？

Token 之所以变得越来越重要，原因并不复杂。随着生成式 AI 工具越来越深地嵌入软件开发流程，底层模型的调用成本，正逐渐成为影响生产力的关键变量。

那么，一个重度 AI 用户到底会花掉多少钱？

根据 Theory Ventures 的 Tomasz Tunguz 分享的数据，他个人的 AI 推理成本，按年化计算，已经冲到了 10 万美元。

一开始，他的使用量并不高。六个月前，他每个月在 Claude 上只花 200 美元；后来又增加了三个 agent 订阅：Codex、Gemini 和 Claude Code，月支出上升到 600 美元。再往后，他开始用 AI 系统化处理待办事项，每天完成的任务数提升到 31 个，随之而来的，是每天 92 美元的推理账单。此后，他在浏览器 agent 上又额外增加了每月 400 美元的花费。短短两个季度里，他的推理支出年化水平，就从 7200 美元涨到 4.3 万美元，最终突破 10 万美元。

最后，为了控制成本，Tunguz 花了一个周末迁移到开源模型上。经过一轮调优后，新方案的表现已经与原方案几乎没有差别，但成本只剩原来的 12%。

按照 Levels.fyi 的数据，收入位于前 25% 的软件工程师，年薪大约是 37.5 万美元。Tunguz 估算，如果再叠加每年 10 万美元的推理成本，那么一个工程师的完全成本就会上升到 47.5 万美元。换句话说，未来一个工程师超过 20% 的总成本，可能都来自 AI 使用本身。

这意味着，对 CFO 来说，AI 开支很快就会变成一项必须被单独追踪的新型人力成本。随着员工对 AI 的使用越来越深，这笔钱已经不只是 " 软件订阅费 "，而是会直接影响公司的整体现金消耗。

而对公司管理层来说，最核心的问题则变成了：这笔 AI 支出到底换来了多少回报？如果云基础设施通常用 " 每小时 GPU 使用带来的毛利润 " 来衡量，那么在员工侧，Tunguz 认为对应的指标应该是：每一美元推理成本，到底换来了多少有效产出。

Tunguz 给出的答案是：一年花 1.2 万美元，可以换来每天完成 31 个任务的能力提升。

他最近在 LinkedIn 上写道：" 如果一个工程师一年要烧掉 10 万美元算力成本，那他最好能把生产力提升到 8 倍以上。"

模型评估公司 Arena 的 AI 能力负责人 Peter Gostev 甚至提出，OpenAI 和 Anthropic 或许应该建立专门的招聘网站，让客户在发布岗位时，除了标注薪资区间，还能直接写明这个岗位对应的 token 预算。

" 如果这一趋势继续下去，那么 2026 年很可能会成为一个标志性年份：工程师在谈判薪酬时，不再只谈美元和股权，而是会把 token 一起谈进去。"Tomasz 说，" 未来会不会真的出现‘拿 token 发工资’的情况？到了 2026 年，你大概率就会开始遇到这种事。"

你有没有资格多用 AI？

token 之所以越来越重要，还因为它背后所对应的是更底层的资源争夺：算力。

随着生成式 AI 工具越来越深入软件开发、产品运营乃至组织协作流程，模型运行成本已经不只是一个财务问题，更成为生产力分配问题。

现在，许多公司都在内部强力推动 AI 使用，甚至以裁员、重组等方式倒逼员工提升 AI 协作能力。硅谷资深开发者 Steve Yegge 就认为，如今衡量一家公司的一个关键指标，或许就是 token 的消耗量。因为这个数字代表着公司的工程师在主动尝试新工作流，非技术岗位也在摸索如何使用 AI。只要大家还在尝试，就一定会经历失败，也会在失败中学习。

为了推动内部采用，一些公司已经开始直接给员工发放 AI 补贴。例如，据 InfoQ 独家了解到，领英每月提供了 2000 美元的额度，国内昆仑万维此前也宣布提供每月 100 美元的支持。

但更早之前，软件工程师和 AI 研究人员之间，其实就已经围绕 GPU 资源展开过长期争夺。这类 AI 算力往往会按照项目优先级被精细化分配。而到了今天，这种争夺正在进一步外显：一些求职者在面试时，已经会主动询问，如果加入公司，自己究竟能分到多少 AI 算力预算。

此前，Meta 就曾被曝出，不同模型团队之间因为算力资源发生过激烈冲突，甚至有员工因此离职。国内阿里千问核心负责人林俊旸的离职也有部分该原因。Google 的情况更能说明问题：即便是掌握全球顶级 AI 基础设施的公司，也因为内部算力紧张，不得不由专门的算力分配委员会来协调。这意味着，算力分配已经不再只是工程调度问题，而是升级为了组织治理问题。

" 现在越来越多候选人在面试中会问，如果加入团队，他们能获得多少专属推理算力来使用 Codex。"OpenAI Codex AI 编程工程负责人 Thibault Sottiaux 最近就在 X 上写道。他还补充说，单个用户的使用量增长速度，远快于整体用户数量的增长，这说明 AI 算力正变得越来越稀缺，也越来越有价值。

这种稀缺性，正在改变工程师对工作和报酬的理解。OpenAI 总裁 Greg Brockman 的说法非常直接：" 你能获得多少推理算力，正越来越直接地决定整体的软件生产力。"

换句话说，大厂内部真正稀缺的，已经不只是 GPU 本身，而是 " 谁有资格优先使用 GPU"。在不远的未来，获得 AI 资源的重要性，可能会和拿到高薪、厚股权一样重要。 对于 AI 时代的程序员来说，如果拿不到足够多的算力支持，你能够写出来的软件、跑出来的实验、推进的项目，可能都会远远落后于那些拥有更大预算的人，这会直接影响你的职业前景。

而这背后最值得警惕的，是一种新的不平等正在形成。

过去，工程师之间的差距，主要来自经验、执行力、行业知识、架构能力和业务理解。现在，另一种分化正在迅速出现：同样都是高级工程师，同样都懂如何与 AI 协作，但一个人可以高频调用最强模型，拥有更高的 token 上限、更低的调用延迟、更少的审批限制；另一个人却只能在有限额度、受限模型和受限工作流里勉强发挥。那么，两个人的实际产出，很可能会在极短时间内被迅速拉开。

这意味着，" 会不会用 AI"，正在转变为 " 有没有资格多用 AI"。

这已经不再是单纯的技术问题，而是组织资源配置问题。谁的项目更重要，谁更接近核心业务，谁更值得被投资，未来可能不只是体现在团队规模和奖金上，也会体现在推理预算和模型访问权上。

Token 价格，已经开始涨了

在 "token 故事 " 不断升温的背景下，很多用户最直接的担忧是：未来 token 会不会越来越贵？

如果以 OpenClaw 带来的 token 消耗激增为例，至少从短期看，价格上涨趋势已经很明显。

OpenRouter 平台数据显示，OpenClaw 的 token 消耗量从 2026 年 2 月 3 日的 806 亿，在一个月内飙升到 3 月 4 日的 3580 亿，增长约 4.4 倍；截至 3 月 2 日当周，OpenRouter 平台周度 token 调用量已达到 14.8 万亿，两个月内增长约 160%，而 OpenClaw 贡献了其中绝大部分增量。根据 Anthropic 的数据，AI Agent 的 token 消耗量最高可达普通聊天交互的 15 倍。

Token 消耗的快速上升，最直接的后果就是：大模型厂商开始涨价。

腾讯云智能体开发平台自 2026 年 3 月 13 日起调整部分模型计费策略，GLM5、MiniMax2.5、Kimi2.5 等模型结束免费公测，转为正式商用并按调用量收费。与此同时，混元系列模型 Tencent HY2.0Instruct 与 Tencent HY2.0Think 的价格也进行了调整。其中，Tencent HY2.0Instruct 的输入、输出价格涨幅超过 450%，Tencent HY2.0Think 的输入、输出价格也有所上调，套餐用户则可以通过套餐抵扣部分费用。

智谱在两个月内也已经两次提价。2 月 12 日，智谱推出新一代旗舰模型 GLM-5，并在第二天上调 GLM Coding Plan 套餐价格，涨幅 30% 起。3 月 16 日，智谱又发布面向 OpenClaw 的基座模型 GLM-5-Turbo，并将 API 价格进一步上调 20%。有媒体统计，相较于 GLM-4.7，GLM-5 平均涨价约 50%；在此基础上，GLM-5-Turbo 又比 GLM-5 提高 20%，相对 GLM-4.7 的平均涨幅已达到 83%。

3 月 18 日，阿里云也宣布 AI 算力、存储等产品最高涨价 34％，其中包括：平头哥真武 810E 等算力卡产品上涨 5%-34%，文件存储产品 CPFS（智算版）上涨 30%。此前 1 月份，海外云厂商已经有了一轮涨价。

有网友总结自己最近 " 养小龙虾 " 的体验时说得很直白："token 消耗量不是线性增长，而是指数型放大。agent 一旦成熟，拼的就不再是聊天，而是持续干活。所以，真正可怕的是睡后 token。睡后 token 可能是 AI 投资里最重要、也最容易被低估的变量。"

长期看，如果 token 这套故事真的要走向大众化，那么价格最终大概率必须像 " 水电煤 " 一样足够便宜。反过来，这也会逼着大厂持续寻找方法压缩模型成本、提升推理效率。但在短期内，价格究竟会上涨还是下跌，关键取决于议价权在谁手里。

大厂正试图把 token 变成新的价值单位

从更宏观的视角看，token 叙事的兴起，也非常符合 AI 供应链上游大厂的利益。

今年以来，英伟达股价表现持续强于其他超大市值科技公司，仍然是 AI 浪潮中最大的受益者之一。在黄仁勋的逻辑里，一个新的等式已经成立：在 AI 世界里，算力就是营收。因为没有算力，就无法生成 token；没有 token，就无法带来收入增长。因此，算力本身就等于营收能力。

换句话说，算力其实是在替这个世界 " 印 " token，而 token 正在被塑造成 AI 时代真正的货币。

Sam Altman 这些年反复兜售的，也是一套类似的构想：未来发放的未必是钱，而是 tokens。

在 2024 年 5 月的 All-In 播客里，Altman 曾提出一个设想：未来更合理的分配方式，也许不是 " 全民基础收入 "，而是 " 全民基础算力 "。在他的描述里，每个人都可以分到一部分 GPT-7 的算力份额，既可以自己使用，也可以转卖，甚至可以捐出去用于癌症研究。你拥有的不再只是美元，而是生产力本身的一部分。

这显然并不是他一时兴起的想法。在同年 5 月的 Theo Von 播客里，Altman 进一步描绘了相似的蓝图：如果全世界每年可以生成天文数字级别的 token，那么其中一部分进入传统资本分配体系，另一部分则平均分给全球 80 亿人，让每个人都拥有一笔属于自己的 token 份额。这几乎就是某种 " 全球版全民基本财富 " 的想象。

本质上，他是在尝试把 OpenAI 所创造的虚拟额度，包装成一种新的财富形式。

也正因如此，外界开始出现不少质疑。有人认为，所谓 " 用 AI token 当钱发 " 的想法，某种程度上反映了一种焦虑：当外部融资环境变化、内部现金消耗居高不下时，企业天然会希望找到一种更轻、更灵活、也更有利于自身的补偿货币。

有网友的评价就很尖锐：" 听起来很新潮，但说穿了，这根本不是什么创新。它不过是 company scrip 的数字化翻版——公司自己发行、只能在自己体系内部流通的‘钱’。这种东西在人类商业史上早就不陌生了，结局也一向不体面：它本质上就是一种剥削工具。在美国，用 company scrip 给工人发工资，早在 1938 年就已经被认定为违法。"

而在国内，类似思路也开始被更正式地制度化。阿里已经成立 Alibaba Token Hub（ATH）事业群，由 CEO 吴泳铭亲自挂帅，目标是建立一个以 " 创造 Token、输送 Token、应用 Token" 为核心的统一调度中心。摩根士丹利也第一时间发布点评，指出 ATH 事业群的财务驱动逻辑，与 Minimax、智谱等纯模型公司高度相似，未来有可能在现有分部估值框架之外，成为独立的估值组成部分。

阿里背后的判断是：未来大量数字化工作将由数以百亿计的 AI Agent 支撑，而 token 正是驱动这些 Agent 运转的基础燃料，也是人类与数字世界交互的重要载体。

虽然角度略有不同，但国内外大厂如今正在做的事情，都指向了同一个方向：围绕 token，改写生产力关系并为其套上金融逻辑。

宙世代

一起剪

相关标签