每日经济新闻 昨天
当头部大厂也付不起AI账单,token“价格战”是市场必然的答案
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

每经评论员 杜恒峰

曾经被产业界寄予厚望的 "token 经济 ",如今却成了 "token 刺客 " —— Meta、Uber、亚马逊等全球科技巨头近期不约而同为员工使用 AI 踩下刹车。

Uber 的案例最为典型。其原本规划覆盖全年的 token(词元)预算,仅四个月便消耗殆尽,单个工程师月均 AI(人工智能)开销达到 500 至 2000 美元。为遏制成本失控,Uber 直接划定了单人每月 1500 美元的 token 使用上限。

Meta 内部测算显示,若维持当前员工调用增速,2026 年仅内部 AI 使用一项支出便将达数十亿美元,公司面向 6000 名核心员工发放备忘录,明确了全员 token 配额限制。亚马逊高管也公开告诫员工 " 不要为了使用 AI 而使用 AI",考核指标从 token 消耗量切换为标准化业务交付成果。

这些企业此前全力推动全员 AI 落地,核心诉求清晰。其一,以 AI 替代重复性人力工作,压缩研发、运营、客服岗位人力开支,依靠大模型自动生成代码、整理数据、撰写方案,缩短项目周期。其二,抢占 AI 转型先发红利,依靠全员深度使用积累落地经验,探索业务智能化新模式,拉开与同行数字化差距。其三,依托 token 单价持续下行的行业趋势,认定 AI 边际成本会持续走低,长期投入将形成正向收益循环。

不难看出,这些企业激进的 AI 推广目标已经落空。企业非但没有实现人力成本缩减,反而新增一笔难以预估的巨额算力账单,大量 token 投入能否转化为业务增量仍有待验证。

而预期与现实严重背离,根源集中在三个矛盾。

第一,企业的消耗量呈指数级膨胀,形成难以逾越的 " 成本墙 "。公开数据显示,主流大模型 token 单价较 2023 年初降幅最高达 98%,但 AI 智能体等应用需要多轮推理、长文本循环交互,企业员工日均调用量呈百倍增长,单价下跌无法抵消总量暴涨带来的总开支,哪怕微小的单位成本,乘以海量的使用规模后,最终总成本也将是个天文数字。

第二,企业内部存在严重的 token 浪费。原本大量仅靠人脑思考、搜索引擎即可快速解决的简单需求,员工全部交由 AI 处理。大模型的底层推理逻辑意味着,即便简单的问答也要完整加载模型、生成多轮文本,天然比人工检索成本更高。头部大厂急于抢占 AI 红利,将 token 消耗纳入正向考核,设立消耗排行榜,只考核使用频次,未配套产出、效率约束指标,员工刻意刷高 token 用量以换取绩效认可,进一步放大了浪费。

第三,现阶段 AI 存在明显能力局限,企业尚未找到高效落地路径。当前大模型仍无法深度适配细分业务场景,产出内容常需要员工二次核对修正,员工只是从生产者变成了审核者,企业并未真正解放人力;多数企业对 AI 的使用,也仅停留在浅层文案、代码辅助层面,没能搭建完整 AI 业务闭环。纵使 Meta、亚马逊这类巨头有海量的资金支持,只要投入无法创造净收益,就失去了商业逻辑。集体限制 token 使用,正是市场给出的答案。

token 作为 AI 时代的核心资源,相当于互联网时代的网络流量、工业时代的能源,这些生产要素必须普惠低价,不构成企业主要的运营成本。如今头部企业因 token 账单主动收缩 AI 使用,表明 AI 大模型远未达到基础设施的标准,token 的价格战也将成为必然。最新的情况是,OpenAI 已启动大幅降价规划,一旦落地,其他厂商可能跟进。

token 降价不能仅依靠大模型厂商单方面让利,整条产业链都需要同步降本。目前唯一有望实现季度运营盈利的头部 AI 厂商是 Anthropic,其余厂商普遍处于亏损状态。想要持续压低 token 定价,除了大模型厂商持续优化架构、压缩推理算力损耗,上游 GPU(图形处理器)、存储等硬件价格,机房的能源消耗,电力价格都必须同步下降。整条链路成本同步下探,token 才能走向廉价普惠,AI 才有机会真正赋能各行各业。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai uber 亚马逊 考核 科技巨头
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论