算力告急，四大力量涌入Token服务市场

Token 成为 " 硬通货 " 之后，四股力量正快速布局。

文｜赵艳秋

编｜石兆

" 现在你有多少 Token 就能卖多少，整个市场供不应求。" 百度智能云 AI 与大模型平台总经理忻舟告诉数智前线，原来大家 Token 都是打折卖的，现在加价都买不到，推理诉求变得非常强。AI Infra 企业是石科技联合创始人毛运航则观察，整个市场正从买方市场转向卖方市场，" 以前 API 是降价的，是亏钱的，Token 现在必须保证一定消耗量，才能够给到比较好的价格和供应。" 阿里云资深副总裁刘伟光给出了一个数字，过去 5 个月，阿里云 Token 调用量增长了 15 倍。

在 Token 变得紧俏之后，四个力量——云大厂、模型公司、运营商，以及 AI Infra 企业，已快速布局 Token 服务市场。

Token，从打折卖到加价都买不到

虽然 Token 销售紧俏，但各家云厂商并未借机敞开对外售卖，反而谨慎分配自家的 GPU 资源，平衡内部模型训练和对外 Token 销售。" 大家意识到，训练出更好的模型能卖出更多 Token。" 一位大厂人士说，内部各部门都在抢卡，几方最后通过算账来争夺。而且，去年 Token 打折卖，直接卖硬件设备挣得多；现在局面反转，大家都在收缩纯硬件销售，" 卖硬件不如卖 Token"。

Token 为何 " 一夜之间 " 如此抢手？原因是真实需求爆发。

刘伟光说，Coding 成为巨大分水岭，它不仅生成新应用，还将在未来一年内解锁大量老系统——那些 " 程序太老、不能搬上云 " 的遗留应用，借助 AI Coding 可获得新生。更关键的是，非程序员也开始 " 编程 "，每个人都可以自己做报表、做分析、做项目预算，生产力得到释放。

而智能体的普及，从技术层面放大了 Token 消耗。毛运航形容，" 还什么都没做，Token 就没了 "。Agent 有了 " 手脚 " 之后，完成一项任务每一步都在消耗 Token，消耗量急剧增加。

过去两年，每家大厂都有 Token 销售的考核，字节看 Token 总量，阿里、百度、腾讯看模型调用次数，但执行起来很难。忻舟解释，" 市场没有那么多真需求，很多都用的不太对，或者大材小用，比如拿大模型去做数据清洗或者小模型也能做的事，我们叫低质调用。" 随着智能体技术和模型、Coding 能力的跃升，一些真正有价值的应用涌现，而这些应用也是 Token 重度消耗者。

为此，今年每家大厂对 Token 都定了不小的目标，" 这个目标来源于对市场真需求的判断 "。

面对这场需求爆发，中国工程院院士郑纬民观察到一个行业转向：从 MaaS（模型即服务）转向 TaaS（Token as a Service）服务。虽然很多企业并不特别划分 MaaS 和 TaaS，但关注点已开始紧紧围绕 Token。

Token 是大模型处理信息的最小计量单位，1000 个 Token 大约对应 700 到 800 个中文字符。郑纬民解释，Token 现在是三种度量衡：它是大模型处理信息的基本单位，是 AI 运行时不同算力消耗的计量映射，也正在成为行业定价计费的标准单位。

之前，MaaS 解决 " 模型的可用性 "，计费方式相对粗放，比如按调用次数结算。TaaS 则让 AI 算力像水、电、流量一样封装成标准化服务，把计费颗粒度精细到 Token 这个最小单位。

郑纬民解释这个演进背后的深层矛盾：目前 AI 基础设施主要是为大模型训练而设计的，行业陷入 "算力基建昂贵、推理工程薄弱、Token 产出薄弱 "困局。他的判断是，AI 基础设施的竞赛，已从比拼算力集群规模，转向比拼每瓦 Token 生产效率。

对 Token 市场的争夺，也快速展开。阿里刘伟光估算，AI 原生创业企业，Token 支出占比接近 100%；国内互联网企业已在 15% 到 20%；传统企业目前仍在 5% 以下。而阿里云对销售的要求，客户的 Token 支出至少不低于其今年支出的 20%，并专门设置了纯做 MaaS 的销售岗位，在 AI 原生创业公司和 OPC（个人公司）以 MaaS 销售为主。刘伟光同时透露三条抓手：一是全员出动，数千销售铺向全国，解决覆盖率，让客户先用起来，哪怕只是最基础的 Coding 改造；二是模型策略开放，只要部署在阿里云上的模型，一律按一方模型对待；三是考核指标重构，重点看三件事：付费 Token 客户数的每日增长、客户核心系统接入 Token 的数量与效率，以及 Agent 在企业内自主完成闭环的效率。

忻舟以央国企为例，预估其 Token 支出占总 IT 支出的 1% 左右，未来增量空间巨大。百度要求今年首要把智能体的效果做出来，当客户有了价值预期之后，再展开渗透和降本。

在算力吃紧的背景下，国产 AI 基础设施迎来机会。毛运航观察，国产芯片开始冒头，陆续有国产芯片可以支撑大集群供应。而是石科技的国产适配工作，也从过去的小范围甚至 " 为爱发电 "，在升级为真正的生产级需求。" 假如现在适配了某款国产芯片，能把新模型部署上去，达到生产级要求，基本上就把这家芯片的所有货盘活了。"

刘伟光做了一个更宏观的预判，当 Token 覆盖了 "everything"，整个市场的 IT 支出结构将发生根本变化，软件外包、传统 IT 采购，都将面临产业重塑。Token 正在成为新的水和电。

四大流派的动作

Token 成为 " 硬通货 " 之后，四股力量已快速布局：云大厂、模型公司、运营商，以及 AI Infra 企业。

云大厂是最早提出 Token 服务的一方力量，它们的核心优势在于全栈能力，有模型、有算力基础设施，也几乎都有芯片。百度今年开发者大会提出 " 芯、云、模、体 "，阿里云则在年度峰会提出 " 芯 - 云 - 模型 - 推理 "。阿里云刘伟光去年告诉数智前线，云大厂的 " 胜负手 " 是性价比，而全栈技术是实现极致性价比的核心路径。今年他尤其强调芯片与模型的深度绑定，" 每一款模型训练背后都有强大算力支撑，两者齿轮咬合、螺旋上升。所以我们一定要走自己的道路，更加强调云、芯、模一体化。"

在产品侧，云厂商正从云原生、AI 原生迈向 "Agent 原生 "，整套云技术栈和服务体系，几乎都要为智能体应用重做一遍。目前，各家企业对云产品线展开系统性改造—— Skill 化、MCP 化、CLI 化。同时，云厂商不仅推广 Token 销售，也非常重视自己把 Token 包装成 Agent 应用，如 Coding、各种 Agent 和工具等，无论 ToC 还是 ToB，自己先完成一个从 Token 生产到应用的闭环。

第二股力量是模型公司。这类公司包括智谱、Minimax、Kimi 等。不过，他们更押注模型本身，这与云大厂截然不同。

它们提供 API 和 Token 服务，也委托其他产业链方销售模型调用服务。虽然一些模型企业已在港股上市，市值数千亿，但根据数据中心建设方等产业链多方观察，这些企业的实际营收与现金流规模还不够大，因此普遍选择保持轻运营状态，目前自持算力基础设施不多。这类企业的重心在模型本身，" 让研发出的模型卖出去 " 是其核心目标，Token 化只是手段。例如，在天翼云最近面向开发者及中小微企业的 Token 套餐，便接入了智谱 GLM5 等模型。

第三股力量是运营商。5 月，三大运营商集体推出 Token 套餐服务，动作最快的是中国电信。实际上早在 4 月的数字中国峰会上，中国电信总经理刘桂清就对外传达了 " 传统产业分工和价值分配模式，正被以 Token 为核心的新型经营模式重塑 "，披露 Token 相关战略规划，天翼云也展开了从 IaaS 到 SaaS 的全栈 Token 服务体系构建。此后，中国电信于 5 月推出试商用 Token 套餐。

运营商的核心优势在于，既拥有大量数据中心、算力与网络资源，又具备最后一公里客户触达平台，以及覆盖全国的属地服务能力。AI 被 Token 化之后，与话费、流量在逻辑上类似，可以像水、电一样计费运营。运营商联合生态共同开发 AI 应用，借助 Token 化服务，来推动 AI 普及。

更值得关注的是，运营商是国内第一批大规模采购国产芯片的主力，有强烈动力推动国产芯片生态适配。目前，行业面临算力利用率偏低、异构算力碎片化、国产化适配难度大、模型迭代又非常快的挑战。业内看到，目前国产芯片适配新模型，达到生产级要求，可能要花几个月时间，而这个周期中模型公司又不断推出新模型，整体适配速度完全不够。为此，运营商也通过其生态整合能力，动员各方力量进行多芯适配、多模融合，是国产生态关键推手。

第四股力量是 AI Infra 企业，这也是当前融资热度最高的一类。Agent 应用爆发推高 Token 消耗，也正在重塑这类企业的商业逻辑，此前 " 赚差价、算不过账 "，而目前行业从买方市场走向卖方市场，让这一赛道的商业化路径愈发清晰。

这类企业中，是石科技对标美国 Corewave 公司，希望能在中国做好独立第三方国产 GPU 云生态，主攻大规模集群运营与国产芯片适配，三年前已实现盈利，正在向重资产的独立第三方云平台演进。硅基流动去年因与华为云合作、最快部署 DeepSeek 模型一举进入行业视野，主要聚焦 MaaS 层，靠近用户侧；无问芯穹是最早在行业内提出 "MxN" 概念，定位 M 种模型、N 种芯片间的中间层产品。

业界观察，美国 AI Infra 企业 Corewave 因受头部模型公司与英伟达的双重挤压，利润空间有限。但毛运航告诉数智前线，国内 AI Infra 企业面临国产适配这一重要机会。国内市场对国产芯片适配有迫切需求，每款芯片架构不同、适配难度各异，光靠硬件厂商去解决从时间到力量都远远不够，需要芯片厂商、AI Infra 企业、应用方共同跑通整个链条。" 一个是国产，一个是调优，这是我们在这一波发展中找到的机会。" 毛运航说。

Coding 与 Agent：最确定的 " 印钞机 "

在众多 Token 服务的方向中，收益最大的是 Coding 与 Agent 方向的大语言模型。有业内人士告诉数智前线，各大厂推出的 Coding Plan（Coding 订阅套餐）看似价格不高，但实际并不亏钱。原因是包月定价模式下，大多数用户实际消耗量远低于上限，"Coding Plan 平均下来比单纯卖 Token 要赚钱 "。

一位资深人士对数智前线进一步补充，现在看来，视频生成的商业价值远低于大语言模型。忻舟的判断更为直接：大语言模型一旦真正进入生产环境，能够产生巨大收益，且 " 收入没有上限 "。

刘伟光对此做了进一步分析。他认为，广告、传媒、影视、短视频确实有巨大市场空间，但与 Coding 和 Agent 方向的大语言模型相比，完全不在同一量级。他的拆解逻辑是，Coding 不只是编程，Coding 催生了 Agent，Agent 能独立完成任务、帮助人类提升生产力，而这一切都与大语言模型深度绑定。" 我们现在所有火力集中的最大点，就是 Coding 和 Agent 方向的大语言模型，这个模型的市场会比其他模型大非常非常多。"

刘伟光观察，自 Coding 工具出现以来，应用发展速度已明显加快。他预判，一旦 " 人人 Coding" 成为现实，每年产生的应用数量或 Agent 数量将是过去的数倍。这不仅是生产力的跃升，更是整个软件行业的结构性重塑。

AI Infra 企业也关注到了这一赛道形势。是石科技毛运航说，如今几乎没有不用 AI 的程序员，海内外大厂都在用模型做 Coding，整个行业已被悄然改变。Agent 的兴起进一步放大了这一效应。" 如何让代码稳定输出、打满缓存、将代码做成完整项目，如何在可控范围内让 Agent 高效产出——这也是当下业界讨论最集中的工程化方向。"

对于 Token 下一步增长趋势，业界持不同看法。大部分人士认为 2026 年行业算力供给非常紧张，而且将愈发紧张，延续到明后两年；也有人士认为，这波 Token 吃紧，与国内外芯片供应相关，但更长远阶段还需观察。

但大家的共识是，在有限算力资源约束下，如何能够最大化单位 Token 生产效率，已经是成为释放 AI 生产力的一个核心命题。" 我自己观察一点，语言模型是一维的，驾驶其实是一个二维平面的，到低空、具身、世界模型就是三维的。从开始训练需求起来，到推理全场景去用，又是一个量级的提升，所以我们能够看到在计算这个事情上，大家还会花很长时间、很多功夫去做。" 毛运航说。

宙世代

一起剪