随着云计算从以 CPU(中央处理器)为核心的通用计算,逐步走向以 GPU(图形处理器)为代表的智能计算,AI 云正在成为中国乃至全球云市场的共识。
在这一过程中,MaaS(模型即服务)平台正在成为绕不开的一环。因为,通过 MaaS 调用模型、消耗 Token(词元),已经是企业使用 AI 云的一种重要形式。
过去一年,围绕 Token 的调用量、增速、规模乃至排名,讨论明显升温(详见《中国 AI 云市场,究竟谁是 " 第一 "?》)。近一年,国内外云厂商(包括亚马逊 AWS、微软 Azure、谷歌云 GCP,阿里云、百度智能云、火山引擎)都在不同时间、不同程度地披露了自己的 Token 消耗相关情况。
Token 甚至像流量一样,成为重要统计指标。国家数据局 2025 年 8 月数据显示,2024 年初中国日均 Token 消耗量 1000 亿。截至 2025 年 6 月底,中国日均 Token 消耗量突破 30 万亿。一年半时间增长了 300 多倍,这反映了中国 AI 应用规模的快速增长。
换句话说,当下的 AI 云市场,Token 正成为部分从业者眼中的 " 北极星指标 "。所谓 " 北极星指标 ",可理解为 " 核心指标 ",指企业内能代表最终成功,指引所有团队努力方向的指标。它像北极星一样,为整个组织提供清晰、统一的战略指引。
之所以会出现这种状态,一个重要原因是,Token 是当前最直观、最容易量化,也最容易比较的指标之一。它有极高的叙事效率——既方便市场传播,也容易被资本和客户理解。
这个观点得到了多位行业人士的认同。一位中国云厂商架构师对我们表示,商业世界往往更偏好简单、清晰的单一指标。2025 年 6 月,一位国际市场调研机构分析师在一场小规模讨论提到,AI 云市场发展初期,Token 调用量相对容易衡量。但他同时认为,长期来看营收规模才是更重要的指标。
当一个指标被当作 " 北极星 ",它是否也可能遮蔽其他重要事实?答案是肯定的。
其一,无论是在中国还是美国,当前各大云厂商的 Token 收入,在整体云收入中的占比仍然较低。至少在目前,Token 市场的规模,尚不足以单独支撑起云市场的整体增长。
其二,现有的 Token 统计存在盲区。市场调研机构披露的 Token 消耗量,大多基于公共云 MaaS 平台的 API(应用程序接口)调用数据。但由于技术和部署方式的限制,它很难全面覆盖所有应用场景。这意味着,发生在 GPU 云租赁、私有化部署,以及制造、汽车、机器人等设备端的 AI 算力使用,往往并未被完整计入。这可能会低估 AI 的真实使用规模。
其三,在企业真实 IT 采购逻辑中,Token 更多是使用之后的结果,而非核心采购决策依据。企业决策往往围绕 AI 是否能够进入业务流程、能否降低成本等问题展开。Token 消耗量,通常不会在采购阶段被单独列为核心指标。
简单理解,Token 是 AI 云的重要组成部分,但将其等同于 AI 云本身,或作为唯一衡量标准,仍为时过早且不够科学。它无法全面呈现中国数字化市场的复杂性和多样性。
Token 市场规模到底有多大?
通过 MaaS 平台使用 Token,这代表了相当一部分前沿开发者、AI 创新企业的前沿需求。无论是中国、美国云厂商,都对这部分市场保持着战略关注。
包括亚马逊 AWS、阿里云等在内的全球云厂商,都在积极探索如何扩大 MaaS 业务规模。
亚马逊 AWS 管理层 2025 年 10 月财报电话会议披露,长远来看,Bedrock(亚马逊 AWS 的 MaaS 平台)收入贡献将与 EC2(亚马逊 AWS 的 CPU 和 GPU 计算实例业务,总营收占比超过 30%)不相上下。但亚马逊 AWS 管理层未披露,Bedrock 收入的详细统计口径,以及上述目标的具体实现时间。
我们了解到,阿里云在 2025 年 11 月末启动了 " 百炼战役 ",目标是短期内将百炼(阿里云的 MaaS 平台)Token 调用规模提升三倍以上。阿里云还为之成立了专门的销售组织。在字节跳动旗下的火山引擎,Token 收入已是销售团队 KPI 考核核心指标之一。
2025 年 12 月末,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在一场小规模沟通中对我们表示,他认同亚马逊 AWS 对 MaaS 收入长期增长的判断。他的看法是,当模型能力持续增强、Agent(智能体)逐步成熟,并覆盖大量 IT 能力有限的长尾企业后,MaaS 收入在云厂商整体收入的占比,有可能达到 30% 甚至更高。但他同时强调,目前行业仍处于早期阶段,过早给出明确的市场规模或占比,并不具备现实意义。
多份市场调研数据表明,目前 Token 市场增速很快,但在 AI 云市场规模仍然有限。短期内,它尚不足以单独支撑起中国云市场大盘的整体增长。
国际市场调研机构 Omdia 2025 年 9 月数据显示,2024 年中国 AI 云市场规模约 29 亿美元,其中 AI IaaS(基础设施)23 亿美元,占比 79%;AI PaaS(平台软件)5.6 亿美元,占比 24%;AI MaaS 收入规模 0.3 亿美元,占比 1%。
Omdia 预测,2025 年中国 AI 云市场规模将增长至 72 亿美元,2030 年将增长至 268 亿美元。2030 年 AI MaaS 市场规模将达到 25 亿美元。按照这一预测,AI MaaS 2030 年在 AI 云市场占比约为 9%。

我们了解到的情况是,2024 年中国主要云厂商 Token 收入总和不超过 10 亿元。2025 年各个云厂商 Token 收入增长均大幅增长。目前 Token 收入高的云厂商超过 10 亿元,但 Token 收入低的云厂商约为数亿元。在一些规模相对较小的云厂商收入结构中,Token 收入可能达到 10% 左右。但在头部云厂商收入结构中,Token 收入占比仅为 1% 左右。
围绕 Token 收入未来的增长空间,行业内部也存在不同测算。Omdia 预测相对保守,市场上也存在一些更乐观的预测口径。
中国某 ICT 硬件企业的一位资深战略规划人士 2025 年 7 月曾对一些中国云厂商未来可能的 Token 收入进行了敏感性测试(一种根据商业模型,综合外部市场条件变化进行市场动态分析的方法)。
他对我们表示,如果 Token 价格依旧维持当前水平,他测试的结果显示,某中国云厂商 Token 调用收入未来 1 年 -2 年可能增长至 40 亿 -70 亿元。但他同时强调,这一测算高度依赖模型能力、应用渗透率及 Token 定价的变化,并不等同于行业整体判断。
按照这种增长预判,Token 收入在部分云厂商的营收大盘占比会更大,可能会成为部分新兴云厂商的主要营收增长来源。但它在短期内(未来 1 年 -3 年)仍无法构成中国 AI 云市场大盘的核心增长来源。
某国内头部云厂商的一位高管和国内某大模型平台业务负责人在 2025 年 12 月在两场不同的对话中,分别对我们表达了同一个观点:AI 云市场仍处于早期发展,如果过于强调 Token 市场的规模乃至排名,容易用短期指标替代对长期增长结构的判断。
上述中国大模型平台业务负责人提到,他所在的云厂商并未参与 Token 相关争论。在他看来,中国云厂商关于 Token 叙事的差异,并非 AI 云技术路线的根本分歧,而是客户结构与历史业务基础不同而导致的差异。
他进一步解释,阿里云强调多形态并存(GPU 云租赁 +MaaS 调用 + 私有化部署)并非保守,这是因为它诞生 16 年形成了庞大多样的客户结构(互联网、金融、制造、公共部门、中小企业、AI 创业企业和前沿开发者等),它需要尊重所有客户需求。火山引擎更强调 Token 是因为,豆包 App 等公司内部业务 Token 消耗占比高,云业务的核心客户以前沿开发者、AI 创业公司为主。Token 消耗增长快,这是 " 后来者 " 容易讲清增长叙事的一条路。
Token 统计中存在哪些盲区?
AI 云仍在发展早期。一个高度复杂、仍在快速演进的技术体系中,单一指标一旦被赋予过多意义,往往也容易遮蔽一些更难被量化却更关键的事实。
目前,使用 AI 算力的形式非常多样——通过公共云租赁 GPU 部署模型、采购 GPU 服务器进行模型私有化部署后进行后训练或强化学习、MaaS 平台调用 Token、端侧算力部署模型等都是主流方案。

不同类型的企业通常倾向于采用不同的方案。比如,大型互联网公司通常习惯租用 GPU 云服务。政企行业(如金融、能源、制造等行业)和公共部门主要是采购 GPU 硬件进行私有化部署,AI 创业公司和前沿开发者则是倾向于选择 MaaS 平台调用 Token。在汽车、机器人、行业设备场景中,往往又是通过本地或边缘环境使用算力。
此外,每一家企业的 AI 算力使用形态,都不是单一的。据我们了解,阿里云 70% 的企业客户,租用 GPU 云服务的同时,也通过 MaaS 平台调用 Token。深度使用 AI 的企业,通常是多形态并存。
某零售企业的数字化策略负责人对我们表示,他们在 AI 应用 PMF(产品市场匹配)验证阶段,优先通过 MaaS 平台调用模型进行可行性测试,因为 Token 计费方式更灵活、试错成本更低。当 AI 应用进入大规模部署阶段后,倾向于租用 GPU 实例,因为长期成本结构更可控。
此外,某国内云厂商的一位资深架构师也对我们表示,他走访客户发现,一些制造企业既采购 GPU 硬件进行私有化部署,也使用 MaaS 平台。其中,数据敏感型的业务使用本地算力,非敏感业务通过 MaaS 平台使用 Token。他认为,Token 计费灵活,这客观上加速了制造企业的上云进程。
我们通过综合调研了解到,某社交媒体、某支付平台每年云支出(含计算、存储、网络、数据库、MaaS 等公共云产品)高达数十亿乃至百亿元。这类头部互联网企业,2025 年直接通过 MaaS 平台使用 Token 的费用,在整体云支出中的占比为极低的个位数。
一位头部社交媒体相关人士 2025 年 11 月曾对我们表示,他所在企业的云支出仍以计算、存储、网络、数据库为主。AI 算力相关投入以 GPU 云租赁、自建推理与训练集群等方式为主,MaaS 产生的 Token 消耗少之又少。
另一个重要事实是,中国市场可被统计到的 Token 消耗,主要集中在娱乐、对话等 To C(面向消费者)的移动互联网场景。这类应用更容易通过 MaaS 调用模型,更容易在早期形成可观的 Token 规模。但更广阔的 To B(面向企业级)领域,目前仍在 AI 应用早期,未来增长潜力更大。
综上所述,真实 Token 使用场景,远比统计口径更复杂、多样。由于技术所限,不同机构很难全面掌握所有场景的 Token 使用情况。如果只看单一的统计数据,很容易得出彼此矛盾的结论。
国际市场调研机构 IDC 2025 年数据显示,截至 2025 上半年,阿里云在中国大模型公有云服务(即 Token 市场)占比为 27.0%,位居第二。阿里云在这里似乎是被低估的。
OpenRouter 是全球大模型 API 聚合平台,集成了全球主流模型,它反映了全球前沿开发者和 AI 创新企业的使用习惯。OpenRouter 数据显示,2025 年阿里 Qwen 系列模型全球 Token 消耗量长期位居全球第六,占比约为 4%-7%。这在国内位居前列,超过 IDC 统计中的其他厂商。阿里云在这里似乎排名又更高。
这种 " 矛盾 " 的成因是,阿里的通义千问、通义万相等都是开源模型。IDC 无法统计到开源模型被使用的情况。OpenRouter 主要覆盖通过聚合平台发生的调用 Token,又难以统计云厂商自有 MaaS 平台内部、企业私有化部署、端侧推理以及真实总量。

因此,无论采用哪种单一统计口径,都无法反映市场真实全貌。这些方式,都会低估中国 AI 落地的真实情况。
国际市场调研机构 Gartner 在《2026 年十大战略技术趋势》给了一个更全面的解释—— 2028 年 60% 以上的企业级 AI 模型将采用特定领域模型(DSLM)(根据特定数据集训练的 AI 模型,准确性、合规性更高),它们可能同时通过云、本地、设备、MaaS 部署。
某中国云厂一位资深人士对我们总结称,前沿开发者、AI 创新企业、企业 PMF 验证阶段习惯通过 MaaS 平台调用 API 使用 Token,这部分数据最容易统计。公共云租赁 GPU 部署更适合互联网或其他大型公司大规模部署阶段的需求。通过私有化或本地部署(On-premise)算力,则符合金融、政府等数据合规要求的机构。端侧算力,适合于汽车、机器人等低延时场景需求。后三种 Token 消耗都难以被统计。
在他看来,严格定义广义 Token 消耗量,要把 MaaS 平台、公共云 GPU 推理集群产生 Token、私有化模型部署产生 Token,设备端模型产生的 Token 全部统计在内。

Token 是企业 IT 采购重点吗?
在讨论 Token 的规模、增速与统计口径之前,一个更基础、却常被忽略的问题是:大型企业在采购 AI 云服务时,究竟是如何做决策的?
在多数企业的真实 IT 采购逻辑中,Token 更多是 AI 应用投入运行后的成本指标,而非采购决策阶段被单独衡量的核心依据。因为,从企业 CIO(首席信息官)、CTO(首席技术官)的视角来看,Token 消耗量并不能直接和业务价值挂钩,更多是和成本挂钩。
Token 本质上是模型调用的技术计量单位,它类似 CPU 使用率、GPU 小时数。因此,无论是在互联网企业、制造业,还是金融、能源与公共部门,它们在引入 AI 能力时,真正衡量的首要业务价值是——能否提高收入,能否降低成本,能否缩短流程周期。
多位企业 IT 负责人曾对我们表示,CIO、CTO 考量中的真实 AI 落地流程大致分成两阶段。
第一阶段是,Agent 能否摆脱独立外挂,进入业务流程并与之深度融合。经过概念验证阶段的小规模试用后,Agent 如何真正长期、稳定地参与业务运行。这要求模型能力,系统稳定性、延迟、可靠性,以及与既有 IT 架构的兼容性,都达到可控水平。在这一阶段,企业更关心 " 能不能用 "" 敢不敢用 ",而不是 " 用了多少 Token"。
在第二阶段,成本与效率逐渐浮出水面。只有当 Agent 已经被部署进具体业务场景,开始持续运行之后,他们会开始考量成本问题。其中包括云成本,还包括人力、外包、系统维护以及流程摩擦所带来的隐性成本。在企业的成本核算与优化体系中,模型调用频次、Token 消耗量以及由此带来的算力成本是云账单的一部分。在这样的决策逻辑下,Token 的角色更接近于运营指标,而非采购指标。
一位中国大型企业集团数字化部门技术人士对我们表示,他们最关注的,不是模型调用消耗了多少 Token,而是 Token 带来了多少算力成本。因为 AI 应用的 Token 成本难以预测,不像过去是买断制、订阅制软件相对固定。
简而言之,Token 消耗量更偏供给方(云厂商)视角,而非需求方(进行数字化转型的企业)视角。因为,企业感知 AI 价值的方式,更多体现在 Agent 等 AI 应用上—— Agent 才是承载业务逻辑,吞吐 Token,直接参与业务流程的基本单元。
部分大型企业智能化转型中,甚至在用 Agent 定义 " 北极星指标 ",如一岗一助手、一人一分身。它更关注 Agent 渗透率,AI 业务渗透率等更加全面的指标。
Token 很重要,但更重要的是,如何让 Token 在真实业务场景中,通过 Agent 转化为可衡量、可持续的业务价值。否则,这甚至可能会导致 " 负向激励 "。
一位中国云厂商资深人士提到,如果过分以 Token 收入增长作为目标,可能会导致在实际工程中,更强、更成熟的模型往往能够以更少的 Token 完成同样的任务,而模型能力不足、系统尚未优化时,Token 消耗反而可能更高。
上述中国云厂商大模型业务负责人 2025 年 12 月曾对我们表达了这样一个观点——中国数字化市场的需求、层次是复杂多样的。云厂商要从客户视角出发,而不是自己想卖什么,进而期望客户用什么。
Token 对前沿开发者、AI 创新企业的需求很重要,但他同时认为,中国数字化市场的真实结构是,头部互联网企业,金融、能源、交通等行业的央国企,制造、零售等领域的大型民营企业仍是中国 IT 支出的主力军。这是中国数字化转型的深水区。因此,应该尊重这部分客户的现实选择。
企业使用 AI,最终目的还是用 AI 逐步替代、吞并、重构几项企业成本——人力成本、传统软件成本、部分外包与流程成本、旧 IT 架构中的低效环节。真正决定 AI 云长期增长空间的,是 AI 是否能够稳定进入更多业务流程,持续优化业务运营,改变企业 IT 结构。
在 2025 年 12 月末的这场沟通中,刘伟光的看法是,云计算到今天并没有改变本质,那就是为应用服务。只是承载的类型从传统应用扩展到了大模型或 AI 应用。重要的是,云计算技术栈要与时俱进。AI 云不是简单的 AI+ 云,而是云计算 IaaS、PaaS、MaaS 平台、Agent 平台全栈深度融合。这样才能让企业客户高效部署 AI 应用。
" 这十多年,中国云市场是全球竞争最激烈的,各种概念层出不穷,价格战也屡见不鲜。但如果用更长的周期去看未来,技术能力和技术布局的前瞻性永远是市场的胜负手,这终将被时间验证。" 刘伟光说。
如果把目光放到中国企业未来 5 年 -10 年的数字化转型,AI 云的竞争重点是系统工程能力——让更多企业客户能够门槛更低、更好地使用 AI,才是关键所在。


登录后才可以发布评论哦
打开小程序可以发布评论哦