硅星人Pro 昨天
Token不是一切:AI云的竞争才刚刚开始
index.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

云市场很久没有这么热闹了。

IDC 最新数据显示,2025 年上半年中国公有云市场规模达到 1206.69 亿元,同比增长接近 20%。其中 MaaS 市场规模 12.9 亿元,同比增长 421.2%,成为云计算赛道中增长最快的细分领域;AI 大模型解决方案市场规模 30.7 亿元,同比增长 122.1%,金融、政务和制造行业贡献了超过六成预算。AI 给云计算带来了二次发展的机遇,这一点毋庸置疑。

热闹归热闹,喧嚣之中也有一些值得冷静的地方。

年末各家陆续晒出成绩单,Token 调用量成为最热门的指标。日均几十万亿的数字在行业里此起彼伏,颇有当年市场份额大战的既视感。但熟悉云计算行业的人应该还记得,市场份额这件事,行业已经很久不怎么强调了。不是因为不重要,而是大家逐渐意识到,在一个还在快速扩张的市场里,份额只是某个切面的快照,很难说明太多问题。

今天的 Token 调用量,某种程度上也在重复这个逻辑。

把数字放在一起看就更清楚:MaaS 市场 12.9 亿,整个公有云市场 1206 亿,占比刚过 1%。当所有注意力都集中在这 1% 的增速和排名上时,我们可能正在用一把过于狭窄的尺子丈量这个市场。

Token 调用量能说明一些问题,但说明不了全部。云计算的竞争也从来不只发生在应用层。因此,硅星人的判断是:2026 年,AI 云的竞争终将回归基础设施,回归全栈能力的比拼。

01 Token 是一个好指标,但不是唯一指标

Token 调用量成为热门指标,有它的道理。它直观、可量化、易传播,在一个需要强心剂的市场里," 日均几十万亿 " 这样的数字天然具有冲击力。对投资人、媒体、甚至部分客户来说,这是最容易理解的 AI 繁荣证据。

但问题也同样明显。首先数量不等于质量,同样一个任务,一个模型用 1 万个 Token 完成,另一个用 1000 个完成,谁的能力更强?场景差异同样巨大,写一段营销文案消耗的 Token,和帮金融机构做票据识别消耗的 Token,消费端陪聊产生的 Token,和生产端提升效率产生的 Token,意义都完全不同。

更关键的是,API 调用只是企业使用 AI 的方式之一,而且是最轻量的一种。

从云服务商的视角看,企业使用 AI 大致有几种路径:直接调用 API,模型在云端,按量付费,这是当前 Token 统计的主要口径;往深一层是在云上做后训练和微调,企业把自己的数据灌进去,训出适配业务的模型;再往深是下载开源模型在本地或私有云部署,数据不出域,推理在本地完成;还有更特殊的场景,比如车端智驾、机器人端侧推理,模型直接跑在设备上,响应必须是毫秒级,根本不可能等云端返回。

这些路径产生的算力消耗同样庞大,但从未进入任何一份公开报告的统计口径。

据硅星人了解,在阿里云上,使用 API 调用服务的客户和使用 GPU 算力的客户,重合度高达 70%。这意味着真正深度使用 AI 的企业,从来不是只选一种方式,而是根据场景选择不同的服务层级:有些调 API 就够了,有些需要自己训模型。只看 API 调用这个口径,相当于只看到了冰山露出水面的部分。

而冰山之下,是企业向 AI 转型的真实图景:它不是简单地接入一个 API,而是一场涉及数据、流程、组织的体系化变革。

这件事快不了,也不可能一蹴而就。没有一个企业在选择 AI 服务时会想 " 你的 Token 调用量最多,所以我选你 "。它们想的是:你能不能解决我的问题。

02 AI 云的客户,远不止互联网公司

什么样的场景在消耗 Token?这个问题的答案,决定了我们如何理解当前 AI 云市场的真实状态。

目前中国这波 AI 热潮,最直观的繁荣集中在消费端:ChatBot、唱歌、跳舞、AI 换脸、虚拟陪伴 …… 这些应用主要跑在手机上,用户增长快,Token 消耗大,数据好看。与此同时,MaaS 市场增长最快的客户群体是 AI 原生企业和互联网公司,它们天然就是 API 调用的理想用户:业务在线,数据现成,开发能力强,调用 API 就能跑起来。

但这只是 AI 市场的一个切面。

更广阔的空间在企业级市场,在各类终端上。2025 年大量传统行业开始尝试 AI:农牧业在用 AI 做牲畜数量识别、异常行为检测;安防领域在做多模态的家用监控,婴儿看护、宠物识别、火焰告警;重工业在用维修助手缩短高级技师的培养周期;教育公司在做智能判卷,不只是选择题,连主观题都能批;物流公司给一线员工配上 AI 助手处理日常咨询。这些场景不只发生在手机上,还发生在车端、机器人、工业设备、IoT 终端,对实时性、可靠性、数据安全的要求远高于消费端。

这些企业有一个共同特点:它们不是 AI 原生的。它们有几十年积累的业务数据和行业 know-how,需要的不是简单调用一个 API,而是把 AI 和自己的数据、流程深度耦合。很多企业连数字化都没完成,需要先做数据治理,再做后训练和微调,最后才是部署应用。这是一整套服务,不是一个 API 接口能解决的。

这也是为什么开源模型和闭源模型对云市场的拉动作用呈现出不同的节奏。闭源模型的路径更直接:客户调用 API,按量付费,收入确认清晰,增长曲线漂亮。开源模型的逻辑不同,客户下载后可能在本地部署,可能用自己的 GPU 集群做推理,也可能在云上做后训练但不走 API 调用。这些使用行为同样在发生,但很难被统计。开源对云的拉动是存在的,只是更分散、更隐蔽、周期更长。

从全球范围看,阿里云是一个比较特殊的存在,它是少数同时押注云计算基础设施和开源模型生态的大型云服务商。

Qwen 系列模型开源后,全球下载量已超过 8 亿次。但这 8 亿次下载中,有多少转化成了阿里云的收入?很难直接计算。开源是一个生态逻辑,不是一个交易逻辑。

消费端的热闹只是开始,企业级市场的 AI 转型才是真正的硬仗:数据治理、流程再造、组织适配,每一步都不容易。整个产业向 AI 的转型,还有很长的路要走。

03 回到云计算的底层逻辑

云计算行业发展了这么多年,一个最深的体感是:云计算行业没有讨巧的事。

每一个数据库产品,上线时的产品,被几十家客户打磨后几乎完全重构。每一层服务能力,都是脏活累活苦活堆出来的。基础设施的稳定性、安全性、弹性扩展能力,都不是靠讲故事讲出来的,而是靠无数次故障复盘、性能调优、架构迭代磨出来的。这些能力没有捷径,也无法速成。

不管 AI 给这个行业带来多大的想象空间,底层的逻辑没有变:谁的基础设施更扎实,谁的全栈能力更完整,谁才能走得更远。

MaaS 的竞争也从来不是孤立的。一个企业客户调用大模型 API,背后发生的事情远比 " 请求 - 响应 " 复杂得多。它背后是 PaaS 层的能力:数据怎么存、怎么治理、怎么灌进模型做训练、怎么搭建 Agent 工作流;再往下是 IaaS 层的积累:芯片、服务器、网络、存储、GPU 集群调度,一整套基础设施在支撑。任何一层出了短板,整体体验就会打折扣。

这也是为什么全栈能力在 AI 时代变得更加重要。过去云计算的竞争,IaaS、PaaS、SaaS 相对独立,客户可以分层采购,今天用 A 家的计算,明天换 B 家的数据库。但 AI 改变了这个逻辑。模型训练需要海量算力,推理需要低延迟网络,数据需要在安全合规的前提下流动,这些环节高度耦合,很难拆开。谁能把模型能力和基础设施能力结合得最好,打造出最高的性价比,谁才具备长期竞争力。

2026 年,当更多企业从 " 尝鲜 " 走向 " 深度使用 ",当 AI 从消费端走向生产端,竞争一定会回归到全栈。

但这场竞争究竟会如何演化,现在下结论还太早。

1996 年,摩托罗拉总裁访问中国,预测到 2000 年中国手机用户大概有 100 万。结果 2000 年中国手机用户突破 1 亿,再过几年突破 10 亿。而那时候,摩托罗拉已经掉队了。技术变革期的预测,往往会低估市场的爆发力,也会高估短期的竞争格局。

MaaS 市场占整个云计算大盘刚过 1%,中国企业级市场的 AI 渗透才刚刚开始,99% 的企业还没有真正入场。

云计算的发展从来都是一个漫长的过程,没有捷径可走。暂时的数据波动,不值得过度兴奋,也不值得过度焦虑。真正值得关注的,是谁在扎扎实实地建基础设施,谁在认真地服务企业客户,谁在为三年后、五年后的竞争做准备。

评论
大家都在看