文 | 硅基象限
当用户不再纠结每月是否要升级流量套餐时,或许要开始纠结每月买多少 Token 服务了。
Token 即将像流量、宽带、短信一样,被运营商包装成标准化服务进行售卖。
日前,国内三大运营商陆续推出 Token 套餐产品:面向个人用户推出按月订阅制 Token 方案,面向开发者和企业客户提供分层算力套餐,并宣布已将数十至数百种大模型纳入平台," 按月购买、多模型调用、话费支付 "。
中国电信已推出个人及企业版 Token 套餐,月费最低 9.9 元,1000 万 Token 使用量;上海移动、上海电信等地方运营商则推出按额度点或通用 Token 计费模式,上海移动 1 元可获得 40 万 Tokens。
随着运营商开始售卖 Token 服务,用户切换大模型的成本将大幅降低,那么对于大模型企业来说," 用户粘性 " 将被弱化,只有 "更卷 " 才能保住市场。
未来,豆包、千问、DeepSeek 等大模型厂商,不仅要卷 " 价格 "," 单位能耗下 Token 质量 ",甚至卷向 " 更高价值的 AI 应用解决方案能力 "。
01 什么是 Token 服务?
要理解 Token 服务,先理解什么是 Token。
计算机无法直接识别文字,只能识别 0、1 代码,所以我们输入的每个单词、文字、语音、标点,都会通过特定编码机制,转换成 0、1 代码。
在大模型语境中,也是先识别数字编码,而每个文字转换成的数字编码位数略有差异。
Token 是大模型处理信息的最小计算单位。用户输入、上下文记忆、模型输出,都以 Token 计算。模型调用越复杂、上下文越长、Agent 执行链条越深,Token 消耗越高。
通常情况下:在英文中,一个 Token 大约相当于 4 个字母;在中文中,由于汉字信息密度更高,一个汉字、一个标点符号或一个词组,往往对应 1 到 2 个 Token。
由于大模型的思考和输出是逐个 Token 进行的,因此,行业便将大模型的调用成本、使用额度,以 " 每百万 Token(Per Million Tokens)" 或 " 额度点 " 的形式向用户进行售卖与结算。
目前大模型公司对于 Token 进行阶梯收费,普通用户用豆包、千问这类大模型普通模式,免费;而如果是企业级的重度使用,可以通过购买不同阶梯的 API 包月、计量服务。
从去年开始,运营商开起了大模型 " 算力超市 "。模型厂商是 " 入驻商户 ",运营商收 " 平台费 + 算力费 + 渠道费 "。用户买的不是 " 运营商模型 ",而是:在电信平台上,用电信算力,调用任意大模型,按 Token 计费。
2025 年 7 月,中国移动发布模型服务平台 MoMA(Mobile Model Access);4 月,中国电信发布星辰 TokenHub 运营服务平台,5 月," 联通星罗 "Token 服务平台发布,这些平台把百度、阿里、字节、DeepSeek 等多家主流大模型全部接入,统一 API、统一鉴权、统一计费。
运营商平台内部对多种大模型适配,用户只需要换个模型名称(Model ID)就能平滑切换。
02 运营商为何卖 Token ?
Token 服务的爆发并非偶然。
首先,计费模式改变。在传统的云计算时代,用户习惯于为 " 服务器租赁时间 " 或 " 固定带宽 " 买单(即 IaaS 层的算力付费),买的是带宽速率和时间。但是随着大模型的发展,不同大模型提供的能力,不同任务所需消耗的成本差距非常大。比如更强的模型,单个 Token 更贵;更长上下文,Token 消耗更多;推理复杂度越高,实际成本越高。按 Token 计费,可以对齐 " 用户消耗的智能程度 " 与 " 厂商付出的算力成本 "。
其次,降低技术门槛与 " 试错成本 "。大模型的研发和部署动辄需要千万乃至数亿美元的投入。对于绝大多数中小企业和个人开发者而言,自建模型并不现实。Token 服务将 " 通用人工智能(AGI)" 能力切碎、打包,开发者不需要关心底层有几万张 GPU 在烧电,只需要按需调用 API 并支付 Token 费用。
最后,应用层爆发带来的迫切需求。步入 2026 年,AI Agent(智能体)、AI 辅助编程、多模态内容生成等应用层场景爆发。这些应用在日常运行中,需要频繁地与底层大模型进行 " 吞吐 " 互动。一个自动化的 AI 写代码工具,可能在一夜之间就要消耗数百万个 Token。这种高频、海量的交互,倒逼市场必须提供更加标准化、稳定且具备价格竞争力的 Token 套餐服务。
过去二十年,运营商商业模式经历了三次核心计量单位变化。
第一阶段是语音时代,运营商出售的是分钟数;第二阶段是移动互联网时代,出售的是流量 GB;而进入 AI 时代,运营商开始尝试出售 Token。
Token 正在经历与流量相似的演化过程。最初,只是技术指标;随后成为计费单位;最终演变为标准化商品。
运营商入局,标志着 Token 已开始脱离技术范畴,进入消费体系。
未来几年,用户购买 AI 能力的方式可能发生根本变化:个人用户购买 "AI 月包 "、 企业采购 "Token 资源池 "、家庭宽带附带 AI 额度、 政企专线集成 Agent 服务。Token 将像电、水、流量一样成为基础资源。
但这并不意味着,运营商会替代大模型厂商。
03 Token 怎么买合适?
Token 服务究竟是从原生大模型厂直接售卖,还是从运营商平台购买?目前两种商业模式都有何利弊。
第一种是原生模型厂商模式,即按百万 Token 计费。OpenAI、Anthropic、DeepSeek、千问等厂商普遍采用这一体系。用户按输入 Token、输出 Token 分别付费。诸如千问等可能采用月初预购买,月底结账的形式。
第二种是运营商月费订阅 Token 额度。例如上海电信推出最低 9.9 元对应 1000 万 Token,超额再追加,并计划将 Token 权益融合进家庭的 " 美好家 " 数字空间中,支持话费账单一键支付。
这种 " 一价全包 " 或 " 话费融合 " 的模式,让中国用户能够像买流量包一样购买大模型算力。
海外市场以大模型原生企业的 API 阶梯计价为主,国内市场将 Token 服务推向了类似于手机话费的 " 套餐化 " 时代。
目前来看,两种收费模式各有优势,因为从 Token 套餐用户群体看,主要分三个类型。
第一是独立开发者与技术发烧友(Geeks)。他们利用各家厂商提供的 API 接口,搭建属于自己的个性化 AI 应用,如效率工具、自动翻译插件、个人专属知识库等;
第二类是中小企业、初创公司与 B 端独立软件开发商(ISV),这是 Token 服务最核心客群。无论是给公司员工购买用于编程的 Token,还是开发针对特定行业的 AI Agent,还是在现有的企业 ERP、CRM 系统中嵌入 AI 辅助功能,中小企业需要订阅云厂商或运营商的 " 团队版 Token 套餐 "。
第三类是 " 重度依赖 AI" 的职场人与普通家庭,他们在居家场景需要高频使用 AI 进行文案创作、代码编写,或者需要 AI 辅导孩子功课。
针对中小企业、初创公司,从技术经济学角度,原生大模型的纯 Token 计费模式更科学。
而运营商的套餐模式,有两个优势,一方面,独立开发者不需要绑定在某一家大模型上,可以通过平台商进行多种大模型自主选择;另一方面,Token 服务或将更快走向大众消费。因为大多数人知道 100GB 流量意味着什么,却无法感知 1000 万 Token 代表多少。
运营商采用月费订阅,本质上是在降低认知门槛。用户不需要理解 Token,只需要从普通 9.9 元 /1000 万 Token 开始了解自己的需求。
随着运营商开始售卖 Token 服务," 豆包们 " 即将开始向三个层次内卷。
从 " 拼参数 " 到 " 拼能效比 ":对于大模型企业来说,将不能继续盲目追求大模型的大参数、大耗能,而是将精力投入到模型蒸馏(Distillation)、量化(Quantization)以及推断加速(Inference Optimization)等能用更小能耗、输出更高质量 Token 的能力。
价格竞争将进一步加剧。运营商聚合数百模型后,用户切换成本下降。如果 A 模型涨价,可通过平台替换 B 模型。模型能力差异不足时,价格将成为核心竞争因素。
大模型企业利润中心将转移。单纯卖 API 利润有限,未来盈利重点可能转向 Agent、行业应用、企业解决方案。模型本身逐渐成为基础设施,而应用层成为价值中心。
或许," 双边市场 " 正在形成:运营商控制入口,模型厂商控制能力。


登录后才可以发布评论哦
打开小程序可以发布评论哦