每日经济新闻 23小时前
疯狂扩产的“Token 工厂”:营收数十倍增长上演资本狂欢,API价格战、端侧分流双重夹击 赛道盈利持续承压
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_caijing1.html

 

当大模型竞赛从 " 参数军备 " 转向 " 应用落地 ",一个隐秘而高增长的底层生意正在浮出水面—— "Token 工厂 "(把人工智能能力拆解成最基础的计量单位 "Token 词元 ",像自来水厂一样按需供应)。

6 月 16 日,国内 AI(人工智能)推理服务企业 " 硅基流动 " 官宣完成超 20 亿元 B 轮融资,创下 2026 年以来国内第三方 MaaS(模型即服务)赛道最大单笔融资纪录。《每日经济新闻》记者了解到,这家成立不足三年的企业,过去一年日均 Token 吞吐量达数万亿量级,营收同比涨超十倍,还曾在 11 个月内连获三轮融资,成为一级市场炙手可热的标的。

无独有偶,5 月,同赛道企业无问芯穹、魔形智能纷纷宣布融资。其中,无问芯穹再获超 7 亿元融资,累计融资额超 22 亿元。截至 4 月底,无问芯穹 Agentic MaaS 大模型服务平台的日均 Token 调用量相较于去年底已增长超 20 倍。

资本狂热加码的另一面,头部互联网大厂全面落地自研推理算力与 MaaS 服务、全行业 API(应用程序编程接口)定价陷入白热化竞争、端侧轻量化模型持续分流云端 Token 调用需求。多重挤压之下,"Token 工厂 " 普遍陷入业务规模高速扩张、盈利空间不断收窄的矛盾局面,如何走出增收不增利的困局成为赛道核心议题。

产业资本扎堆入局 "Token 工厂 " 成 AI 落地核心赛道

一笔 20 亿元级融资,将 "Token 工厂 " 赛道再次推至聚光灯下。

据硅基流动官方披露,本轮融资由携程战投、晶科能源控股、金蝶股份、联通新沃、盛奕资本(润泽集团产业资本)、壁仞战投、蔚来资本、商汤战投、巨人网络等二十余家机构联合投资。至此,硅基流动已获得能源、芯片、算力基础设施、云服务、大模型及场景应用等 AI 全产业链企业投资,产业资本在本轮融资中占比显著提升。

图片来源:硅基流动公众号

这并非赛道首笔大额融资。今年 5 月,同赛道玩家无问芯穹刚完成超 7 亿元融资;海外市场中,Fireworks AI 成立四年目标估值达 150 亿美元,日处理 Token 规模 15 万亿。短短一年时间,"Token 工厂 " 已从 AI 产业链边缘环节,跃升为一级市场的核心赛道。

资本热捧的底层逻辑,是 AI 需求结构的根本性切换。

大模型能力每迈上一个台阶,就解锁一大类应用,应用反过来又提升了底层 Token 消耗量。据国家数据局相关数据,2024 年初中国日均 Token 调用量为 1000 亿;至 2025 年底跃升至 100 万亿;今年 3 月已突破 140 万亿,两年增长超千倍。

全球知名咨询机构 IDC 最新发布的《中国 AI 软件市场半年度追踪,2025H2》数据显示:2024 年中国企业级 MaaS 市场调用量仅 114 万亿 Token,2025 年跃升至 1944 万亿 Token,同比增长约 16 倍;2025 年公有云 MaaS 市场规模达 30.7 亿元,增速远超 AI 行业整体水平。Agent 智能体普及、多模态应用落地、行业数字化转型三大趋势,仍在持续推高 Token 消耗规模。

图片来源:IDC 官方公众号

IDC 预测,2026 年中国 MaaS 市场的 Token 消耗量将达到 40000 万亿,较 2025 年再增约 20 倍。

从商业模式本质来看,Token 工厂并非简单的算力转售,核心是将芯片适配、模型部署、推理引擎调优、异构算力调度等复杂工程能力,封装为标准化 API 接口。客户按需调用、按量付费,省去了企业自建集群、组建运维团队的重投入,大幅降低了 AI 落地的技术门槛与成本周期。

面对海量的市场需求爆发,大规模、高性价比 Token 的稳定供应,正成为影响 AI 技术规模化落地的关键能力。

天使投资人、资深人工智能专家郭涛接受《每日经济新闻》记者采访时表示,从 " 卖模型 " 到 " 卖 Token" 是 AI 产业商业化的重要演进。Token 作为大模型处理信息的最小单元,具备可计量、可定价、可交易的特性,将 AI 智能能力转化为可标准化交易的大宗商品,解决了 AI 能力难以量化的行业痛点,推动行业从定制化服务模式转向标准化、规模化变现模式,长期来看这门生意具备较好的可持续性。

中金公司研报显示,"Token 工厂 " 模式已成为全球大模型厂商的主流商业化路径,海外头部企业 Anthropic 年度经常性收入突破 300 亿美元。盈利层面,当前海外头部大模型 API 业务毛利率普遍在 40% 至 50%,国内大模型厂商 MaaS API 业务毛利略低于海外,预计今年将达到 20% 至 40%,随着规模效应释放与技术优化,长期仍有上行空间。

大厂下场、API 价格战白热化、端侧 AI 快速普及⋯⋯ "Token 工厂 " 盈利承压

不过,头部企业营收十倍增长的亮眼数据背后,赛道隐忧始终存在。随着互联网大厂下场布局、API 价格战白热化,"Token 工厂 " 的商业模式边界与增长天花板正被重新审视。

大厂亲自下场是最直接的行业变量。

图片来源:每经记者 张涵   摄

6 月 8 日,阿里巴巴宣布组织架构调整,将通义大模型事业部与未来生活实验室整合,成立全新 Token Foundry 事业部,由集团 CEO(首席执行官)吴泳铭直接负责。此前 3 月,阿里成立 ATH(Alibaba Token Hub)事业群,已经喊出了 " 创造 Token、输送 Token、应用 Token" 的核心目标。

将 Token 生产提升至集团战略级,背后是大厂对推理服务入口价值的重估:Token 产能既是支撑自身电商、云服务、本地生活等业务 AI 化的基础,也是阿里云对外输出 MaaS 服务的核心产能。

郭涛认为,大厂全面入场后,独立第三方 "Token 工厂 " 仍有生存空间。他向记者表示,大厂虽有技术、资源和生态优势,但市场需求多样且复杂,难以覆盖所有领域和场景。独立第三方可聚焦特定垂直领域提供个性化、定制化服务,或深耕特定技术优化,针对某类模型或场景提升 Token 生成效率与质量。此外,部分企业出于数据安全、避免过度依赖单一厂商的考量,也会选择与独立第三方合作。

API 价格战持续白热化,则是当前 "Token 工厂们 " 面临的最直接盈利压力。

自 2023 年以来,头部大模型厂商已累计十余次下调 API 价格,部分主流模型千 Token 价格从最初的数毛钱降至几分钱,累计降幅超 90%。缺乏核心优化能力、仅靠算力差价盈利的中间商型玩家已率先陷入亏损。

今年 5 月,DeepSeek 官方宣布 V4-Pro 模型 API 永久降价,整体降幅 75%,百万 Token 输出价格为 6 元。随后,小米、腾讯云纷纷跟进,小米旗下 MiMo-V2.5 系列 API 永久降价,最高降幅达 99%,Pro 版定价与 DeepSeek V4-Pro 完全对齐。腾讯云自 6 月 3 日 0 时起,对 DeepSeek-V4 系列模型调用价格进行大幅下调,最高降幅达到 97.5%,调整后价格全面持平 DeepSeek 官方售价。

图片来源:IDC 官方公众号

业内普遍认为,若 "Token 工厂 " 效率提升的速度跟不上价格下降速度,商业模式的可持续性将直接面临挑战。

此外,端侧 AI 的快速普及,则从需求端分流市场。随着手机、PC(个人电脑)等终端设备的端侧大模型能力升级,大量轻量级推理任务向端侧迁移,无需调用云端 Token。行业普遍预测,未来 30% 至 50% 的推理需求将在端侧完成,尽管高复杂度、多模态、长上下文的核心推理需求仍依赖云端,但端侧分流无疑收窄了云端 "Token 工厂 " 的整体增长天花板。

与此同时,头部客户自建推理集群的趋势也在蚕食第三方市场份额。金融、能源、政务等数据敏感型行业出于合规考量,更倾向私有化部署;头部互联网企业随着业务规模扩大,自建算力集群的单位成本已低于第三方采购,纷纷转向自建。第三方 "Token 工厂 " 的核心客群,可能逐步向中小企业、长尾应用与弹性需求场景集中,市场定位面临重构。

对于 "Token 工厂 " 赛道的泡沫争议,郭涛向记者表示,目前市场确实存在一定泡沫迹象。大量资本涌入下,部分企业为追求规模盲目扩张,忽视实际成本与盈利情况。但整体而言,AI 发展是大势所趋,Token 经济作为其商业化关键模式有着真实需求支撑,只是市场需要经历调整与整合。

谈及破局路径与行业终局,郭涛认为,"Token 工厂 " 可通过提升算力利用效率、优化能耗降低运营成本,通过分级服务实现差异化定价获取溢价,还可配套模型优化建议、技术支持等增值服务拓展收入来源。

" 长期来看,市场更可能形成多层次、差异化的竞争格局:头部大厂凭借实力占据通用型大规模市场,中小‘ Token 工厂’凭借特色服务深耕细分领域,形成错位竞争,共同构成多元的市场生态。" 郭涛表示。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 人工智能 晶科能源 融资 产业链
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论