刚刚！一家"Token工厂"融资20亿，打破纪录

作者 | 铅笔道惜文

编辑 | 铅笔道黄小贵

封面图 | 硅基流动

AI 公司还在拼模型，另一门更底层的生意正在变大。

近日，AI 基础设施公司硅基流动完成超 20 亿元 B 轮融资。据悉，这是中国 AI 基础设施领域规模最大的单轮融资。

本轮融资阵容跨能源、半导体、软件、AI 等多个行业，也有产业资本和国资平台。

包括携程战投、晶科能源控股、金蝶股份、联通新沃、盛奕资本、壁仞战投、蔚来资本、商汤战投、巨人网络、国泰君安创新投、纪源资本、华登国际、华控基金、国开金融、中关村科学城等。华兴资本担任独家财务顾问。

投资人押注的，是 AI 基础设施里的 "Token 工厂 "：把算力、模型和软件系统整合起来，持续、稳定、低成本地向企业输出 AI 能力。

不做大模型，做 Token 工厂

过去两年，AI 创业的焦点大多集中在大模型本身。

然而，企业真正关心的，并不只是模型有多强，而是能不能稳定使用、调用速度快不快、成本能不能降下来、数据能不能留在自己的环境里，以及能不能适配不同芯片和不同模型。

这正是 MaaS，也就是 " 模型即服务 " 平台要解决的问题。

简单说，企业不一定要自己训练大模型，也不一定要自己搭建复杂的算力系统。它可以像使用云服务一样，通过平台调用模型能力。平台负责把底层算力、模型、推理引擎、调度系统封装好，企业只需要按调用量使用服务。

硅基流动的商业模式就建立在这里。它不是再做一个通用大模型，而是做大模型落地时的中间层：上游连接 GPU、国产 AI 芯片、智算中心等算力资源，中间适配 DeepSeek、Qwen、GLM、Kimi 等主流模型，下游服务企业客户、开发者和 AI 应用公司。

硅基流动业务增长数据来源：硅基流动

按照公司披露的数据，过去一年，硅基流动在企业级市场增长较快。其日均 Token 调用量达到数万亿，服务超过 1000 万用户和 1 万家企业客户，营收同比增长超过 10 倍，海外市场单月营收达到数百万美元。

这些数字背后，说明 AI 应用正在从 " 尝鲜 " 进入 " 高频调用 "。当越来越多企业把 AI 嵌入办公、客服、研发、金融、交通、能源、公共服务等业务流程，Token 消耗就会持续增长。对企业而言，每一次调用模型都意味着成本。对硅基流动这样的基础设施公司而言，调用量越大，平台价值越明显。

这也是 "Token 工厂 " 这个说法的核心含义：它不是生产看得见的硬件，而是把算力转化成可被应用直接调用的 AI 能力。

企业看重更便宜、更稳定的 AI 能力

AI 落地企业，最现实的问题往往不是 " 有没有模型 "，而是 " 用不起、用不好、管不住 "。

第一是成本问题。大模型推理需要大量算力，尤其是在用户量和调用量上来后，成本会迅速放大。对于 AI 应用公司来说，如果每次调用模型的成本太高，商业模式就很难成立。对于大型企业来说，如果内部大量业务都接入 AI，长期成本同样不可忽视。

第二是稳定性问题。企业客户不像个人用户，可以接受偶尔卡顿或失败。金融、能源、交通、政务、科研等场景，对系统稳定性、响应速度和安全合规要求更高。模型服务一旦不稳定，就会影响真实业务。

第三是算力利用率问题。很多企业、地方智算中心或云厂商拥有算力资源，但算力并不等于可直接变现的 AI 服务。不同芯片、不同集群、不同模型之间存在适配和调度难题。如果利用率不高，昂贵的算力资产就会闲置或回报偏低。

硅基流动试图解决的，就是这些问题。

硅基流动四大核心能力来源：硅基流动

根据公司介绍，它自研了大模型推理引擎。可以支持 DeepSeek、Qwen、GLM、Kimi 等主流模型。也可以在英伟达、华为昇腾、沐曦、摩尔线程等不同芯片上运行。这件事的价值，在于提高算力效率。也就是让同样的芯片跑出更多 Token。让企业用更低成本获得 AI 能力。同时，硅基流动还在做异构算力纳管和调度。所谓异构算力，就是不同品牌、不同架构、不同地点的算力资源。以前，这些算力很难统一管理。硅基流动希望通过软件系统，把分散的算力统一调度起来，再转化成标准化的 Token 服务。

这也是为什么本轮投资方里出现了能源、芯片、算力基础设施、云服务和应用场景企业。AI 基础设施不再是单点竞争，而是电力、算力、芯片、模型和应用之间的协同。

例如，晶科能源控股看重的是 " 光伏 + 储能 " 与智算中心之间的结合。AI 计算需要大量电力，如果未来 Token 消耗持续增长，低成本、绿色电力将成为智算中心的重要竞争力。

壁仞科技则更关注国产 AI 芯片与推理服务之间的适配。

金蝶股份看重的是企业管理软件场景，未来企业客户使用 AI 时，需要更低成本、更高效率的模型服务底座。

联通体系则关注 " 连接 + 算力 +AI 服务 " 的全栈能力。

硅基流动正在进入更复杂的产业链协同中。

AI 基础设施开始赚钱

硅基流动的发展节奏，也能看出 AI 基础设施公司从开发者市场走向企业市场的路径。

公司在 2023 年 8 月启动大模型推理引擎研发。2024 年 5 月，公有云 MaaS 上线，上架数十款主流开源模型，打通从底层算力到标准化 Token 服务的链路。这个阶段更像是把模型服务做成 " 货架 "，让开发者和企业可以更方便地调用。

2025 年 2 月，硅基流动基于华为昇腾上线 DeepSeek 推理服务，开始强调国产算力上的大规模 Token 生产能力。对中国 AI 产业来说，这一步有较强现实意义。随着 AI 算力需求快速增长，如何在国产芯片上稳定运行主流模型，成为许多企业和机构关心的问题。

2025 年 9 月，公司推出私有化 MaaS，面向拥有自有算力、同时对数据合规要求较高的国央企和金融机构。这个变化很关键。很多大型企业并不愿意把核心数据完全放到公有云环境里，也不希望重要业务完全依赖外部接口。因此，能否在企业私有环境里搭建专属模型服务平台，成为 AI 基础设施进入大客户市场的重要门槛。

到 2026 年 4 月，硅基流动上线新一代算力调度引擎 " 弹性 GPU"，支持多元异构算力的弹性扩缩容，并支持客户自助式部署模型。这意味着，公司不仅在卖模型调用服务，也在帮助算力持有方提升资产利用效率。

这种商业模式可以从两个方向赚钱。一端是面向企业和开发者，按 Token 调用、模型服务、平台服务收费；另一端是面向智算中心、云厂商、大企业等算力持有方，帮助它们把 " 裸算力 " 变成可售卖、可调用、可管理的 AI 服务。

这也是 AI 基础设施行业正在出现的新机会：模型本身固然重要，但模型要真正进入千行百业，还需要大量中间层公司解决工程化、成本、稳定性、合规和调度问题。

硅基流动援引第三方数据称，其已进入中国第三方 MaaS 平台第一梯队。Gartner 相关市场指南将硅基流动列为代表性厂商；IDC 数据显示，硅基流动是中国公有云 MaaS 市场份额前四中唯一一家创业公司；OpenRouter 数据显示，在 70 余家 Token 供应商中，SiliconFlow 的日 Token 消耗量曾连续数周位居第一；Dify Marketplace 数据显示，SiliconFlow 插件安装量超过 55 万，在全球 100 余家 Token 供应商中排名前五。

MaaS 和 Token 供应正在从技术概念变成真实市场。过去，AI 公司讲故事时常说自己要做 " 应用 " 或 " 模型 "。现在，资本也开始关注一个更朴素的问题：当所有应用都要调用模型时，谁来提供稳定、便宜、可规模化的底层服务？

硅基流动本轮超 20 亿元融资，正是这一趋势的集中体现。

宙世代

一起剪

相关标签