
作者 | 铅笔道 惜文
编辑 | 铅笔道 黄小贵
封面图 | 硅基流动
AI 公司还在拼模型,另一门更底层的生意正在变大。
近日,AI 基础设施公司硅基流动完成超 20 亿元 B 轮融资。据悉,这是中国 AI 基础设施领域规模最大的单轮融资。
本轮融资阵容跨能源、半导体、软件、AI 等多个行业,也有产业资本和国资平台。
包括携程战投、晶科能源控股、金蝶股份、联通新沃、盛奕资本、壁仞战投、蔚来资本、商汤战投、巨人网络、国泰君安创新投、纪源资本、华登国际、华控基金、国开金融、中关村科学城等。华兴资本担任独家财务顾问。
投资人押注的,是 AI 基础设施里的 "Token 工厂 ":把算力、模型和软件系统整合起来,持续、稳定、低成本地向企业输出 AI 能力。
不做大模型,做 Token 工厂
过去两年,AI 创业的焦点大多集中在大模型本身。
然而,企业真正关心的,并不只是模型有多强,而是能不能稳定使用、调用速度快不快、成本能不能降下来、数据能不能留在自己的环境里,以及能不能适配不同芯片和不同模型。
这正是 MaaS,也就是 " 模型即服务 " 平台要解决的问题。
简单说,企业不一定要自己训练大模型,也不一定要自己搭建复杂的算力系统。它可以像使用云服务一样,通过平台调用模型能力。平台负责把底层算力、模型、推理引擎、调度系统封装好,企业只需要按调用量使用服务。
硅基流动的商业模式就建立在这里。它不是再做一个通用大模型,而是做大模型落地时的中间层:上游连接 GPU、国产 AI 芯片、智算中心等算力资源,中间适配 DeepSeek、Qwen、GLM、Kimi 等主流模型,下游服务企业客户、开发者和 AI 应用公司。

硅基流动业务增长数据 来源:硅基流动
按照公司披露的数据,过去一年,硅基流动在企业级市场增长较快。其日均 Token 调用量达到数万亿,服务超过 1000 万用户和 1 万家企业客户,营收同比增长超过 10 倍,海外市场单月营收达到数百万美元。
这些数字背后,说明 AI 应用正在从 " 尝鲜 " 进入 " 高频调用 "。当越来越多企业把 AI 嵌入办公、客服、研发、金融、交通、能源、公共服务等业务流程,Token 消耗就会持续增长。对企业而言,每一次调用模型都意味着成本。对硅基流动这样的基础设施公司而言,调用量越大,平台价值越明显。
这也是 "Token 工厂 " 这个说法的核心含义:它不是生产看得见的硬件,而是把算力转化成可被应用直接调用的 AI 能力。
企业看重更便宜、更稳定的 AI 能力
AI 落地企业,最现实的问题往往不是 " 有没有模型 ",而是 " 用不起、用不好、管不住 "。
第一是成本问题。大模型推理需要大量算力,尤其是在用户量和调用量上来后,成本会迅速放大。对于 AI 应用公司来说,如果每次调用模型的成本太高,商业模式就很难成立。对于大型企业来说,如果内部大量业务都接入 AI,长期成本同样不可忽视。
第二是稳定性问题。企业客户不像个人用户,可以接受偶尔卡顿或失败。金融、能源、交通、政务、科研等场景,对系统稳定性、响应速度和安全合规要求更高。模型服务一旦不稳定,就会影响真实业务。
第三是算力利用率问题。很多企业、地方智算中心或云厂商拥有算力资源,但算力并不等于可直接变现的 AI 服务。不同芯片、不同集群、不同模型之间存在适配和调度难题。如果利用率不高,昂贵的算力资产就会闲置或回报偏低。
硅基流动试图解决的,就是这些问题。

硅基流动四大核心能力 来源:硅基流动
根据公司介绍,它自研了大模型推理引擎。可以支持 DeepSeek、Qwen、GLM、Kimi 等主流模型。也可以在英伟达、华为昇腾、沐曦、摩尔线程等不同芯片上运行。 这件事的价值,在于提高算力效率。也就是让同样的芯片跑出更多 Token。让企业用更低成本获得 AI 能力。 同时,硅基流动还在做异构算力纳管和调度。 所谓异构算力,就是不同品牌、不同架构、不同地点的算力资源。以前,这些算力很难统一管理。硅基流动希望通过软件系统,把分散的算力统一调度起来,再转化成标准化的 Token 服务。
这也是为什么本轮投资方里出现了能源、芯片、算力基础设施、云服务和应用场景企业。AI 基础设施不再是单点竞争,而是电力、算力、芯片、模型和应用之间的协同。
例如,晶科能源控股看重的是 " 光伏 + 储能 " 与智算中心之间的结合。AI 计算需要大量电力,如果未来 Token 消耗持续增长,低成本、绿色电力将成为智算中心的重要竞争力。
壁仞科技则更关注国产 AI 芯片与推理服务之间的适配。
金蝶股份看重的是企业管理软件场景,未来企业客户使用 AI 时,需要更低成本、更高效率的模型服务底座。
联通体系则关注 " 连接 + 算力 +AI 服务 " 的全栈能力。
硅基流动正在进入更复杂的产业链协同中。
AI 基础设施开始赚钱
硅基流动的发展节奏,也能看出 AI 基础设施公司从开发者市场走向企业市场的路径。
公司在 2023 年 8 月启动大模型推理引擎研发。2024 年 5 月,公有云 MaaS 上线,上架数十款主流开源模型,打通从底层算力到标准化 Token 服务的链路。这个阶段更像是把模型服务做成 " 货架 ",让开发者和企业可以更方便地调用。
2025 年 2 月,硅基流动基于华为昇腾上线 DeepSeek 推理服务,开始强调国产算力上的大规模 Token 生产能力。对中国 AI 产业来说,这一步有较强现实意义。随着 AI 算力需求快速增长,如何在国产芯片上稳定运行主流模型,成为许多企业和机构关心的问题。
2025 年 9 月,公司推出私有化 MaaS,面向拥有自有算力、同时对数据合规要求较高的国央企和金融机构。这个变化很关键。很多大型企业并不愿意把核心数据完全放到公有云环境里,也不希望重要业务完全依赖外部接口。因此,能否在企业私有环境里搭建专属模型服务平台,成为 AI 基础设施进入大客户市场的重要门槛。
到 2026 年 4 月,硅基流动上线新一代算力调度引擎 " 弹性 GPU",支持多元异构算力的弹性扩缩容,并支持客户自助式部署模型。这意味着,公司不仅在卖模型调用服务,也在帮助算力持有方提升资产利用效率。
这种商业模式可以从两个方向赚钱。一端是面向企业和开发者,按 Token 调用、模型服务、平台服务收费;另一端是面向智算中心、云厂商、大企业等算力持有方,帮助它们把 " 裸算力 " 变成可售卖、可调用、可管理的 AI 服务。
这也是 AI 基础设施行业正在出现的新机会:模型本身固然重要,但模型要真正进入千行百业,还需要大量中间层公司解决工程化、成本、稳定性、合规和调度问题。
硅基流动援引第三方数据称,其已进入中国第三方 MaaS 平台第一梯队。Gartner 相关市场指南将硅基流动列为代表性厂商;IDC 数据显示,硅基流动是中国公有云 MaaS 市场份额前四中唯一一家创业公司;OpenRouter 数据显示,在 70 余家 Token 供应商中,SiliconFlow 的日 Token 消耗量曾连续数周位居第一;Dify Marketplace 数据显示,SiliconFlow 插件安装量超过 55 万,在全球 100 余家 Token 供应商中排名前五。
MaaS 和 Token 供应正在从技术概念变成真实市场。过去,AI 公司讲故事时常说自己要做 " 应用 " 或 " 模型 "。现在,资本也开始关注一个更朴素的问题:当所有应用都要调用模型时,谁来提供稳定、便宜、可规模化的底层服务?
硅基流动本轮超 20 亿元融资,正是这一趋势的集中体现。


登录后才可以发布评论哦
打开小程序可以发布评论哦