Kimi、智谱背后的“隐形冠军”藏不住了！AI Infra抢跑者开始重写资本坐标

随着大模型进入工程化与规模化阶段，越来越多资本开始关注底层基础设施能力。

硅星人获悉，5 月 7 日，人工智能基础设施企业无问芯穹宣布此前已再获超 7 亿元融资。本轮融资中，联合领投方为杭州高新金投集团和惠远资本，跟投方包括国兴资本、秦淮数据、广发乾和、力合清瞳、中保投资、AEF NextGen、腾瑞资本、卡莱特、中信建投资本和宽德智能学习实验室 ( Will ) ，老股东君联资本、上海国投孚腾和元智未来追加投资。

无问芯穹于 2023 年 5 月由清华大学电子工程系推动成立，创始成员来自清华大学、上海交通大学、阿里云与旷视科技等顶尖高校与 AI 企业。

在无问芯穹成立的三年中，全球 AI 行业经历了 " 百模大战 "、推理模型爆发、智能体兴起等多个阶段，而随着模型快速迭代，如何更高效地生产和利用 token，逐渐成为行业关注的核心问题之一。

01 模型运行效率与系统能力成为新焦点

当外界讨论 " 中国大模型性能 " 时，注意力往往集中在模型本身，比如 Kimi K2.6 的 Agent Swarm 智能体集群协作与超长程工程能力，智谱 GLM-5.1 在 AutoGLM 端到端自主操作以及 8 小时长程任务执行上的突破。

但在这些头部模型背后，支撑其高效运转的基础设施层，其实都有无问芯穹的身影。

2026 年 3 月，在中关村论坛上，无问芯穹联合创始人兼 CEO 夏立雪与月之暗面创始人杨植麟、智谱 CEO 张鹏同台对话时，首次公开提到：无问芯穹已经成为 Kimi、智谱等众多头部大模型企业的核心基础设施与 Token 服务商。

大模型竞争演进至今，已不再局限于模型能力强弱的比拼，模型运行效率与系统承载能力的较量同样重要。

对于 Kimi、智谱这类头部模型公司来说，真正昂贵的并不只是训练，而是持续不断的推理成本。用户每一次提问、生成回答或调用 Agent，本质上都在消耗 GPU 算力和 Token 资源。随着调用量暴涨，推理系统会迅速变成一个极其复杂的工程问题。

理论上，这些公司当然可以全部自建。但现实是，自建意味着巨额 GPU 投入、数据中心建设、算力调度、系统优化，以及长期运维成本。相比之下，如果有一家能够提供更低成本、更高效率的基础设施平台，很多模型公司更愿意把这部分能力外包。

这也是无问芯穹切入的位置。它并不直接参与最强模型的竞争，而是成为这些模型背后的基础设施支撑者。

02 大模型时代的 "Token 工厂 "

在某种程度上，AI Infra 像大模型时代的 "Token 工厂 "。用户在使用 AI 产品写代码、做分析、调用 Agent 完成任务时，背后会涉及到大量 Token 的生产、推理资源的调度，以及不同芯片之间的适配，这些都是无问芯穹在做的工作。

而这类基础设施的价值，会随着 AI 使用量增长被不断放大。

夏立雪曾提到，当 Kimi、智谱等头部模型调用量出现几十倍增长时，无问芯穹作为其 Token 服务商，也同步实现了几十倍增长。在当下这个阶段，AI Infra 企业已经深度嵌入中国头部 AI 公司的生产链路之中。

在中国 AI 行业中，算力环境本身就极其复杂。不同公司使用不同 GPU，不同芯片之间的软件栈、编译框架、通信协议并不统一。很多模型虽然训练出来了，却未必能在不同硬件环境中高效稳定运行。

比如在英伟达 GPU 上完成训练与优化的大模型，在迁移到国产推理芯片时，常常会遇到算子不兼容、显存调度方式不同等问题，需要重新做算子适配与推理图优化，否则在实际部署中可能出现吞吐下降、延迟上升，甚至无法稳定服务请求的情况。

无问芯穹的核心价值之一，就是在不同芯片与算力环境之间建立统一的 " 运行层 "，通过底层调度与优化能力，让大模型能够在异构算力上以接近一致的方式稳定运行与高效推理。

目前，无问芯穹的 Agentic MaaS 大模型服务平台已经对 GLM、Kimi、DeepSeek、通义千问、MiniMax 等国产主流模型进行了高性能服务优化，精度对齐率超过 99.9%，吞吐量提升 2-3 倍，时延缩减 50%，首字延迟低于 500ms，企业级高可用性达到 99.95%。

这些技术层面的参数，会体现在非常具体的系统体验与业务能力上——响应速度是否足够及时，系统在高并发情况下是否稳定，峰值流量下是否仍可持续服务，以及企业级场景中能否可靠完成模型的规模化部署与落地应用。

03 AI 基础设施进入 " 跨圈层共识 " 阶段

本轮融资中，无问芯穹再获超 7 亿元融资，累计融资规模超过 22 亿元，持续位居中国 AI 原生基础设施赛道前列。但相比数字本身，更具信号意义的是本轮投资方结构的显著外扩。

从资方构成来看，对 AGI 基础设施核心价值的认同，正在从科技投资圈，扩展至更广泛的产业与战略资本体系之中。

从资方构成来看，这一轮融资呈现出三个层面的结构性变化。

第一类是政策与产业导向资本的进入。以杭州高新金投集团、惠远资本为代表的政府产业资本参与，使这一轮融资带有明显的区域产业战略属性。其关注重点不只是企业成长性，而是将 AGI 基础设施视为数字经济底座能力的一部分，从 " 支持科技企业 " 转向 " 配置基础设施能力 "。

第二类是国家级资本的参与。中保投资等国家队资金的进入，让这一轮融资具备更强的长期属性，其核心逻辑更接近基础设施级别的配置判断，即围绕技术自主可控与长期系统能力进行布局，而非短期商业回报。

第三类是产业侧与应用侧资本的跨界进入。秦淮数据等数据中心运营商的参与，反映出上游算力基础设施正在从 " 资源供给方 " 向 "AI 系统协同方 " 演进，其投资逻辑不再只是机柜、电力与带宽，而是希望通过与 AI Infra 层协同提升整体算力利用效率。

与此同时，卡莱特、量化基金等制造业与金融资本的进入，则意味着实体产业与金融体系开始以更直接方式参与 Token 经济，一方面作为投资者，另一方面也可能成为实际使用者。

04 Token 经济时代，无问芯穹想做什么

截至 2026 年 4 月底，无问芯穹 Agentic MaaS 平台的日均 Token 调用量，相较 2025 年底增长超过 20 倍。这一增长并不是线性扩张，而是一种基础设施级应用的指数级放大。

夏立雪在中关村论坛上提到，" 上一次看到这样的增速，还是 3G 时代移动互联网流量爆发的时候。"Token 正在成为类似 " 流量 " 的基础资源单位，其增长曲线本身就代表着 AI 使用方式的结构性变化。

从行业整体来看，这一趋势并非孤立现象。根据国家统计局相关数据，截至 2026 年 3 月，全国日均 Token 调用量已突破 140 万亿，较上年末增长超过 40%。在这一背景下，无问芯穹平台 20 倍的增长幅度，意味着其并非简单跟随行业扩张，而是在头部模型调用与企业级场景中形成了更高密度的承载与聚集效应。

而支撑这一增长的，并不只是流量本身的扩张，也是底层技术体系的同步演进。本轮融资所指向的三大技术方向，实际上构成了其增长背后的基础支撑结构。

首先，是多元异构算力体系的持续强化，通过技术极致优化的可用算力规模，在 Token 经济时代实现更高利用率的资源供给；

其次，是软硬件协同能力的进一步深化，通过优化推理链路与系统调度机制，加快从 " 电能到 Token" 的转化效率，即在相同物理资源下生成更多有效 Token 输出；

再次，是面向应用层的基础设施升级，通过企业级智能体服务平台，将模型能力嵌入不同行业场景，使 Token 不再只是计算结果，而是进入业务流程本身，完成从 "Token 到生产力 " 的转化。

这三条路径分别对应算力供给、运行效率与应用转化三个层面，共同指向同一个目标：在更大规模 Token 调用增长的背景下，持续提升 AI 基础设施的整体运行效率。

可以看到，Token 正在从 " 模型输出单位 " 逐步演化为支撑产业系统运行的基础资源，而基础设施能力则成为影响其规模化效率的关键变量。

当 Token 进一步成为基础资源单元，资源调配与系统运行效率开始直接决定 AI 能力的实际边界。融资、增长与技术路线在此交汇，所指向的并不是单一公司的阶段性扩张，而是一个更清晰的行业趋势—— AI 基础设施正从支撑性角色，转向决定 AI 规模化能力的核心底座。

在这一意义上，无问芯穹的角色也不再仅是基础设施公司，而是在持续扩张的 Token 经济体系中，成为一个被不断放大的运行枢纽。

宙世代

一起剪

相关标签