融资101亿，英伟达投的AI独角兽，收入暴增2000%

作者 | 铅笔道黄小贵

编辑 | 铅笔道邹蔚

封面图 | ChatGPT 创作

AI 基础设施公司 Baseten，最近又融了 15 亿美元（约合人民币 101 亿元），估值达到 130 亿美元（约合人民币 882 亿元）。

Baseten 自己不训练大模型，而是帮企业把各种 AI 模型稳定、便宜、高效地运行起来。

短短 18 个月，Baseten 已经完成四轮融资，它宣称，过去一年其收入增长了 20 倍。多家媒体报道，今年一季度，它的年化收入达到 6 亿美元。

估值半年暴增 2.5 倍

Baseten 创立于 2019 年，总部位于旧金山。

创立时，Baseten 专注于研究机器学习，将机器用于反欺诈、识别滥用行为、处理用户生成内容。但头三年，收入 " 基本上为零 "。2022 年底，ChatGPT 问世，Baseten 决定转型帮助客户简化部署大语言模型的繁琐过程。

真正做 AI 应用的公司来说，不一定需要永远使用最强、最贵的闭源模型。它们需要的是：在不同场景下，用合适的模型，以可控成本、稳定速度，把产品跑起来。

比如，一个 AI 编程工具，可能在复杂代码生成时调用前沿模型，在简单补全、检索、分类、上下文整理上使用开源模型或自研模型。一个 AI 销售工具，也可能把不同任务拆开，让不同模型分别完成。

开源模型的能力正在提高。Llama、Qwen、DeepSeek 等模型让企业有了更多选择。但开源模型不是拿来就能直接服务亿级用户的商品。企业还要解决 GPU 在哪里、如何部署、如何优化吞吐、如何降低延迟、如何应对流量波动、如何监控故障、如何控制成本、如何保护数据等一整套问题。

Baseten 提供的，就是这套 " 把模型放进生产环境 " 的系统。它从多家云供应商采购算力，再通过自己的软件栈进行调度、优化和交付。对客户来说，不必自己到处抢 GPU，也不必重建一整套推理平台。

Baseten 服务的客户，很多都是快速增长的 AI 应用公司，包括 Abridge、Clay、Cursor、Lovable、Mercor、OpenEvidence 等。这些公司横跨医疗、销售、编程、招聘、企业软件等领域，但共同点是：它们的产品都高度依赖模型调用。

Baseten 部分客户

这门生意有点像云计算早期。

当互联网公司快速增长时，亚马逊云卖的不是某个网站，而是网站背后的服务器、存储、数据库和弹性计算。当移动互联网爆发时，云服务商吃到的是整个应用生态的红利。今天，AI 应用公司越多，模型调用越频繁，推理基础设施的需求就越大。

Baseten 想成为的，就是 AI 推理时代的基础设施层，这也是它估值快速飙升的根本原因。

今年 1 月，Baseten 刚宣布完成 3 亿美元融资，估值达到 50 亿美元。几个月后，新一轮融资把最高估值推到 130 亿美元。估值半年暴增 2.5 倍还多。

三大风险

Baseten 走红，还有一个更大的背景：AI 公司开始认真算账了。

推理不是一次性投入，而是持续消耗。一个 AI 产品越受欢迎，模型调用次数越多，成本可能越高。如果每一次调用都依赖最昂贵的闭源大模型，产品规模越大，亏损也可能越大。

这就逼迫 AI 应用公司寻找更灵活的模型策略，不是所有任务都需要最强模型。AI 应用能不能赚钱，很大程度取决于推理成本能不能被压下来。

当 AI 进入真实工作流，推理需求会变得极其庞大。推理优化不是模型公司单独能解决的问题，也不是普通云服务商天然擅长的问题。它需要介于模型、GPU、云厂商和应用之间的一层系统软件。这一层越复杂，越容易诞生新的基础设施公司。

Baseten 吃到的，就是这层红利。它让 AI 产品有机会变成一门正常生意。

然而，推理基础设施可能是 AI 行业最诱人、也最残酷的赛道之一。

第一个风险，是竞争。

Baseten 并不是唯一看到推理机会的公司。Fireworks AI、Together AI、Modal、Replicate、Groq、Cerebras，以及大型云厂商都在争夺这块市场。比如 Groq 2026 年 5 月被曝寻求最高 6.5 亿美元融资；Together AI 打算融资 10 亿美元，而它的估值也达到 75 亿美元。

第二个风险，是毛利率。

推理基础设施公司看上去像软件公司，但并不完全是软件公司。它背后需要大量 GPU 和云资源。算力成本、采购价格、利用率、客户定价，都会影响利润。

如果 GPU 长期紧缺，采购成本高，客户又不断要求降价，推理平台的毛利率就会承压。尤其当竞争加剧，大家都用低价争抢客户时，这门生意可能变成 " 高收入、低利润 " 的重资产服务。

这也是为什么推理优化能力如此关键。

同样一块 GPU，谁能服务更多请求、降低空闲时间、提升吞吐、减少延迟，谁才有更好的经济模型。推理基础设施不是简单转售算力，而是要通过软件效率把利润挤出来。

第三个风险，是技术变化太快。

AI 模型、芯片、编译器、推理框架、开源生态都在快速变化。今天最优的部署方式，几个月后可能就落后。

这对 Baseten 既是机会，也是压力。

机会在于，技术变化越快，客户越不愿意自己维护复杂基础设施，更愿意交给专业公司。压力在于，Baseten 自己必须始终跑在前面。一旦它的技术栈跟不上新模型、新芯片、新需求，客户可能迅速转向其他平台。

英伟达投了

Baseten 有个重要的股东：英伟达。2026 年 1 月，英伟达成为 Baseten E 轮融资的重要投资方（1.5 亿美元）。

这笔投资，似乎是被 DeepSeek" 逼 " 出来的。

2025 年初，DeepSeek 突然爆红。它给美国科技市场带来的冲击，不只是 " 中国也能做出强模型 "，而是另一件更敏感的事：原来强模型可以做得这么便宜。

这直接戳中了英伟达的神经。过去几年，英伟达最核心的故事是：AI 越来越强，所以需要越来越多 GPU。

但 DeepSeek 出现后，市场突然开始问一个问题：如果模型训练成本能大幅下降，如果更少的芯片也能做出接近一流的模型，那么英伟达还能继续高速增长吗？

这个问题一度让英伟达股价大跌。

但英伟达后来押注 Baseten，恰恰说明它看到了另一个方向：便宜模型不一定会减少算力需求，反而可能放大算力需求。

原因很简单。

当 AI 模型很贵，只有少数大公司能用。但当 DeepSeek 这样的模型把价格打下来，当开源模型越来越强，更多创业公司、中小企业、垂直行业都会开始使用 AI。

Baseten 提供的是 AI 推理基础设施，帮助企业把开源模型、自研模型、定制模型部署到生产环境中，并尽量提高速度、降低成本。

这时候，行业真正的瓶颈就变了，不再只是 " 谁能训练出最强模型 "，而是 " 谁能把成千上万个模型稳定、便宜、快速地跑起来 "。

Baseten 帮企业部署、调度 GPU、控制成本、降低延迟、处理高峰流量。大量公司会使用不同模型；大量模型需要在不同场景里运行；大量推理任务会持续消耗 GPU。

这时候，英伟达需要的不只是 OpenAI 和微软这样的大客户，也需要 Baseten 这样的基础设施公司，把更多开源模型、专用模型和企业模型带到英伟达 GPU 上运行。

英伟达投 Baseten，本质上是在给自己的下一阶段增长铺路。

宙世代

一起剪

相关标签