铅笔道 1小时前
融资101亿,英伟达投的AI独角兽,收入暴增2000%
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

作者 | 铅笔道 黄小贵

编辑 | 铅笔道 邹蔚

封面图 | ChatGPT 创作

AI 基础设施公司 Baseten,最近又融了 15 亿美元(约合人民币 101 亿元),估值达到 130 亿美元(约合人民币 882 亿元)。

Baseten 自己不训练大模型,而是帮企业把各种 AI 模型稳定、便宜、高效地运行起来。

短短 18 个月,Baseten 已经完成四轮融资,它宣称,过去一年其收入增长了 20 倍。多家媒体报道,今年一季度,它的年化收入达到 6 亿美元。

估值半年暴增 2.5 倍

Baseten 创立于 2019 年,总部位于旧金山。

创立时,Baseten 专注于研究机器学习,将机器用于反欺诈、识别滥用行为、处理用户生成内容。但头三年,收入 " 基本上为零 "。2022 年底,ChatGPT 问世,Baseten 决定转型帮助客户简化部署大语言模型的繁琐过程。

真正做 AI 应用的公司来说,不一定需要永远使用最强、最贵的闭源模型。它们需要的是:在不同场景下,用合适的模型,以可控成本、稳定速度,把产品跑起来。

比如,一个 AI 编程工具,可能在复杂代码生成时调用前沿模型,在简单补全、检索、分类、上下文整理上使用开源模型或自研模型。一个 AI 销售工具,也可能把不同任务拆开,让不同模型分别完成。

开源模型的能力正在提高。Llama、Qwen、DeepSeek 等模型让企业有了更多选择。但开源模型不是拿来就能直接服务亿级用户的商品。企业还要解决 GPU 在哪里、如何部署、如何优化吞吐、如何降低延迟、如何应对流量波动、如何监控故障、如何控制成本、如何保护数据等一整套问题。

Baseten 提供的,就是这套 " 把模型放进生产环境 " 的系统。它从多家云供应商采购算力,再通过自己的软件栈进行调度、优化和交付。对客户来说,不必自己到处抢 GPU,也不必重建一整套推理平台。

Baseten 服务的客户,很多都是快速增长的 AI 应用公司,包括 Abridge、Clay、Cursor、Lovable、Mercor、OpenEvidence 等。这些公司横跨医疗、销售、编程、招聘、企业软件等领域,但共同点是:它们的产品都高度依赖模型调用。

Baseten 部分客户

这门生意有点像云计算早期。

当互联网公司快速增长时,亚马逊云卖的不是某个网站,而是网站背后的服务器、存储、数据库和弹性计算。当移动互联网爆发时,云服务商吃到的是整个应用生态的红利。今天,AI 应用公司越多,模型调用越频繁,推理基础设施的需求就越大。

Baseten 想成为的,就是 AI 推理时代的基础设施层,这也是它估值快速飙升的根本原因。

今年 1 月,Baseten 刚宣布完成 3 亿美元融资,估值达到 50 亿美元。几个月后,新一轮融资把最高估值推到 130 亿美元。估值半年暴增 2.5 倍还多。

三大风险

Baseten 走红,还有一个更大的背景:AI 公司开始认真算账了。

推理不是一次性投入,而是持续消耗。一个 AI 产品越受欢迎,模型调用次数越多,成本可能越高。如果每一次调用都依赖最昂贵的闭源大模型,产品规模越大,亏损也可能越大。

这就逼迫 AI 应用公司寻找更灵活的模型策略,不是所有任务都需要最强模型。AI 应用能不能赚钱,很大程度取决于推理成本能不能被压下来。

当 AI 进入真实工作流,推理需求会变得极其庞大。推理优化不是模型公司单独能解决的问题,也不是普通云服务商天然擅长的问题。它需要介于模型、GPU、云厂商和应用之间的一层系统软件。这一层越复杂,越容易诞生新的基础设施公司。

Baseten 吃到的,就是这层红利。它让 AI 产品有机会变成一门正常生意。

然而,推理基础设施可能是 AI 行业最诱人、也最残酷的赛道之一。

第一个风险,是竞争。

Baseten 并不是唯一看到推理机会的公司。Fireworks AI、Together AI、Modal、Replicate、Groq、Cerebras,以及大型云厂商都在争夺这块市场。比如 Groq 2026 年 5 月被曝寻求最高 6.5 亿美元融资;Together AI 打算融资 10 亿美元,而它的估值也达到 75 亿美元。

第二个风险,是毛利率。

推理基础设施公司看上去像软件公司,但并不完全是软件公司。它背后需要大量 GPU 和云资源。算力成本、采购价格、利用率、客户定价,都会影响利润。

如果 GPU 长期紧缺,采购成本高,客户又不断要求降价,推理平台的毛利率就会承压。尤其当竞争加剧,大家都用低价争抢客户时,这门生意可能变成 " 高收入、低利润 " 的重资产服务。

这也是为什么推理优化能力如此关键。

同样一块 GPU,谁能服务更多请求、降低空闲时间、提升吞吐、减少延迟,谁才有更好的经济模型。推理基础设施不是简单转售算力,而是要通过软件效率把利润挤出来。

第三个风险,是技术变化太快。

AI 模型、芯片、编译器、推理框架、开源生态都在快速变化。今天最优的部署方式,几个月后可能就落后。

这对 Baseten 既是机会,也是压力。

机会在于,技术变化越快,客户越不愿意自己维护复杂基础设施,更愿意交给专业公司。压力在于,Baseten 自己必须始终跑在前面。一旦它的技术栈跟不上新模型、新芯片、新需求,客户可能迅速转向其他平台。

英伟达投了

Baseten 有个重要的股东:英伟达。2026 年 1 月,英伟达成为 Baseten E 轮融资的重要投资方(1.5 亿美元)。

这笔投资,似乎是被 DeepSeek" 逼 " 出来的。

2025 年初,DeepSeek 突然爆红。它给美国科技市场带来的冲击,不只是 " 中国也能做出强模型 ",而是另一件更敏感的事:原来强模型可以做得这么便宜。

这直接戳中了英伟达的神经。过去几年,英伟达最核心的故事是:AI 越来越强,所以需要越来越多 GPU。

但 DeepSeek 出现后,市场突然开始问一个问题:如果模型训练成本能大幅下降,如果更少的芯片也能做出接近一流的模型,那么英伟达还能继续高速增长吗?

这个问题一度让英伟达股价大跌。

但英伟达后来押注 Baseten,恰恰说明它看到了另一个方向:便宜模型不一定会减少算力需求,反而可能放大算力需求。

原因很简单。

当 AI 模型很贵,只有少数大公司能用。但当 DeepSeek 这样的模型把价格打下来,当开源模型越来越强,更多创业公司、中小企业、垂直行业都会开始使用 AI。

Baseten 提供的是 AI 推理基础设施,帮助企业把开源模型、自研模型、定制模型部署到生产环境中,并尽量提高速度、降低成本。

这时候,行业真正的瓶颈就变了,不再只是 " 谁能训练出最强模型 ",而是 " 谁能把成千上万个模型稳定、便宜、快速地跑起来 "。

Baseten 帮企业部署、调度 GPU、控制成本、降低延迟、处理高峰流量。大量公司会使用不同模型;大量模型需要在不同场景里运行;大量推理任务会持续消耗 GPU。

这时候,英伟达需要的不只是 OpenAI 和微软这样的大客户,也需要 Baseten 这样的基础设施公司,把更多开源模型、专用模型和企业模型带到英伟达 GPU 上运行。

英伟达投 Baseten,本质上是在给自己的下一阶段增长铺路。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 融资 开源 gpu 基础设施
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论