9600亿AI独角兽，又要融资了

作者 | 铅笔道黄小贵

编辑 | 铅笔道祝枝杉

封面图 | ChatGPT 创作

最新消息，AI 数据独角兽 Databricks 又在找钱了。

这一次，它想要的估值最高可能达到 1750 亿美元（约合人民币 1.26 万亿元）。

随着 SpaceX 上市，OpenAI、Anthropic 秘密递交招股书，Databricks 可能是最后一头在一级市场上活跃的巨型 AI 独角兽企业。

Databricks 是一家帮助企业管理数据的 AI 公司，2 月份刚融资 50 亿美元，目前估值 1340 亿美元（约合人民币 9648 亿元）。

让企业私有数据 " 值钱 "

Databricks 的故事，是从伯克利实验室里的一段代码开始的。

2013 年，几位来自加州大学伯克利 AMPLab 的研究人员创办了 Databricks。他们最核心的技术资产，是 Apache Spark，能让成百上千台服务器同时处理海量数据的软件引擎。

Apache Spark 与 Databricks 的关系来源：公开资料

如果把数据比作矿石，Spark 就是挖矿机；Databricks 则是建了一整座现代化矿场。

互联网公司、银行、零售商、汽车公司每天都会产生海量数据。用户点击、交易记录、库存变化、传感器信号、日志文件、客户画像、广告投放结果，全都堆在系统里。问题是，数据越多，越难处理。Databricks 帮助企业挖掘数据的价值。

AI 爆发以后，这个位置突然变得极其重要。

因为大模型本身并不理解一家公司的具体业务。它不知道一家零售商今天哪个区域库存不足，也不知道一家银行哪些交易异常，更不知道一家车企哪批电池测试数据出了问题。模型要真正为企业工作，就必须接入企业内部数据。

但企业内部数据往往是混乱的。

有的数据在云上，有的数据在本地服务器。有的数据在数据仓库，有的数据在业务系统。有的数据是结构化表格，有的数据是客服录音、合同文本、图片和日志。更麻烦的是，不是所有数据都能随便给 AI 用。金融、医疗、制造、零售行业都有严格的权限、安全和合规要求。

这正是 Databricks 的机会。

它可以告诉企业：你不用把所有数据重新搬一遍，也不用从零搭建 AI 基础设施。你可以在一个统一平台上管理数据、训练模型、部署 AI 应用、建立治理规则，让 AI 真正用上公司自己的数据。

AI 时代最贵的东西，不一定是模型本身，而是模型和真实业务之间的连接层。Databricks 正在做的，就是这层连接。

年入 54 亿美元

Databricks 的赚钱方式，和传统软件公司不太一样。

传统软件更像卖许可证。企业买一套系统，按年付费，员工能用就行。Databricks 更像云计算公司。客户不是简单买一个软件账号，而是在它的平台上处理数据、训练模型、运行 AI 应用、调用计算资源。用得越多，账单越高。

Databricks 数据智能平台来源：Databricks 官网

这也是 Databricks 最有吸引力的地方。

一家企业一开始可能只是用它做数据分析。比如，把销售、库存、订单、用户行为数据放到平台上，做报表、查趋势、预测需求。后来，企业开始训练机器学习模型。再后来，AI 时代到来，企业又想基于自己的内部数据开发 AI 助手、AI Agent、智能客服、风险控制系统。每增加一个场景，Databricks 的使用量都会增加。

所以，Databricks 卖的不是一次性软件，而是一套 " 企业数据和 AI 基础设施 "。

它的收入增长，有两个来源。

第一，是新客户增加。越来越多大企业要整理数据、建设 AI 能力，就会采购 Databricks。

第二，是老客户越用越多。这一点更关键。Databricks 披露的净收入留存率超过 140%，意思是同一批老客户去年花 100 美元，今年可能花到 140 美元以上。对投资人来说，这是非常漂亮的指标。因为它说明客户不是试用一下就停，而是越用越深、越用越贵。

这背后有很强的商业逻辑。

企业的数据一旦接入 Databricks，就不只是放了几张表进去，而是把数据管道、权限管理、分析模型、AI 应用开发流程都搭在上面。销售部门在用，财务部门在用，客服部门在用，研发部门也在用。随着数据越来越多，AI 应用越来越多，迁移成本也越来越高。

这就形成了很强的客户粘性。

投资人持续给 Databricks 高估值，一个重要原因是，它已经证明自己不仅会讲 AI 故事，而且真的赚到了钱。

公司披露，目前年收入规模已经超过 54 亿美元。更关键的是，很多客户第一次购买后，花的钱会越来越多。因为企业的数据、AI 模型和业务系统一旦接入 Databricks，后续会不断增加新的使用场景。

例如，一家零售企业最开始可能只是用它分析销售数据。后来开始训练 AI 模型、部署智能客服、开发 AI 助手，每增加一个新功能，就会产生更多费用。

这意味着 Databricks 不是靠不停寻找新客户赚钱，而是老客户自己就在不断增加支出。

目前，Databricks 年消费超过 100 万美元的客户已经超过 800 家，年消费超过 1000 万美元的客户超过 70 家。对于一家企业软件公司来说，这说明它已经进入了许多大公司的核心系统，而不只是一个可有可无的小工具。

这也是投资人最喜欢的商业模式：客户离不开，收入持续增长，而且随着 AI 普及，还有更大的增长空间。

做企业的 AI 大总管

过去，企业买 Databricks，主要是为了处理数据。

比如，一家零售公司想知道哪些门店卖得好，哪些商品库存积压，哪些客户可能流失。它可以把销售、库存、会员、物流数据放进 Databricks，再让数据团队做分析。

这还是传统数据平台的生意。

但 AI 出现后，Databricks 的目标变了。它不只想帮企业 " 看懂数据 "，还想帮企业 " 用 AI 调动数据 "。

" 看懂数据 "，主要是数据分析师、工程师、业务负责人在用。它解决的是报表、预测、分析问题。

" 用 AI 调动数据 "，则意味着每个普通员工都可以直接和公司数据对话。销售人员可以问：这个客户过去买过什么？客服人员可以问：这个用户的订单为什么延迟？财务人员可以问：哪些费用异常？供应链人员可以问：哪个仓库可能缺货？

Databricks 官网：Your data. Your AI. Your future. 来源：Databricks 官网

过去，这些问题要找数据团队写 SQL、拉报表、建看板。未来，Databricks 希望 AI 代理直接完成。

这就是它推出 Genie One、Agent Bricks 等产品的原因。Databricks 不是要做一个普通聊天机器人，而是要做一种能接入企业真实数据、理解业务语境、帮助员工做决策的 AI 助手。

换句话说，OpenAI、Anthropic 做的是通用大模型。Databricks 想做的是企业内部的 " 懂业务的 AI"。

大模型再强，如果不能接入企业内部数据，就只是一个外部工具。AI 代理再先进，如果没有权限管理、数据治理、成本控制和安全体系，也很难进入核心业务。Databricks 想把这些环节都包起来。变成企业 AI 的统一操作层。

它可以向上做 AI 助手，让员工直接和公司数据对话。

它可以向下做数据库，把业务系统和 AI 系统连接起来。

它可以横向进入营销、安全、客服、开发者工具等场景。

它还可以做 AI 成本管理。随着企业大量使用 AI 代理，账单会变得越来越难预测。一个员工、一个代理、一个自动化流程，都可能在后台不断调用模型，最后产生巨额费用。Databricks 推出 AI 支出控制工具，本质上也是想成为企业 AI 预算的 " 总闸门 "。

这很像云计算早期。一开始，企业只是把服务器搬到云上。后来，云厂商不只卖服务器，还卖数据库、数据仓库、AI 服务、安全服务、开发工具、成本管理工具。客户用得越多，越难离开。

Databricks 也想走这条路。