

作者 | 铅笔道 黄小贵
编辑 | 铅笔道 祝枝杉
封面图 | ChatGPT 创作
最新消息,AI 数据独角兽 Databricks 又在找钱了。
这一次,它想要的估值最高可能达到 1750 亿美元(约合人民币 1.26 万亿元)。
随着 SpaceX 上市,OpenAI、Anthropic 秘密递交招股书,Databricks 可能是最后一头在一级市场上活跃的巨型 AI 独角兽企业。
Databricks 是一家帮助企业管理数据的 AI 公司,2 月份刚融资 50 亿美元,目前估值 1340 亿美元(约合人民币 9648 亿元)。
让企业私有数据 " 值钱 "
Databricks 的故事,是从伯克利实验室里的一段代码开始的。
2013 年,几位来自加州大学伯克利 AMPLab 的研究人员创办了 Databricks。他们最核心的技术资产,是 Apache Spark,能让成百上千台服务器同时处理海量数据的软件引擎。

Apache Spark 与 Databricks 的关系 来源:公开资料
如果把数据比作矿石,Spark 就是挖矿机;Databricks 则是建了一整座现代化矿场。
互联网公司、银行、零售商、汽车公司每天都会产生海量数据。用户点击、交易记录、库存变化、传感器信号、日志文件、客户画像、广告投放结果,全都堆在系统里。问题是,数据越多,越难处理。Databricks 帮助企业挖掘数据的价值。
AI 爆发以后,这个位置突然变得极其重要。
因为大模型本身并不理解一家公司的具体业务。它不知道一家零售商今天哪个区域库存不足,也不知道一家银行哪些交易异常,更不知道一家车企哪批电池测试数据出了问题。模型要真正为企业工作,就必须接入企业内部数据。
但企业内部数据往往是混乱的。
有的数据在云上,有的数据在本地服务器。有的数据在数据仓库,有的数据在业务系统。有的数据是结构化表格,有的数据是客服录音、合同文本、图片和日志。更麻烦的是,不是所有数据都能随便给 AI 用。金融、医疗、制造、零售行业都有严格的权限、安全和合规要求。
这正是 Databricks 的机会。
它可以告诉企业:你不用把所有数据重新搬一遍,也不用从零搭建 AI 基础设施。你可以在一个统一平台上管理数据、训练模型、部署 AI 应用、建立治理规则,让 AI 真正用上公司自己的数据。
AI 时代最贵的东西,不一定是模型本身,而是模型和真实业务之间的连接层。Databricks 正在做的,就是这层连接。
年入 54 亿美元
Databricks 的赚钱方式,和传统软件公司不太一样。
传统软件更像卖许可证。企业买一套系统,按年付费,员工能用就行。Databricks 更像云计算公司。客户不是简单买一个软件账号,而是在它的平台上处理数据、训练模型、运行 AI 应用、调用计算资源。用得越多,账单越高。

Databricks 数据智能平台 来源:Databricks 官网
这也是 Databricks 最有吸引力的地方。
一家企业一开始可能只是用它做数据分析。比如,把销售、库存、订单、用户行为数据放到平台上,做报表、查趋势、预测需求。后来,企业开始训练机器学习模型。再后来,AI 时代到来,企业又想基于自己的内部数据开发 AI 助手、AI Agent、智能客服、风险控制系统。每增加一个场景,Databricks 的使用量都会增加。
所以,Databricks 卖的不是一次性软件,而是一套 " 企业数据和 AI 基础设施 "。
它的收入增长,有两个来源。
第一,是新客户增加。越来越多大企业要整理数据、建设 AI 能力,就会采购 Databricks。
第二,是老客户越用越多。这一点更关键。Databricks 披露的净收入留存率超过 140%,意思是同一批老客户去年花 100 美元,今年可能花到 140 美元以上。对投资人来说,这是非常漂亮的指标。因为它说明客户不是试用一下就停,而是越用越深、越用越贵。
这背后有很强的商业逻辑。
企业的数据一旦接入 Databricks,就不只是放了几张表进去,而是把数据管道、权限管理、分析模型、AI 应用开发流程都搭在上面。销售部门在用,财务部门在用,客服部门在用,研发部门也在用。随着数据越来越多,AI 应用越来越多,迁移成本也越来越高。
这就形成了很强的客户粘性。
投资人持续给 Databricks 高估值,一个重要原因是,它已经证明自己不仅会讲 AI 故事,而且真的赚到了钱。
公司披露,目前年收入规模已经超过 54 亿美元。更关键的是,很多客户第一次购买后,花的钱会越来越多。因为企业的数据、AI 模型和业务系统一旦接入 Databricks,后续会不断增加新的使用场景。
例如,一家零售企业最开始可能只是用它分析销售数据。后来开始训练 AI 模型、部署智能客服、开发 AI 助手,每增加一个新功能,就会产生更多费用。
这意味着 Databricks 不是靠不停寻找新客户赚钱,而是老客户自己就在不断增加支出。
目前,Databricks 年消费超过 100 万美元的客户已经超过 800 家,年消费超过 1000 万美元的客户超过 70 家。对于一家企业软件公司来说,这说明它已经进入了许多大公司的核心系统,而不只是一个可有可无的小工具。
这也是投资人最喜欢的商业模式:客户离不开,收入持续增长,而且随着 AI 普及,还有更大的增长空间。
做企业的 AI 大总管
过去,企业买 Databricks,主要是为了处理数据。
比如,一家零售公司想知道哪些门店卖得好,哪些商品库存积压,哪些客户可能流失。它可以把销售、库存、会员、物流数据放进 Databricks,再让数据团队做分析。
这还是传统数据平台的生意。
但 AI 出现后,Databricks 的目标变了。它不只想帮企业 " 看懂数据 ",还想帮企业 " 用 AI 调动数据 "。
" 看懂数据 ",主要是数据分析师、工程师、业务负责人在用。它解决的是报表、预测、分析问题。
" 用 AI 调动数据 ",则意味着每个普通员工都可以直接和公司数据对话。销售人员可以问:这个客户过去买过什么?客服人员可以问:这个用户的订单为什么延迟?财务人员可以问:哪些费用异常?供应链人员可以问:哪个仓库可能缺货?

Databricks 官网:Your data. Your AI. Your future. 来源:Databricks 官网
过去,这些问题要找数据团队写 SQL、拉报表、建看板。未来,Databricks 希望 AI 代理直接完成。
这就是它推出 Genie One、Agent Bricks 等产品的原因。Databricks 不是要做一个普通聊天机器人,而是要做一种能接入企业真实数据、理解业务语境、帮助员工做决策的 AI 助手。
换句话说,OpenAI、Anthropic 做的是通用大模型。Databricks 想做的是企业内部的 " 懂业务的 AI"。
大模型再强,如果不能接入企业内部数据,就只是一个外部工具。AI 代理再先进,如果没有权限管理、数据治理、成本控制和安全体系,也很难进入核心业务。Databricks 想把这些环节都包起来。变成企业 AI 的统一操作层。
它可以向上做 AI 助手,让员工直接和公司数据对话。
它可以向下做数据库,把业务系统和 AI 系统连接起来。
它可以横向进入营销、安全、客服、开发者工具等场景。
它还可以做 AI 成本管理。随着企业大量使用 AI 代理,账单会变得越来越难预测。一个员工、一个代理、一个自动化流程,都可能在后台不断调用模型,最后产生巨额费用。Databricks 推出 AI 支出控制工具,本质上也是想成为企业 AI 预算的 " 总闸门 "。
这很像云计算早期。一开始,企业只是把服务器搬到云上。后来,云厂商不只卖服务器,还卖数据库、数据仓库、AI 服务、安全服务、开发工具、成本管理工具。客户用得越多,越难离开。
Databricks 也想走这条路。


