火山引擎,想做独属于 AI 时代的云。
12 月 18 日 -19 日,火山冬季原动力大会在上海召开,此次大会上,火山引擎正式发布了豆包大模型 1.8 版本,也将豆包图像创作模型 Seedream 更新至 4.5 版本,为用户们带来了更丰富的创作工具与更低门槛的 AI 应用落地方案。
不过,要说最被市场关注的,还得是火山引擎的 token 调用量。
而据火山引擎总裁谭待公布,截至今年 12 月,该模型的日均调用量已突破 50 万亿次,较去年同期增长超十倍,与发布初期相比更是实现了 417 倍的爆发式增长。

原动力大会
这也被市场认为是火山引擎良好 " 兑现 " 自己是云原生 AI 的最好例证。
不过,在大家都在为这张成绩单惊叹的背后,却也产生新的考量:呈几何倍数增长的 Token 消耗量,究竟能为火山引擎的报表贡献多少实实在在的营收?自我标榜为 AI 原生云的火山引擎,又能否利用 AI 跨过国内 SaaS 重人力的陷阱呢?
万亿 Token,到底能换回多少真金白银?
要理解火山引擎的野心,得先看清它的 " 出身 "。
在国内云市场的牌桌上,火山引擎是个 " 异类 "。它不同于阿里、腾讯这些背负着沉重 " 传统云 " 包袱的前辈,火山引擎几乎没有历史负担——它出生在移动互联网的黄昏,却刚好赶上了大模型的黎明。
这种 " 迟到 " 反而成了一种战略红利。因为没有老旧的数据中心架构需要兼容,火山引擎从第一天起就活得像个 AI 时代的特种兵:它不想做那种传统的、靠卖存储和带宽过日子的 " 包租公 ",它想做的是 MaaS(模型即服务)的绝对庄家。
这也是总裁谭待在各种场合反复布道的逻辑:火山引擎就是为 AI 而生的云,它的终极形态,就是卖模型调用,卖智能服务。
如今,市场确实买账了。50 万亿次的日均调用量,不仅是一个让同行侧目的天文数字,更像是火山引擎在 AI 云赛道上跑通了第一条 " 高速公路 "。但热闹归热闹,当烟花散去,理性的投资者和观察者终究会拿起计算器,算一笔最现实的账。
这 50 万亿 Token 的消耗,到底能给火山引擎带来多少营收?
我们可以从火山引擎今年披露的几组核心数据中,清晰地捕捉到这种近乎疯狂的扩张曲线。根据官方发布及市场公开数据,火山引擎豆包大模型的日均 Token 调用量呈现出了典型的指数型增长:
2024 年 12 月:日均调用量仅为 4 万亿次。
2025 年 4 月:迅速攀升至 12.7 万亿次。
2025 年 5 月:达到 16.4 万亿次。
2025 年 8 月:突破 25.9 万亿次。
2025 年 10 月:稳步增长至 30 万亿次。
2025 年 12 月:最终在原动力大会上宣布,日均调用量正式突破 50 万亿次。
而如果我们将这些点连接起来,并假设在统计区间内消耗量是平稳增长的,那么整个 2025 年,豆包大模型的 Token 消耗总量已经超过 9000 万亿,接近一万万亿。
但是,这看似庞大的数据,却没能转化为可观的收入,而其核心症结在于:Token 的单价实在是太低了。
为了在群雄逐鹿的云市场中撕开一道口子,火山引擎在过去一年几乎是以 " 自杀式 " 的降价策略在横扫市场。
去年 5 月,火山引擎在业内首先开打价格战,把豆包主力模型的推理输入价格降至 0.0008 元 / 千 tokens,较当时的行业价格下降了超过 99%,而在之后的一年时间里,也延续了 " 崩溃式 " 降价的逻辑。
这种推倒重来的定价逻辑,虽然让火山引擎在极短的时间内吸引了海量用户,但也意味着它必须面对一个极其残酷的现实:Token 已经从昂贵的 " 奢侈品 " 变成了廉价的 " 大宗商品 "。
那么,2025 年一万万亿 Token,到底为火山引擎带来了多少收入呢?我们以火山引擎目前官网的单价为基准,经计算,在综合了在线推理、在线推理 - 上下文缓存、批量推理的价格后,可得出每千 Token 的价格大约在 0.0009 元附近。
按照目前该单价计算,这 " 一万万亿 " 次的年度总调用量,理论上能为火山引擎撑起近百亿规模的营收空间。
然而,这 90 亿元绝非最终落袋的真金白银。
在市场推广的初期,为了跑马圈地,绝大多数的 Token 其实都是被 " 免费送出 " 的。在激烈的价格战和生态补贴下,真正产生扣费的付费流量比例极低。如果我们大胆假设收费 Token 仅占总量的 10%,那么火山引擎 2025 年实际的 MaaS 收入仅为 9 亿元左右。
和 MaaS 收入形成鲜明对比的是,2025 年火山引擎营收已经超过了 200 亿元(约为 240 亿至 250 亿左右)。
这意味着,尽管 Token 调用量在官方口径里显得气势磅礴,但在现阶段,火山引擎营收的压舱石依然是 IaaS、PaaS 和算力租赁业务,而非纯粹的 AI 调用。
这种 " 头重脚轻 " 的数据结构清晰地表明:AI 原生云的理想很丰满,但商业化的现实依然骨感。
所以,在即将到来的 2026 年,火山引擎必须要面对的一个问题是,当 Token 彻底沦为像电力一样的廉价基建后,如何能快速推动 Token 消耗继续指数级增长,通过规模效应来让 MaaS 成为真正的营收支柱,成为谭待向市场描绘的那个火山引擎?
当 Agent 遇上传统甲方,火山引擎也要派人驻场?
如果说卖 Token 是卖电力,那么火山引擎通过扣子(Coze)等平台力推的 Agent,就是想直接卖给客户一套 " 自动化工厂 "。
在谭待的蓝图里,理想的路径是极其轻盈的:火山引擎搭建好底座和工具,客户只需像搭积木一样,在平台上自行开发出适配业务的 Agent。这本质上是在重塑 SaaS 的交付逻辑,从过去的 " 厂商喂到嘴里 ",变成现在的 " 客户自给自足 "。
然而,在国内的商业土壤上,这种 " 轻盈 " 往往意味着某种巨大的挑战:你如何说服一个习惯了 " 看人头付费 " 的甲方,转而为一套看不见摸不着的算法逻辑买单?
国内 SaaS 行业过去十年跌过的最深的坑,就是 " 非重人力投入不付费 " 的怪圈。由于国内软件付费意愿长期处于低位,为数不多愿意掏钱的企业客户,往往信奉一种极其朴素的逻辑:我花了钱,就得看到你的人。
于是,我们看到无数标榜标准化的 SaaS 厂商,最后都活成了 " 装修外包队 "。
为了拿下一个大单,乙方往往要派出一支庞大的交付团队,背着电脑进驻甲方场地,陪着对方熬夜改代码、调接口。这种 " 人头攒动 " 带来的安全感,曾是国内 SaaS 能够成交的心理基石。
这种模式不仅重,而且极其低效。一旦进入项目制,原本边际成本递减的软件生意,就变成了边际成本恒定的体力活。火山引擎作为 " 后来者 ",深知如果跟着其他云厂去卷这种 " 人肉交付 ",不仅难以反超,更会让自己标榜的 "AI 原生 " 底色消失殆尽。
所以,火山引擎的策略是 " 工具化反击 "。它推出来的不仅是大模型,还有一整套 Agent 开发套件。它的潜台词是:别再找我们要几百个工程师了,给你们一个足够好用的工具,你们自己的员工就能搞定。
但这正是矛盾的焦点所在。习惯了 " 饭来张口 " 的甲方,很难在短时间内迅速适应这种从 " 买方案 " 到 " 学工具 " 的身份转变。对于大多数传统企业来说 AI 依然是个黑盒,Agent 的开发虽然门槛降低了,但 " 能跑通 " 和 " 能落地业务 " 之间,依然隔着万水千山。
更何况,Agent 作为一个新生事物,其稳定性、逻辑闭环以及对复杂商业场景的理解,正处于 " 半成品 " 向 " 成品 " 进化的阵痛期。想要让一个刚出炉的 Agent 达成过去由几十个程序员、产品经理手工打磨出来的 SaaS 软件水平,本身就是一件极难的事情。
当甲方发现自己折腾了半天出来的 Agent 还是 " 人工智障 " 时,他们最自然的反应依然是:火山引擎,你们能不能派点懂行的人来帮我调优一下?
这就产生了一个巨大的悖论:火山引擎越是想推行标准化、低门槛的 Agent,就越是发现,在实际落地的 " 最后一公里 ",依然需要大量专业人员进场去填平技术与业务之间的鸿沟。
而如果火山引擎不能在技术上实现真正的 " 类人级交付 ",或者不能培养出一个庞大的、能够替它分担体力活的第三方合作伙伴生态,那么它标榜的 AI 原生云,极有可能在向深水区迈进时,身不由己地重新掉入那个 " 为了赚一百块,得堆十个人 " 的重人力怪圈。
届时,支撑日均 500、5000 万亿调用量的,或许不再仅仅是后台同步跳动的服务器,还有台前无数疲惫奔波的交付工程师。这种 " 新瓶装旧酒 " 的局面,恐怕不是谭待想要向市场交出的最终答卷。
火山引擎想做 AI 时代的云,这确实是一个性感的愿景。但从 " 万亿 Token" 的狂欢转向 " 实打实利润 " 的深耕,这条路上的硬仗才刚刚开始。
当技术的神话遇上商业的常识,火山引擎需要证明的不仅是它的模型有多快,更是它对国内商业生态的耐力有多强。


登录后才可以发布评论哦
打开小程序可以发布评论哦