叫嚣完DAU，豆包千问元宝该着急了

The following article is from 壹番 YIFAN Author 壹叔团队

文｜HAL

春节期间，千问、豆包、元宝几乎同时进入高强度竞争阶段。春晚、红包、补贴、热搜、联动活动密集出现，AI 应用被推成了一场节日流量事件。

这些日活数字很亮眼，但数字本身并不能说明问题。节日期间用户更愿意尝鲜、分享和传播，很多增长来自情绪和激励，而不是长期需求。

真正的考验发生在节后——当用户回到日常生活与工作流时，AI 是否还会被持续使用。

根据 QuestMobile 统计，豆包、千问、元宝在春节营销的猛烈进击之下，纷纷达到了自身的日活峰值，其中千问在某一日几乎接近于豆包，而豆包的春晚效应则一骑绝尘，但是，" 撒币 " 效应结束之后，三家回落趋势明显。

图源：QuestMobile

与此同时，随着春节大战结束，AI 应用制造的更大关注，居然在于向用户道歉，亦或者核心管理团队离职，这无疑让市场感到疑惑：不顾一切撒币冲刺日活之后，它们真的想好了接下来该怎么走吗？

下一个赛段的问题，其实不是留存率本身，而是留存背后的结构。

其中最先显露出来的是成本问题。

如果每一次对话都需要高成本算力支撑，规模越大亏损越大。谁能把单位推理成本持续压低，谁才有资格谈长期增长。

接下来会拉开差距的是场景构建。

对国内市场而言，或许独立的 AI chatbot 竞争很难成为终局。真正稳定的使用频率，可能反而会来自真实工作流——办公、搜索、社交、电商、客服等系统入口。

国内部分 AI chatbot

而新的变量正在出现在终端形态上。

春节刚过，千问就开始推动独立的 AI 硬件，也带出了一个明显信号：AI 竞争正在从应用层走向终端层。语音、视觉、多模态设备，可能成为新的默认入口。

换句话说：春节解决其实还是认知度问题。

下一阶段各家既要比拼 Token 成本，也要尽快找到一个无可替代的使用场景，而布局次世代的 AI 硬件已经不能再停留在纸面上。

Token 成本曲线，谁先把 " 量大管饱 " 做成护城河

春节的短期活跃增长可以用补贴换来，但补贴买不到长期优势。

AI 应用的规模化，本质上受制于单位推理成本：每一次生成、每一次多轮对话、每一次多模态理解，背后都是算力、带宽、电力与调度成本。

最近一波围绕 OpenClaw 等框架掀起的 " 自建 AI 代理 " 潮，也把这个问题迅速放大。

越来越多公司和开发者开始搭建自己的 Agent、自动化流程和多步推理系统，AI 不再只是一次对话，而是连续调用、长链路执行。

图源：unsplash

这种变化直接体现在 Token 使用量上。

一些开发者平台统计显示，2026 年初全球 AI 推理 Token 使用量在短短一个月内从约 6.4 万亿 / 周增长到 13 万亿 / 周，几乎翻倍，其中很大一部分增长来自 Agent 系统的自动调用。

与此同时，Token 消耗不再是线性增长，而是随着任务复杂度呈指数放大。

这意味着，成本问题正在从 " 单次对话成本 " 变成 " 系统级调用成本 "。如果每一步都依赖高成本模型，AI 代理越复杂，费用增长越快。

过去一年行业最容易犯的错，是把 " 模型更强 " 当作唯一方向，把 " 参数更大 " 当作唯一指标，却忽略了一个更现实的问题：当调用规模扩大十倍，成本也会按比例扩大吗？如果答案是 " 会 "，那增长就变成了财务压力测试。

图源：IDC 咨询

下一个赛段，谁能把 Token 成本曲线做得更陡、更快下降，谁就拥有更大的战略空间。

所谓 Token 成本曲线，至少包含三层——

其一是推理侧优化，能否通过量化、蒸馏、编译加速、KV 缓存、并行策略等手段，把同样质量的输出做得更省；

其二是模型路由能力，能否在不同任务中自动选择 " 足够好 " 的轻量模型，而不是每次都用最高配；

其三是算力与供应链的组织能力，能否在自有算力、云算力、国产芯片适配、跨地域调度之间找到最优解。

当然单纯是这条曲线对千问、豆包、元宝三家的意义也各不相同。

图源：网络

千问背靠阿里云与电商体系，理论上更容易把算力与业务结合起来做 " 规模采购 + 分级调用 "，把成本控制转化为平台优势；

豆包依托字节的内容与分发体系，优势在于训练数据与场景丰富，但也意味着调用频率会更高、更碎片化，对成本优化的要求更苛刻；

元宝处在腾讯生态里，天然靠近社交与内容，但社交场景对延迟、稳定性和安全合规更敏感，成本优化必须和体验、风控同步推进。

Token 成本曲线之所以会很快成为竞争瓶颈，是因为它决定了竞争方式：当成本足够低，你可以用更激进的定价策略去扩张；当成本不够低，你只能依赖补贴或 " 限制功能 " 去控制消耗，最终把用户体验做窄。

像是元宝即便如今还需要频繁切换 deepseek 去代替自己的浑元大模型，背后显然也是算力瓶颈的问题。

元宝 APP 截图

或是像一时火爆的 seedance 2.0，如今即便是付费用户动辄也要排队几个小时才能完成一次生成，这其实也都是过高的算力成本之下，平台试图平衡成本的无奈之举。

更好的 Token 成本曲线会决定 "AI 是否能从 C 端走向 B 端与交易链条 "。企业客户不会为一次好玩的对话付费，但会为可预期的效率提升付费。前提是价格透明、质量稳定。

在这个意义上，下一赛段的核心其实与 DAU、MAU 这些传统的互联网产品指标无关，核心还是更小的单位成本以及 TPD（每日 Token 消耗量）。

从场景到入口，软硬一体或成默认能力

春节之后，各家的 AI 应用竞争会越来越像 " 阶段性战役 "：榜单可以冲，DAU 可以拉，但它很难成为终局。

真正的战场其实更多在于场景—— AI 能否嵌进用户已经每天在用的路径里，成为默认的底层能力。

这就是为什么 " 场景嵌入度 " 甚至比 " 留存率 " 更关键，即便用户没有打开这个应用，但其日常使用中依然能够调用到其模型能力。

图源：unsplash

场景嵌入通常有三种层级。

第一层是工具层，把 AI 当作写作、翻译、总结、检索的初级工具；

第二层是流程层，把 AI 放进办公套件、客服系统、内容生产链条，让它参与决策与协作；

第三层是交易与执行层，让 AI 不止回答，还能直接调用服务、完成下单、预约、支付、售后。

而硬件在这里的作用，是把入口从众多应用的选项变成终端 " 默认 "。

千问近期发力 AI 硬件，背后的逻辑并不复杂：手机屏幕里的 AI 入口太拥挤，分发权被操作系统、超级应用与内容平台层层分割；而可穿戴设备、耳机、眼镜等终端，可能提供一种更自然的交互方式——语音唤起、随手拍摄、实时翻译、导航与信息提示。

千问 AI 眼镜 G1

这些场景一旦成立，用户就不需要 " 打开某一 AI 产品 "，AI 会在场景里自动出现。

但硬件不是只要做出来就能赢。

它会把竞争推向物理层面——

一是本地化能力，设备要 " 随时可用 "，就必须依赖一定程度的端侧推理与低延迟架构；

第二是服务编排能力；

第三是长期运营能力，硬件一旦出货，就进入了供应链、售后、系统更新、隐私安全与合规的长周期战场，远比软件更重。

对豆包和元宝来说，做硬件宜早不宜迟，毕竟去年豆包手机已经遭遇过一波激烈抵抗。对字节而言，大量传说中的硬件如今也有更好的理由端出来了。

豆包手机助手

除了成本、场景与硬件入口之外，AI 产业还有一个更直接的变量：人才竞争。

就在 3 月 4 日凌晨，千问团队核心技术负责人林俊旸宣布离职，而同时期团队中多位关键研究人员也相继离开。

当然，" 一号位 " 的变动在 AI 行业并不罕见，但在大模型竞争进入关键阶段时，它的象征意义被明显放大。

大模型毕竟不是传统意义上的工程流水线。真正决定模型能力的，除了几万张 GPU，还有便是几十到几百名核心研究员——他们负责模型架构、训练策略、推理优化和数据体系。

图源：X

一个核心研究员的离开，往往意味着整条技术路径的调整甚至迁移。

因此，AI 公司之间的竞争表面上看是产品战、算力战和入口战，但底层其实是一场持续的人才密度竞争。

这也是为什么最近几年国内 AI 公司之间的挖角频繁发生。从阿里到字节、从腾讯到创业公司，顶级研究员的流动几乎都伴随着团队迁移与技术路线变化。

当模型能力逐渐趋同、开源生态不断扩大之后，真正能够拉开差距的，往往不是参数规模，而是研究团队的稳定性与创新能力。

最终，这一赛段拼的，不再只是春节式的峰值增长，而是三种能力能否同时成立：

Token 成本曲线持续下降、AI 能力深入真实场景、终端入口形成软硬协同，同时还能维持足够高的人才密度。

只有同时满足这几条条件，AI 产品才可能从 " 节日里的热点应用 " 变成长期存在的基础设施。

2026 年的春节只是开场，长期的泥沼战还会持续下去。

Recommend

推荐阅读

微信公众号近日更改推送机制

推文不再按照时间线显示

将壹娱观察设置星标、多点在看

这样就不会错过推送

INYOUMEDIA 相关账号

宙世代

一起剪

相关标签