壹娱观察 03-04
叫嚣完DAU,豆包千问元宝该着急了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

The following article is from 壹番 YIFAN Author 壹叔团队

文|HAL

春节期间,千问、豆包、元宝几乎同时进入高强度竞争阶段。春晚、红包、补贴、热搜、联动活动密集出现,AI 应用被推成了一场节日流量事件。

这些日活数字很亮眼,但数字本身并不能说明问题。节日期间用户更愿意尝鲜、分享和传播,很多增长来自情绪和激励,而不是长期需求。

真正的考验发生在节后——当用户回到日常生活与工作流时,AI 是否还会被持续使用。

根据 QuestMobile 统计,豆包、千问、元宝在春节营销的猛烈进击之下,纷纷达到了自身的日活峰值,其中千问在某一日几乎接近于豆包,而豆包的春晚效应则一骑绝尘,但是," 撒币 " 效应结束之后,三家回落趋势明显。

图源:QuestMobile

与此同时,随着春节大战结束,AI 应用制造的更大关注,居然在于向用户道歉,亦或者核心管理团队离职,这无疑让市场感到疑惑:不顾一切撒币冲刺日活之后,它们真的想好了接下来该怎么走吗?

下一个赛段的问题,其实不是留存率本身,而是留存背后的结构。

其中最先显露出来的是成本问题。

如果每一次对话都需要高成本算力支撑,规模越大亏损越大。谁能把单位推理成本持续压低,谁才有资格谈长期增长。

接下来会拉开差距的是场景构建。

对国内市场而言,或许独立的 AI chatbot 竞争很难成为终局。真正稳定的使用频率,可能反而会来自真实工作流——办公、搜索、社交、电商、客服等系统入口。

国内部分 AI chatbot

而新的变量正在出现在终端形态上。

春节刚过,千问就开始推动独立的 AI 硬件,也带出了一个明显信号:AI 竞争正在从应用层走向终端层。语音、视觉、多模态设备,可能成为新的默认入口。

换句话说:春节解决其实还是认知度问题。

下一阶段各家既要比拼 Token 成本,也要尽快找到一个无可替代的使用场景,而布局次世代的 AI 硬件已经不能再停留在纸面上。

Token 成本曲线,谁先把 " 量大管饱 " 做成护城河

春节的短期活跃增长可以用补贴换来,但补贴买不到长期优势。

AI 应用的规模化,本质上受制于单位推理成本:每一次生成、每一次多轮对话、每一次多模态理解,背后都是算力、带宽、电力与调度成本。

最近一波围绕 OpenClaw 等框架掀起的 " 自建 AI 代理 " 潮,也把这个问题迅速放大。

越来越多公司和开发者开始搭建自己的 Agent、自动化流程和多步推理系统,AI 不再只是一次对话,而是连续调用、长链路执行。

图源:unsplash

这种变化直接体现在 Token 使用量上。

一些开发者平台统计显示,2026 年初全球 AI 推理 Token 使用量在短短一个月内从约 6.4 万亿 / 周增长到 13 万亿 / 周,几乎翻倍,其中很大一部分增长来自 Agent 系统的自动调用。

与此同时,Token 消耗不再是线性增长,而是随着任务复杂度呈指数放大。

这意味着,成本问题正在从 " 单次对话成本 " 变成 " 系统级调用成本 "。如果每一步都依赖高成本模型,AI 代理越复杂,费用增长越快。

过去一年行业最容易犯的错,是把 " 模型更强 " 当作唯一方向,把 " 参数更大 " 当作唯一指标,却忽略了一个更现实的问题:当调用规模扩大十倍,成本也会按比例扩大吗?如果答案是 " 会 ",那增长就变成了财务压力测试。

图源:IDC 咨询

下一个赛段,谁能把 Token 成本曲线做得更陡、更快下降,谁就拥有更大的战略空间。

所谓 Token 成本曲线,至少包含三层——

其一是推理侧优化,能否通过量化、蒸馏、编译加速、KV 缓存、并行策略等手段,把同样质量的输出做得更省;

其二是模型路由能力,能否在不同任务中自动选择 " 足够好 " 的轻量模型,而不是每次都用最高配;

其三是算力与供应链的组织能力,能否在自有算力、云算力、国产芯片适配、跨地域调度之间找到最优解。

当然单纯是这条曲线对千问、豆包、元宝三家的意义也各不相同。

图源:网络

千问背靠阿里云与电商体系,理论上更容易把算力与业务结合起来做 " 规模采购 + 分级调用 ",把成本控制转化为平台优势;

豆包依托字节的内容与分发体系,优势在于训练数据与场景丰富,但也意味着调用频率会更高、更碎片化,对成本优化的要求更苛刻;

元宝处在腾讯生态里,天然靠近社交与内容,但社交场景对延迟、稳定性和安全合规更敏感,成本优化必须和体验、风控同步推进。

Token 成本曲线之所以会很快成为竞争瓶颈,是因为它决定了竞争方式:当成本足够低,你可以用更激进的定价策略去扩张;当成本不够低,你只能依赖补贴或 " 限制功能 " 去控制消耗,最终把用户体验做窄。

像是元宝即便如今还需要频繁切换 deepseek 去代替自己的浑元大模型,背后显然也是算力瓶颈的问题。

元宝 APP 截图

或是像一时火爆的 seedance 2.0,如今即便是付费用户动辄也要排队几个小时才能完成一次生成,这其实也都是过高的算力成本之下,平台试图平衡成本的无奈之举。

更好的 Token 成本曲线会决定 "AI 是否能从 C 端走向 B 端与交易链条 "。企业客户不会为一次好玩的对话付费,但会为可预期的效率提升付费。前提是价格透明、质量稳定。

在这个意义上,下一赛段的核心其实与 DAU、MAU 这些传统的互联网产品指标无关,核心还是更小的单位成本以及 TPD(每日 Token 消耗量)。

从场景到入口,软硬一体或成默认能力

春节之后,各家的 AI 应用竞争会越来越像 " 阶段性战役 ":榜单可以冲,DAU 可以拉,但它很难成为终局。

真正的战场其实更多在于场景—— AI 能否嵌进用户已经每天在用的路径里,成为默认的底层能力。

这就是为什么 " 场景嵌入度 " 甚至比 " 留存率 " 更关键,即便用户没有打开这个应用,但其日常使用中依然能够调用到其模型能力。

图源:unsplash

场景嵌入通常有三种层级。

第一层是工具层,把 AI 当作写作、翻译、总结、检索的初级工具;

第二层是流程层,把 AI 放进办公套件、客服系统、内容生产链条,让它参与决策与协作;

第三层是交易与执行层,让 AI 不止回答,还能直接调用服务、完成下单、预约、支付、售后。

而硬件在这里的作用,是把入口从众多应用的选项变成终端 " 默认 "。

千问近期发力 AI 硬件,背后的逻辑并不复杂:手机屏幕里的 AI 入口太拥挤,分发权被操作系统、超级应用与内容平台层层分割;而可穿戴设备、耳机、眼镜等终端,可能提供一种更自然的交互方式——语音唤起、随手拍摄、实时翻译、导航与信息提示。

千问 AI 眼镜 G1

这些场景一旦成立,用户就不需要 " 打开某一 AI 产品 ",AI 会在场景里自动出现。

但硬件不是只要做出来就能赢。

它会把竞争推向物理层面——

一是本地化能力,设备要 " 随时可用 ",就必须依赖一定程度的端侧推理与低延迟架构;

第二是服务编排能力;

第三是长期运营能力,硬件一旦出货,就进入了供应链、售后、系统更新、隐私安全与合规的长周期战场,远比软件更重。

对豆包和元宝来说,做硬件宜早不宜迟,毕竟去年豆包手机已经遭遇过一波激烈抵抗。对字节而言,大量传说中的硬件如今也有更好的理由端出来了。

豆包手机助手

除了成本、场景与硬件入口之外,AI 产业还有一个更直接的变量:人才竞争。

就在 3 月 4 日凌晨,千问团队核心技术负责人林俊旸宣布离职,而同时期团队中多位关键研究人员也相继离开。

当然," 一号位 " 的变动在 AI 行业并不罕见,但在大模型竞争进入关键阶段时,它的象征意义被明显放大。

大模型毕竟不是传统意义上的工程流水线。真正决定模型能力的,除了几万张 GPU,还有便是几十到几百名核心研究员——他们负责模型架构、训练策略、推理优化和数据体系。

图源:X

一个核心研究员的离开,往往意味着整条技术路径的调整甚至迁移。

因此,AI 公司之间的竞争表面上看是产品战、算力战和入口战,但底层其实是一场持续的人才密度竞争。

这也是为什么最近几年国内 AI 公司之间的挖角频繁发生。从阿里到字节、从腾讯到创业公司,顶级研究员的流动几乎都伴随着团队迁移与技术路线变化。

当模型能力逐渐趋同、开源生态不断扩大之后,真正能够拉开差距的,往往不是参数规模,而是研究团队的稳定性与创新能力。

最终,这一赛段拼的,不再只是春节式的峰值增长,而是三种能力能否同时成立:

Token 成本曲线持续下降、AI 能力深入真实场景、终端入口形成软硬协同,同时还能维持足够高的人才密度。

只有同时满足这几条条件,AI 产品才可能从 " 节日里的热点应用 " 变成长期存在的基础设施。

2026 年的春节只是开场,长期的泥沼战还会持续下去。

Recommend

推荐阅读

微信公众号近日更改推送机制

推文不再按照时间线显示

将壹娱观察设置星标、多点在看

这样就不会错过推送

INYOUMEDIA 相关账号

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

the 春节 ai 春晚
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论