壹番YIFAN 3小时前
千问豆包元宝,下一个赛段该拼什么
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

春节期间,千问、豆包、元宝几乎同时进入高强度竞争阶段。春晚、红包、补贴、热搜、联动活动密集出现,AI 应用被推成了一场节日流量事件。

这些日活数字很亮眼,但数字本身并不能说明问题。节日期间用户更愿意尝鲜、分享和传播,很多 增长来自情绪和激励,而不是长期需求。

真正的考验发生在节后 —— 当用户回到日常 生活与 工作流时,AI 是否还会被持续使用。

根据 QuestMobile 统计,豆包、千问、元宝在春节营销的猛烈进击之下,纷纷达到了自身的日活峰值,其中千问在某一日几乎接近于豆包,而豆包的春晚效应则一骑绝尘,但是," 撒币 " 效应结束之后,三家回落趋势明显。

图源:QuestMobile

与此同时,随着春节大战结束, AI 应用制造的更大关注,居然在于向用户道歉,亦或者核心管理团队离职,这无疑让市场感到疑惑:不顾一切撒币冲刺日活之后,它们真的想好了接下来该怎么走吗?

下一个赛段的问题,其实不是留存率本身,而是留存背后的结构。

其中最先显露出来的是成本问题。

如果每一次对话都需要高成本算力支撑,规模越大亏损越大。谁能把单位推理成本持续压低,谁才有资格谈长期增长。

接下来会拉开差距的是场景构建。

对国内市场而言,或许独立的 AI chatbot 竞争很难成为终局。真正稳定的使用频率,可能反而会来自真实工作流——办公、搜索、社交、电商、客服等系统入口。

国内部分 AI chatbot

而新的变量正在出现在终端形态上。

春节刚过,千问就开始推动独立的 AI 硬件,也带出了一个明显信号:AI 竞争正在从应用层走向终端层。语音、视觉、多模态设备,可能成为新的默认入口。

换句话说:春节解决其实还是认知度问题。

下一阶段各家既要比拼 Token 成本,也要尽快找到一个无可替代的使用场景,而布局次世代的 AI 硬件已经不能再停留在纸面上。

Token 成本曲线,谁先把 " 量大管饱 " 做成护城河

春节的短期活跃增长可以用补贴换来,但补贴买不到长期优势。

AI 应用的规模化,本质上受制于单位推理成本:每一次生成、每一次多轮对话、每一次多模态理解,背后都是算力、带宽、电力与调度成本。

最近一波围绕 OpenClaw 等框架掀起的 " 自建 AI 代理 " 潮,也把这个问题迅速放大。

越来越多公司和开发者开始搭建自己的 Agent、自动化流程和多步推理系统,AI 不再只是一次对话,而是连续调用、长链路执行。

图源:unsplash

这种变化直接体现在 Token 使用量上。

一些开发者平台统计显示,2026 年初全球 AI 推理 Token 使用量在短短一个月内从约 6.4 万亿 / 周增长到 13 万亿 / 周,几乎翻倍 , 其中很大一部分增长来自 Agent 系统的自动调用。

与此同时,Token 消耗不再是线性增长,而是随着任务复杂度呈指数放大。

这意味着,成本问题正在从 " 单次对话成本 " 变成 " 系统级调用成本 "。如果每一步都依赖高成本模型,AI 代理越复杂,费用增长越快。

过去一年行业最容易犯的错,是把 " 模型更强 " 当作唯一方向,把 " 参数更大 " 当作唯一指标,却忽略了一个更现实的问题: 当调用规模扩大十倍,成本也会按比例扩大吗?如果答案是 " 会 ",那增长就变成了财务压力测试。

图源:IDC 咨询

下一个赛段,谁能把 Token 成本曲线做得更陡、更快下降,谁就拥有更大的战略空间。

所谓 Token 成本曲线,至少包含三层——

其一是推理侧优化, 能否通过量化、蒸馏、编译加速、KV 缓存、并行策略等手段,把同样质量的输出做得更省;

其二是模型路由能力, 能否在不同任务中自动选择 " 足够好 " 的轻量模型,而不是每次都用最高配;

其三是算力与供应链的组织能力, 能否在自有算力、云算力、国产芯片适配、跨地域调度之间找到最优解。

当然单纯是这条曲线对千问、豆包、元宝三家的意义也各不相同。

图源:网络

千问背靠阿里云与电商体系,理论上更容易把算力与业务结合起来做 " 规模采购 + 分级调用 ",把成本控制转化为平台优势;

豆包依托字节的内容与分发体系,优势在于训练数据与场景丰富,但也意味着调用频率会更高、更碎片化,对成本优化的要求更苛刻;

元宝处在腾讯生态里,天然靠近社交与内容,但社交场景对延迟、稳定性和安全合规更敏感,成本优化必须和体验、风控同步推进。

Token 成本曲线之所以会很快成为竞争瓶颈,是因为它决定了竞争方式:当成本足够低,你可以用更激进的定价策略去扩张;当成本不够低,你只能依赖补贴或 " 限制功能 " 去控制消耗,最终把用户体验做窄。

像是元宝即便如今还需要频繁切换 deepseek 去代替自己的浑元大模型,背后显然也是算力瓶颈的问题。

元宝 APP 截图

或是像一时火爆的 seedance 2.0,如今即便是付费用户动辄也要排队几个小时才能完成一次生成,这其实也都是过高的算力成本之下,平台试图平衡 成本的无奈之举。

更好的 Token 成本曲线会决定 "AI 是否能从 C 端走向 B 端与交易链条 "。 企业客户不会为一次好玩的对话付费,但会为可预期的效率提升付费。前提是价格透明、质量稳定。

在这个意义上, 下一赛段的核心其实与 DAU、MAU 这些传统的互联网产品指标无关,核心还是更小的单位成本以及 TPD(每日 Token 消耗量)。

从场景到入口,软硬一体或成默认能力

春节之后,各家的 AI 应用竞争会越来越像 " 阶段性战役 ":榜单可以冲,DAU 可以拉,但它很难成为终局。

真正的战场其实更多在于场景—— AI 能否嵌进用户已经每天在用的路径里,成为默认的底层能力。

这就是为什么 " 场景嵌入度 " 甚至比 " 留存率 " 更关键,即便用户没有打开这个应用,但其日常使用中依然能够调用到其模型能力。

图源:unsplash

场景嵌入通常有三种层级。

第一层是工具层,把 AI 当作写作、翻译、总结、检索的初级工具;

第二层是流程层,把 AI 放进办公套件、客服系统、内容生产链条,让它参与决策与协作;

第三层是交易与执行层,让 AI 不止回答,还能直接调用服务、完成下单、预约、支付、售后。

而硬件在这里的作用,是把入口从众多应用的选项变成终端 " 默认 "。

千问近期发力 AI 硬件,背后的逻辑并不复杂:手机屏幕里的 AI 入口太拥挤,分发权被操作系统、超级应用与内容平台层层分割;而可穿戴设备、耳机、眼镜等终端,可能提供一种更自然的交互方式——语音唤起、随手拍摄、实时翻译、导航与信息提示。

千问 AI 眼镜 G1

这些场景一旦成立,用户就不需要 " 打开某一 AI 产品 ",AI 会在场景里自动出现。

但硬件不是只要做出来就能赢。

它会把竞争推向物理层面——

一是本地化能力,设备要 " 随时可用 ",就必须依赖一定程度的端侧推理与低延迟架构;

第二是服务编排能力;

第三是长期运营能力,硬件一旦出货,就进入了供应链、售后、系统更新、隐私安全与合规的长周期战场,远比软件更重。

对豆包和元宝来说,做硬件宜早不宜迟 ,毕竟去年豆包手机已经遭遇过一波激烈抵抗。对字节而言,大量传说中的硬件如今也有更好的理由端出来了。

豆包手机助手

除了成本、场景与硬件入口之外,AI 产业还有一个更直接的变量:人才竞争。

就在 3 月 4 日凌晨,千问团队核心技术负责人林俊旸宣布离职,而同时期团队中多位关键研究人员也相继离开。

当然," 一号位 " 的变动在 AI 行业并不罕见,但在大模型竞争进入关键阶段时,它的象征意义被明显放大。

大模型毕竟不是传统意义上的工程流水线。真正决定模型能力的,除了几万张 GPU,还有便是几十到几百名核心研究员——他们负责模型架构、训练策略、推理优化和数据体系。

图源:X

一个核心研究员的离开,往往意味着整条技术路径的调整甚至迁移。

因此,AI 公司之间的竞争表面上看是产品战、算力战和入口战,但底层其实是一场持续的人才密度竞争。

这也是为什么最近几年国内 AI 公司之间的挖角频繁发生。从阿里到字节、从腾讯到创业公司,顶级研究员的流动几乎都伴随着团队迁移与技术路线变化。

当模型能力逐渐趋同、开源生态不断扩大之后,真正能够拉开差距的,往往不是参数规模,而是研究团队的稳定性与创新能力。

图源:网络

最终,这一赛段拼的,不再只是春节式的峰值增长,而是三种能力能否同时成立:

Token 成本曲线持续下降、AI 能力深入真实场景、终端入口形成软硬协同,同时还能维持足够高的人才密度。

只有同时满足这几条条件,AI 产品才可能从 " 节日里的热点应用 " 变成长期存在的基础设施。

2026 年的春节只是开场,长期的泥沼战还会持续下去。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 春节 春晚 回落 自动化
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论