百度AI最新进展，李彦宏打出一张效率牌

在算力贵过黄金的时代，效率本身就是壁垒。

新眸原创 · 作者 | 李小东

百度选在 2026 年 Create 大会开幕前四天，端出了文心大模型 5.1。

这个时间点的选择不算意外。5 月 13 日的开发者大会需要一张技术底牌，而距离上一个版本发布已过去近半年，市场上关于 " 百度大模型掉队 " 的声音正在变响。

这个时候推出的文心 5.1，需要用数据来回击这些质疑，而它也的确拿出了几张够硬的牌：搜索榜国内第一，预训练成本仅为业界同规模模型的 6%，Agent 能力超越 DeepSeek-V4-Pro。

但回看百度过去一年的 AI 轨迹，一个问题很难回避：技术上的领先，似乎并没完全转化为市场端的领先？文心 5.1 给出的答案，分量又有多重呢？

三组数据

和解一桩 " 旧案 "

先看文心 5.1 到底亮出了什么。

根据 LMArena 大模型竞技场最新排名，文心 5.1 以 1223 分位列搜索榜国内第一、全球第四，是该榜单中唯一上榜的国产大模型。它的 Preview 版本早在 4 月 30 日就以 1476 分登顶文本榜国内第一，超越 GPT-5.5 和 DeepSeek-V4-Pro，是前十五名中唯一入围的国产模型。

对于一家从 2023 年起就被反复质疑 " 大模型没声音了 " 的公司来说，这两项成绩是某种意义上的 " 解案 "，至少从榜单维度看，百度的模型能力没有掉队。

不过值得讨论的，的确不是分数，而是分数背后的技术路径选择。

文心 5.1 的核心技术叫 " 多维弹性预训练 "。这个提法最早在文心 5.0 发布时出现，它的逻辑是：在一次预训练过程中，通过动态采样机制同时优化大量不同深度、专家容量和稀疏度的子模型，最终构建一个覆盖不同参数规模和计算预算的子模型矩阵。

翻译成白话就是，一次训练，生成多种型号，不再需要为每种规模单独烧一次算力。按照研发人员的表述，这套框架分别沿弹性深度、弹性专家容量和弹性稀疏度三个维度做压缩与扩展，通过可变 Top-k 路由灵活调配激活专家数量，在推理开销和模型性能之间建立可控的调节空间。

落到具体数字上：文心 5.1 的总参数被压缩到文心 5.0 的约三分之一，激活参数压缩到约二分之一，预训练计算成本仅为同规模同类模型的 6%。

6% 这个数字很容易被误读。它不是说 " 用 6% 的钱做出了 100% 的性能 "，而是说，在同等参数量级和性能水平下，训练阶段消耗的算力只用了行业惯常的 6%。这是通过 " 模型压缩和弹性训练大幅降低冗余计算 " 来达成的，是一种预训练环节的效率提升。

在 2026 年全球数据中心能耗争议持续升级、国产芯片供给尚不宽裕的背景下，这个方向的选择，说服力不弱。

再看评测数据。在 τ³ -bench 和 SpreadsheetBench-Verified 两项智能体评测任务中，文心 5.1 超越了 DeepSeek-V4-Pro，官方给出的描述是 " 智能体能力已接近领先闭源模型的水平 "。创意写作方面则与 Gemini 3.1 Pro 持平，在 AIME26 数学竞赛（使用工具）上拿到 99.6 分，仅次于 Gemini 3.1 Pro。

这些数据大多是百度内部评测或较小的基准测试，并不是 LMArena 那种大规模盲测榜单，稳健性还需更多第三方验证，但整体方向是清晰的：这代模型的升级空间主要在 Agent 和深度搜索能力上，而非纯粹的语言表达。

目前，文心 5.1 已在千帆模型广场和文心一言官网上线，开发者可以通过千帆平台调用 API。百度还宣布将文心 5.1 陆续接入 ISEKAI ZERO、Mulan AI、谛听幻流、Storymaster 等超过十个创意生产智能体平台。

这个动作的意图明显，不是只谈模型，而是谈模型落地。

放在整个行业，文心 5.1 在产品端的节奏不算慢。但真正让百度头疼的，一直都不是技术。

百度选了一条不同的路

如果单纯比打分，文心 5.1 并不弱势。但 2026 年的 AI 市场，尤其在中国，产品竞争，相比看分数，大家更在乎的是谁的用户多、场景多。

2026 年春节，四家大厂在 AI 领域的总营销投入接近 50 亿元。百度抢先开局，拿出 5 亿现金红包，把入口全部放在百度 App 生态内。字节豆包投入 15 亿到 20 亿，腾讯元宝 10 亿，阿里千问出手最重，60 亿。

根据 QuestMobile 的数据，春节前后字节豆包以 8400 万日活开局，除夕当天冲到 1.45 亿峰值；阿里千问活动次日日活达到 7352 万；腾讯元宝除夕 4054 万。而百度文心的用户增长曲线动静平平。

外界感知到的是，百度在 C 端用户的争夺中正在被甩开，虽然模型能力不断迭代，但公众感知严重滞后。这是中国 AI 产业一个特有的悖论，技术团队不断优化训练效率，但用户只关心 " 这玩意儿能不能帮我订机票 "。两个坐标系互相不认识。

如果要说一个更大的行业叙事，2026 年上半年的关键词，正在从 " 军备竞赛 " 切换到 " 商业化 "。

前不久，字节豆包启动收费模式，最低档 68 元 / 月，最高 5088 元 / 年，评论区被 " 又笨又收费 " 的骂声淹没。但不要搞错，这是全行业的拐点。上个月，阿里云、腾讯云、百度智能云和智谱同步涨价，部分涨幅高达 463%。

在 C 端用户还在习惯 " 免费 AI" 幻象的时候，大厂们已经开始算现实的成本：API 调用量每涨一波，模型的推理成本就跟着翻番。

百度实际上比大多数同行更早感受到了这种压力的峰值。2025 年 Q3，百度核心在线营销收入 153 亿元，同比下降 18%，和 2023 年 Q2 的峰值 197 亿元相比，跌去了超过五分之一。这个缩水不是周期性的，而是结构性的——用户不再愿意从一页链接里自己找答案，AI 直接给答案才是新习惯。对用户体验来说是好事，但对搜索广告这个百度最大的利润支柱来说，基础开始松动。

李彦宏的选择是押注 AI 转型。到 2025 年 Q4，百度 AI 新业务收入达到 113 亿元，占核心非在线营销收入的 43%。AI 云收入在 Q3 同比增长 33%，AI 原生营销服务收入同比激增 262%。一减一增之间，百度的业务结构确实在变。

回到文心 5.1，如果放在这个商业化视角下重新审视，它传递的信号不只是 " 比分高 "，看点在于，" 训练成本是行业 6%"。在 API 价格集体走高的 2026 年，训练成本优势就是云服务的定价权和利润空间。

百度在 AI 云的竞争力，取决于能否把文心大模型的效率优势转化为持续性收入增长。这个命题，比在 Benchmark 榜单上拿一个第一要难得多。

文心 5.1 的价值

或许在百度 App 里

那么，文心 5.1 的真正价值在哪里？

如果只是将它当作一个 API 调用的标准模型，技术数据上它确实有说服力。但对于百度来说，需要思考的是，如何把它嵌入到百度 App 这个月活超 2 亿的超级入口中。

今年初，文心助手月活突破 2 亿，春节期间百度把红包入口全部导向了百度 App。这个策略说明百度已经放弃了做独立 AI App 的打法，它要回到自己的主场，用 AI 重塑搜索。

在百度世界大会 2025 上，李彦宏透露，百度搜索首条结果的富媒体覆盖率已达 70%。用户搜索一个问题，AI 直接给出结构化的图文答案，而不再是一排蓝链接。这对用户是好事，对广告收入是坏事——因为点击行为会大幅减少，广告库存跟着缩水。

这是一个商业悖论：用户体验越好，变现越难。

文心 5.1 给出的答案，在它被着重强调的 " 搜索能力 " 里。它的 " 多源信息快速检索、整合与生成能力 "，理论上可以用来给出更丰富、更个性化的答案。而这些高质量的信息整合结果，本身就可能成为新的广告呈现方式——不是链接广告，而是内容嵌入式的信息推荐。

在这个逻辑下，AI 搜索不是吃掉广告收入，而是换一个方式重建广告收入。能不能走通，取决于百度在 5 月 13 日 Create 大会上公布的商业化路径，是否足够清晰。

同时不能忽视的是百度在算力侧的布局。旗下昆仑芯已向港交所提交上市申请，同时百度构建的三万卡智算集群为大模型训练提供基础支撑。在 2026 年国产芯片替代加速的语境下，" 自研芯片 + 自研模型 " 这个组合的远期价值，可能比文心 5.1 本身更值得关注。

高盛在近期报告中指出，中国 AI 训练将越来越依赖高度优化的计算效率架构，而非单纯堆算力规模。百度目前的路径，通过软硬协同优化把训练成本压缩到极致，与这个产业方向高度对齐。

文心 5.1 是一张技术底牌，在搜索能力、训练效率和 Agent 能力三个维度上都给出了可以量化的提升。它最硬的数字在于那 "6%"，在算力贵过黄金的时代，效率本身就是壁垒。

但 2026 年的中国 AI 竞争，早已过了 " 参数和跑分 " 定胜负的阶段。商业化的压力、用户规模的争夺、行业场景的渗透，构成了一套远比 Benchmark 更复杂的评判体系。5 亿红包打不出水花的尴尬，大模型上车的错失，搜索广告失速带来的利润真空——这些不是文心 5.1 凭技术数据能解决的。

5 月 13 日 Create 大会，李彦宏将登场。届时决定的可能不是 " 文心产品如何迭代 "，而是百度在 AI 这条路上，到底准备怎么把钱挣回来。在大厂集体进入 " 算账生存 " 模式的 2026 年，这个答案，也许才是市场最想听到的。

本文系新眸原创，申请转载授权、商务合作请联系微信：ycj841642330，添加好友请备注公司和职位。

— END —

宙世代

一起剪

相关标签