文|周鑫雨
编辑|苏建勋
如今,模型的发展已经成了应用开发者的一把双刃剑。一方面,模型能力的增强,给场景落地带来更多的可能;另一方面,应用的能力,也随时可能被模型能力本身淘汰。
什么样的应用不会过时?
2025 年 4 月 25 日,百度 Create 大会上,百度集团创始人、董事长兼 CEO 李彦宏的答案是:" 你只要找对场景,选对基础模型,有时候可能还要学一点调模型的方法,那么在这个基础上做出来的应用,它是不会过时的,应用才是真正创造价值的。"
在应用层,李彦宏认为 2025 年以来最令人激动的突破性的应用,是数字人和 Agent。
卖数字人,是百度布局电商业务的重要一环。在会上,李彦宏发布了最新的数字人能力:高说服力数字人。除了更加拟人," 高说服力数字人 " 的特点,是可以感知直播间环境,并智能做出发红包、换品等决策。
百度在应用层的另一个布局重点,是 Agent。
一年前,李彦宏曾表示,AI Coding 是他最看好的应用方向。目前,百度在代码智能体领域已经做了较为完整的布局,有面向专业工程师的编程工具 Comate,面向普通人的无代码编程工具 " 秒哒 "。
而面向通用场景,前有 Manus 邀请码 " 一码难求 ",百度也快马跟上,趁 Manus 收费之际,推出了一款移动端的 Agent 应用 " 心响 "。
在模型层,DeepSeek 是绕不过去的竞争对手。
"DeepSeek 不是万能的。"李彦宏开门见山,"DeepSeek 不支持多模态理解,有幻觉,更重要的是,慢和贵。"
对着 DeepSeek 的 " 短板 " 打,百度在 Create 发布了新模型:文心大模型 4.5 Turbo 和 X1 Turbo,主打多模态,强推理,低成本。尤其是成本,4.5 Turbo 的成本,是 DeepSeek V3 的 40%,X1 Turbo 的成本,是 DeepSeek 的 25%。
最后,百度将自己的野心,也放到了 AI 应用生态的建立上。
一方面,百度搜索推出了开放平台,邀请应用开发者给予搜索生态开发 AI 应用;另一方面,百度对 Anthropic 发布的 Agent 协议 MCP,进行了支持——这意味着,支持 MCP 的模型、外部工具和数据库之间,将能够畅通无阻的交互。
百度的 "App 版 Manus" 发布了
2025 年 3 月 6 日发布的 Agent 应用 Manus,又让 AI Agent 成为各家抢滩的应用高地。
4 月 22 日,大会三天前,百度的首款独立 Agent 应用,已经上架了安卓应用商店。这款名为 " 心响 " 的 App,形式可以简单理解为百度将 Manus 的移动端版本做了一遍。
用户只需在 " 心响 "App 中输入自己的需求,Agent 就能对任务进行执行和交付。
" 心响 " 制作绘本。来源:百度
此前,据百度智能体业务首席架构师、心响 App 负责人黄际洲介绍," 心响 " 的实现,背靠的是百度提出的 Agent Use 协议。此前,Anthropic 提出的 Agent 协议 MCP,针对的是工具的调用。
而 " 心响 " 采用的是对智能体的调用。根据用户的需求," 心响 " 的主智能体,能根据任务,调度第三方和百度自己的智能体,实现任务的执行和交付。
重建用户心智,在心响 App 产品经理黎宇昕看来,是百度做 Agent 产品时遇到的最大难点。
在媒体沟通会上,他提到,百度之前用搜索建立的用户心智,是及时交付。这意味着,AI 应用 " 一定会折损效果,比如通过缓存的方式,去降模型调用的次数等等 " ——这也是市面上大多强调及时交付的 Agent 产品,无法实现高质交付的原因。
黎雨昕认为," 心响 " 要重新建立的,是托管心智。与 Manus 的任务可视面板类似," 心响 " 在任务执行过程中,也采用了分析流的形式,将任务执行的过程和时间,呈现给用户。
目前,心响已经支持包括 200 种类型的任务,覆盖了工作、学习、生活的主要场景,比如试题讲解、旅游、相亲、问诊、法律咨询。
黄际洲透露,未来," 心响 " 计划将支持的任务类型扩展到 10 万 + 以上。与此同时," 心响 "PC 端也正在研发中。
会画画的新推理模型,成本仅 DeepSeek 的 25%
百度新发布的模型文心 4.5 Turbo 和 X1 Turbo,相较于 DeepSeek V3 和 R1 的优势,除了整体性能的超越,主要在于多模态能力和低成本。
文心 4.5 Turbo 性能测评。来源:百度
文心 X1 Turbo 性能测评。来源:百度
其中,李彦宏强调了多模态理解的能力。他认为,多模态是未来基础模型的标配," 纯文本模型的市场会越来越小,多模态的市场会越来越大 "。
文心 4.5 Turbo 和 X1 Turbo,都对图像和视频理解进行了支持。
比如,输入一张高糊的球赛照片,文心 4.5 Turbo 能通过周边的广告牌、球员动作等元素,识别出这是 1986 年墨西哥的世界杯足球赛上,阿根廷与英格兰的决赛。
文心 4.5 Turbo 的图像理解能力。
除了多模态理解,两个模型也支持多模态生成。
比如,在文心 X1 Turbo 中输入 " 听说武汉有种东西叫‘蒜鸟’,请你把它画出来 ",X1 Turbo 就能根据联网搜索到的信息,生成蒜鸟的卡通形象。
至于价格,文心 4.5Turbo 价格仅为文心 4.5 的 20%、DeepSeek V3 的 40%,每百万 token 的输入价格为 0.8 元,输出价格 3.2 元;X1 Turbo 的价格仅为 DeepSeek-R1 的 25%,每百万 token 输入价格 1 元,输出价格 4 元。
百度电商,做上游 " 卖水人 "
AI 重燃了百度对电商信心。
自 2023 年 5 月在百度 App 上线 " 百度优选 " 入口以来,百度对电商的定位,不是和淘宝、京东这些规模化的货架电商竞争。
百度副总裁、百度电商总经理平晓黎表示,百度电商有两个定位,一方面,是构成百度 App 服务的一环,满足搜索用户的消费需求;另一方面,是用智能工具服务,成为电商的上游 " 卖水人 "。
数字人,就是百度电商卖的水。此次百度发布的 " 高说服力数字人 ",除了在拟人、成本、风格等层面有所优化,最重要的是能够对直播间环境进行感知,并作出实时的互动,避免了传统数字人循环播放的尴尬局面。
比如,比如满 50 万人观看,就给观众发红包;根据直播间用户的问题,灵活调度 PPT、切换素材。
" 高说服力数字人 "。来源:百度
实时互动背后的技术,是多智能体调度能力。据平晓黎介绍,高说服力数字人背后,有主播专家、运营专家、场控专家等多个角色智能体,能够根据直播间实时热度和转化情况,灵活调度。
AI 月活超 9700 万的文库,想打模型组合拳
整合了百度网盘的文库,交出了半年答卷:付费用户数超 4000 万,月活超 9700 万。
在百度内部,百度文库是模型能力应用的尖子生。此前,百度副总裁、百度文库兼百度网盘负责人王颖告诉《智能涌现》,文库是最早自研 MoE(混合专家模型)架构的 AI 应用。
当下,采用多模型组合的底座,已经成为 AI 应用的基操。李彦宏认为,应用对模型的组合使用,是普遍的现象,但如何组合、如何调用,仍然是一门技术活。
为此,百度文库和网盘推出了一个技术底座:沧舟 OS。
沧舟 OS。
为了实现不同模型对不同内容的理解和生成,这个底座,主要分成两层:
第一层,Chatfile Plus。其能够对不同模态、不同形态、不同格式的内容进行 " 向量化处理 ",也就是将不同内容翻译成大模型能看得懂的向量化 Token,在进行混合生成。
第二层,三库 + 三器,也就是 " 公域知识库、私域知识库,记忆库 ",以及 " 编辑器、阅读器和播放器 "。这一套系统,可以根据用户的需求,被大模型来组合调用。
基于这一套 OS,百度网盘发布了新功能,AI 笔记。
在百度文库看来,用户学习的一个痛点,是笔记内容与原始学习资料之间缺乏关联。比如用户根据笔记复习时,需要再花一番功夫,去寻找文本、视频、图片等资料。
AI 笔记的核心功能,是时间溯源和多模态整理。比如,根据百度网盘中保存的视频讲解,AI 笔记可以基于对内容的理解,梳理整个视频的逻辑结构和行文顺序,并生成思维导图。
导图中,每个知识点带的时间戳,都直接溯源到视频的相应节点。
百度网盘的 "AI 笔记 " 功能。
MCP,百度也接上了 "AI 万能插座 "
MCP,是美国模型厂商 Anthropic 推出的 Agent 协议。
就像秦统一了货币,协议的作用,就是统一了软件之间的开发标准。支持 MCP 协议的软件之间,也可以更为灵活的适配、相互调用。比如,不少金融公司采用 MCP,让 AI 更好地理解金融数据的上下文。
支持 MCP,也成了厂商吸引更多第三方应用入驻、建立 AI 生态的一场 " 暗战 "。比如,阿里云的 AI 开发平台 " 百炼 " 上线了 MCP 服务,腾讯云也宣布大模型知识引擎支持 MCP 协议。
在李彦宏看来,MCP 就像给 AI 装上了一个万能插座,能够提高不同 AI 软件适配、开发、整合维护的效率。对于需要自由调用工具的 Agent 而言,MCP 的出现尤为重要,这意味着 Agent 可以自由调用支持 MCP 的第三方工具。
目前,百度智能云大模型平台 " 千帆 " 兼容了 MCP,百度搜索也构建了 MCP Server 的索引平台,文心快码、百度电商、地图、网盘、文库等应用,也通过 MCP Server 的形式,对外提供了能力。
欢迎交流!
登录后才可以发布评论哦
打开小程序可以发布评论哦