雷科技 3小时前
百度不装了!AI的下半场,最关键的就是这四个字
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

在这个大模型技术如雨后春笋般涌现的时代,如何将技术转化为真实的生产力,已经成为行业的必答题。

2025 年 11 月 13 日,百度在北京国家会议中心举办了一年一度的百度世界大会,雷科技也受邀参加了本次活动。与往年强调技术突破不同,今年的核心主题是" 效果涌现 ",李彦宏认为,健康的 AI 产业结构应该是 " 倒金字塔 " 形态,应用层应该远大于模型和芯片层。

(图源:百度)

在最新发布的一系列 AI 原生应用和解决方案中,百度的聚焦点不再是如何让模型变得更聪明,而是如何让 AI 走出实验室,深入产业实际,去完成更多具体的工作,为企业和个人创造可感知的效果。

所谓 " 内化 AI 能力,让智能从成本变成生产力 ",就是这个道理。

在过去的一年里,我们见证了大模型的快速迭代。

参数量从千亿级迈向万亿级,能力也从单模态拓展至多模态。AI 似乎无所不能,既能理解文字,也能看懂图片,还能听懂声音,但一个根本性的问题随之而来:AI 是真的理解了这个多姿多彩的世界,还是仅仅学会了将不同能力的插件拼接在一起?

这就像一个只懂语言的人,通过外挂翻译器去理解图像,其理解深度终究有限。真正的智能,应当是像人一样,生来就能同时运用视觉、听觉、语言去感知和思考。

在今天的百度世界大会 2025 上,百度发布的文心大模型 5.0,给出的正是后一种答案。

(图源:百度)

那么,什么是 " 原生全模态 "?

百度表示,业界多数多模态模型采用的是后期融合技术,即先分别训练语言、视觉等模型,再将它们 " 粘合 " 起来。而文心 5.0 从训练之初,就采用统一架构,将文本、图像、音频、视频等数据融合在一起进行学习。

这意味着,它不是在学习图像,而是在一开始就同时学习语言和图像的底层关联。这种原生的能力,使其能实现更深层次的跨模态理解与生成。

在高达 2.4 万亿的庞大参数规模下,文心 5.0 采用了超稀疏混合专家(MoE)架构,推理时激活参数低于 3%,实现了性能与效率的兼顾。在超过 40 项权威评测中,其语言与多模态理解能力已追平 Gemini-2.5-Pro、GPT-5-High 等顶级模型,而图像与视频生成能力更是达到了专业级水准。

(图源:百度)

可以说,如果说之前的多模态是 " 组合创新 ",那么文心 5.0 则开启了 " 原生融合 " 的新范式。目前,文心大模型 5.0 Preview 已同步上线文心 App,用户可直接体验;开发者和企业用户也可通过百度千帆大模型平台,调用文心大模型 5.0 API 服务。

值得一提的是,今天,百度还正式发布了新一代昆仑芯和超节点产品天池。

全新一代昆仑芯包括两款产品,其中,昆仑芯 M100针对大规模推理场景优化设计,提供极致性价比,将于 2026 年上市;昆仑芯 M300面向超大规模多模态模型的训练和推理需求提供极致性能,将于 2027 年上市;同步发布的天池 256 超节点与天池 512 超节点将于明年正式上市。

百度宣布,目前,昆仑芯已累计完成数万卡部署,成为了百度 AI 关键底座。计划未来五年按年推出新产品,持续打造最硬 AI 云,助力企业内化 AI 能力。

在过去的一年里,我们见证了无数智能体的诞生。

没错,AI 能帮你写文案、能帮你画图、能帮你分析数据。它们就像一个个能力出众的数字员工,在各自的岗位上表现出色。但问题随之而来:当你面对一个复杂的、需要跨部门协作的宏大目标时,你该向哪个 AI 下指令?

此时,你需要的不再是一个个独立的智能体,而是一个能统筹全局的超级智能体。

在今天的百度世界大会 2025 上,百度给出的答案,就是其全新发布的超级智能体——百度伐谋。

百度创始人李彦宏表示,不同于常规的智能体,百度伐谋的主要应用场景是在真实的产业场景中寻找 " 全局最优解 ",可被应用于交通、能源、金融、物流,甚至新药研发、科学理论等领域。

" 伐谋 " 一词,源自《孙子兵法》,意为 " 以谋略攻伐 "。

过往,企业解决这些复杂算法问题严重依赖专家经验。工程师手工建模、不断调参,才能找到一个相对不错的解决方案;一旦外部环境或条件发生变化,方案还可能失效。整个过程推倒重来,既费时又费力。

作为对比,百度伐谋可以通过模拟生物界几亿年的进化过程,并将这些过程压缩至几天甚至几小时,从而发现过去人类从未发现过的全局最优解,为抽象复杂问题提供战略性解决方案。

以交通信控为例,为解决城市交通 " 单点通、全局堵 " 难题,百度伐谋采用自动演化搜索技术优化信号配时。它能自动识别并组合关联路口,通过协同控制实现区域 " 绿波通行 ",最终显著降低车辆延误、提升路网通行效率,并实现算法的自动化部署。

让算法能够自己具备思考、推理与自我演化的能力,根据条件变化自动迭代,给出最优的动态方案,这就是百度伐谋的核心思路。

目前百度伐谋已经正式对外开放,并通过邀请码的形式提供服务,感兴趣的赶紧去官网了解一下吧。

无人出行喊了这么多年,到底什么时候才能真正普及?

这个问题,在很长一段时间里似乎都遥遥无期。小雷和身边的同事,其实都已经在广州体验过萝卜快跑的服务,从技术上讲,它的体验已经相当不错,能够处理绝大多数复杂的城市路况,但体验好,和能做成一门可持续的生意是两回事。

后者需要的,是规模化的数据、可控制的成本,以及最重要的——清晰的商业化落地路径。

而在今年的百度世界大会 2025 上,百度用最直接的行动和数据,诠释了萝卜快跑的 " 效果涌现 ":不再是小范围测试,而是大规模的商业运营和全球化扩张。

最重磅的消息,无疑是萝卜快跑正式 " 出海 " 中东。百度宣布,已与阿联酋公司合作,成功获得阿布扎比首批完全无人驾驶商业运营牌照,将在当地提供无需安全员的商业化 Robotaxi 服务。

这不是技术验证或海外路测,而是带着成熟的解决方案去开拓全新的商业市场。从中国跑到中东,这本身就是技术和运营能力已经形成效果的理想证明。

支撑这一步的,是惊人的运营数据。截至大会前,萝卜快跑在全球 22 个城市的累计订单量已超过 1700 万单,近期的每周订单量稳定在 25 万单以上,自动驾驶总里程更是超过 2.4 亿公里。如此庞大的数据喂养,让系统的迭代和安全性得到了充分保障。

正如百度创始人李彦宏表示,无人驾驶正给城市生活带来颠覆性改变。它不仅改变交通、出行,甚至会改变整个社会生态。

过去,我们谈论无人出行,更多的是在谈论一种未来的可能性。

而今天,当成熟的技术、庞大的运营数据、可控的成本以及清晰的国际化商业路径同时摆在面前时,我们看到的,是一个正在 " 涌现 " 的、真实的全球化出行新业态。这或许才是自动驾驶真正从技术演示,迈向商业落地的开始。

在日常工作中,有什么事情是耗时长、效率低,却又不得不做的?

制作一份专业的 PPT,撰写一份详尽的行业报告,或者为客户准备一份有说服力的项目方案,无疑是无数 " 打工人 " 的痛点。

过去,我们解决这些问题的起点,往往是打开百度文库,搜索一个相近的模板,然后花费数小时进行修改和填空。

这时候,文库的价值,更多体现在海量资料的存储上。

但在 AI 时代,这种效率显然是远远不够的。在今天的百度世界大会 2025 上,百度宣布文库联合网盘推出的全端通用智能体 GenFlow 升级至 3.0 版本,围绕着创作效率进行了一次全面升级。

借助 GenFlow 3.0,你可以给它下命令,让它帮你收集对应的资料、存进网盘或是下载到电脑上。

在此基础上,你还可以把网盘里的文件上传到文库中。用户只需输入几句话的创作要求,或是一份大纲,文库就能在数秒内生成结构完整、排版精美的 PPT 演示文稿、专业的商业报告或行业分析方案。

值得一提的是,GenFlow 在业内首创了" 生成过程可编辑 "的交互范式。

区别于传统 AI 工具的封闭式黑箱操作,其实时监控界面会清晰展示每个智能体的工作进度和中间成果,用户可以随时暂停流程,插入自己需要的内容并修正指令,AI 会动态调整后续检索和撰写策略。

这种能力解决了 AI 创作领域最大的痛点 "" 倒重来 ",经测试可使内容修订效率提升 300%。

此外,在 GenFlow 3.0 的加持下,文档多维理解和跨模态转换能力也有显著提升,搭配上长期记忆功能,现在文库生成的内容不再像以前那样局限于一系列静态模版中,而是会根据用户的习惯来进行修改,生成有个人特色的内容。

GenFlow 3.0 的效果是革命性的,它将原本需要数小时的专业创作过程,缩短到了几分钟甚至几十秒,极大地提升了个人和企业的生产力上限。

百度披露的数据显示,目前 GenFlow 的活跃用户已达 2000w+。

为什么当大模型已经能写诗作画、解答万物时,我们还需要给它一张 " 脸 ",一个 " 身体 ",把它变成数字人?

在我看来,这背后是人类对交互终极形态的一种想象:我们渴望与 AI 的交流,能像人与人之间一样自然、亲切。

但现实却有些骨感,近些年,小雷也接触了不少数字人产品,不论是华为用于特定场景的盘古数字人,还是魔法未来打造的虚拟偶像,它们在视觉呈现和特定脚本的交互上都堪称惊艳,可一旦超出预设范围,那种非人的感觉就会涌上来。

大多数时候,它们仍是一个被困在屏幕里的、有着精致外表的 " 高级 Siri",核心依然是 " 你提问,它回答 "。

那么问题来了,数字人的下半场,该往何处去?

在 2025 年 11 月 13 日的百度世界大会上,百度给出的答案是:停止满足于 " 对话 ",让数字人开始 " 干活 "

百度不再执着于讨论数字人 " 像不像人 ",而是直接亮出了它们的成绩单。在双 11 期间,使用慧播星数字人进行直播的开播直播间数量同比增长了 119%,带货 GMV(商品交易总额)同比增长 91%,显示出强大的商业潜力。

这可不是技术演示,而是实打实的生产力工具。百度在会上宣布将这套高说服力数字人技术实现平台化,向全球开放。这意味着,未来任何一个小商家,都有可能用上罗永浩同款的高说服力数字人,7x24 小时不间断地为自己的生意奔忙。

在此之上,百度还发布了全新的实时互动型数字人。基于文心大模型 4.5 Turbo 和下一代数字人技术 "Nova",它能够实时处理真实世界的信息并做出有情感、有逻辑的自然反馈。

当数字人的响应速度来到了 1 秒以内,交互时的违和感就会大大降低。

最后,我们来聊一个老生常谈的话题:搜索。

从诞生之日起,搜索引擎的核心任务似乎就是一件事:在你提出问题后,给你一串可能包含答案的蓝色链接,你需要自己去点击、去甄别、去整合。这种模式延续了二十多年,但在 AI 时代,它是否依然高效?

答案显然是否定的。用户想要的,从来不是一堆链接,而是一个直接的、可执行的答案,或者说,是 " 搞定 " 一件事。

在百度世界大会 2025 上,百度用 " 十年最大改版 " 宣告了传统搜索模式的终结。

全新的百度搜索,更像是一个无所不能的 AI 助理。超过 70% 的首条搜索结果,已经不再是网页链接,而是由 AI 直接生成、图文并茂的富媒体内容。

你想规划一次家庭旅行?它给出的不是一堆旅游网站,而是一份可以直接使用的、包含行程、预算和实时交通建议的完整方案。

更有趣的是,百度推出了行业首个开放式实时互动的数字人智能体搜索。你可以在搜索框里直接与 " 奥运冠军 "、" 现场主持 " 的数字分身进行一对一的对话。这种体验上的飞跃,让搜索从 " 人找信息 " 变成了 "AI 为你服务 "。

而要实现如此强大的效果,自然离不开一个繁荣的开发者生态。

百度推出的无代码开发工具 " 秒哒 ",在本次大会上升级至 2.0 版本。用户只需一句自然语言指令,就能让系统自动完成从开发、调试到部署托管的全流程。

数据显示,截至目前,用户通过秒哒平台已生成超过 40 万个应用,平均每分钟就有一个新应用落地。百度搜索更是进一步发布 "AI 开放计划 ",鼓励开发者在搜索这个巨大的场景里构建 AI 驱动的应用,并为他们提供流量和收益。

说得更简单一点,百度正在做两件事:一方面,用 AI 彻底重构 C 端用户的信息获取和任务完成体验;另一方面,为 B 端的开发者和创作者提供最便捷的工具和最广阔的平台,让他们能像搭积木一样,轻松创造出各种能解决实际问题的 AI 原生应用。

那么,当硝烟散尽,我们回过头来看,这场狂飙了一年多的 AI 技术革命,其真正的价值究竟在哪里?

在很长一段时间里,行业的焦点都集中在 " 智能涌现 " 上——模型参数有多大、评测分数有多高、能完成多么惊艳的技术演示。但在今年的百度世界大会 2025 上,百度给出的答案却异常清晰和坚定,那就是 " 效果涌现 "。

就像在大会上,李彦宏强调的那样," 模型应该产生 10 倍于芯片的价值,AI 应用能创造 100 倍价值,从而形成健康的 AI 产业结构。"

这背后,是文心大模型 5.0这样 " 原生全模态 " 的强大基座在提供支撑,它让 AI 拥有了更接近人类的、统一感知世界的能力。

不仅如此,我们还看到了一系列 " 效果 " 的落地:

数字人从 " 对话 " 走向 " 干活 ",用 GMV 增长证明商业价值;萝卜快跑驶出国门,拿下中东商业牌照,开启全球化生意;搜索与文库从被动工具进化为 " 帮你搞定 " 的创作中心,重塑了信息与生产效率。最终,超级智能体 " 伐谋 " 的出现,更将 AI 能力从 " 专才员工 " 提升至 " 项目总指挥 " 的维度,致力于解决更宏大、复杂的系统性问题。

归根结底,这场大会传递出一个强烈的信号:技术的先进性固然重要,但更重要的是它能否转化为可感知的生产力、可衡量的商业价值和可信赖的社会效益。

当 AI 不再是实验室里精心呵护的盆栽,而是开始成为能深入产业、解决实际问题的参天大树时,这场革命才算真正走进了现实。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

百度 ai 百度世界大会 效果 李彦宏
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论