与图灵奖得主对话AI未来！第八届北京智源大会正式启幕：智源世界模型与智能体最新成果集中亮相

编辑 | 玉澄

一场关乎 AI 未来走向的顶级思想交锋，正发生在第八届北京智源大会现场。

本次大会于中关村国际创新中心正式拉开帷幕，汇聚 200 余位全球顶尖专家学者与 40 余位头部 AI 企业 CEO 与创始人，短短两天议程内，将落地超 200 场前沿主题演讲与技术分享。

今年整个智源大会的主题主要分为世界模型和智能体两部分。除了聚焦 AI 下一代技术之外，此次大会还有 2 个重要特色，分别是 AI-Native 教育论坛，目的是讨论 AI 时代的下一代人才培养问题与现场的智源 AI 科研体验区。

此外，与会嘉宾还将一同围绕具身智能、AI 安全、Token 经济与 OPC、智能计算底层架构等前沿方向展开精彩演讲和前瞻性对话。

智源大会历年都邀请了 AI 领域的顶尖专家学者和企业高管，这次也不例外。在智源研究院理事长黄铁军和北京市市长分别致辞结束后，两位图灵奖得主相继登台。2015 年图灵奖得主、密码学先驱 Whitfield Diffie 与 2024 年图灵奖得主、" 强化学习之父 " Andrew Barto，分别从 AI 安全与强化学习两个维度，为大会贡献了兼具历史纵深与未来预见性的思想盛宴。

两位图灵奖得主演讲：密码学先驱 Whitfield Diffie 与 "强化学习之父 " Andrew Barto

Diffie 教授的演讲《Security For AI Agents, Security Against AI Agents》（《保障 AI Agent 安全，防范 AI Agent 安全风险》）超越了一般技术安全的讨论，从历史、哲学与技术演进的多维视角，系统审视了 AI 代理安全的核心挑战。

他首先追溯了 " 人工智能 " 的命名渊源。在 1956 年达特茅斯会议上，约翰 · 麦卡锡等学者刻意选用此术语以区别于诺伯特 · 维纳的 " 控制论 "，而 Diffie 本人更偏爱图灵使用的 " 机器智能 " 一词。他将当前 " 编写程序—发现漏洞—发布补丁 " 的安全模式比喻为控制论的反馈循环，并提出了通过形式化验证（用数学方法证明程序完全符合规约）实现高保障软件的宏大愿景，认为 AI 本身可以成为完成这些庞大证明的关键工具。

作为公钥密码学的奠基人，Diffie 指出密码学是信息安全中 " 做得最好 " 的部分，但其理论仍依赖于尚未证明的复杂性难题。他犀利地警告：微软 " 补丁星期二 " 模式存在根本缺陷——攻击者会在用户部署补丁前的 " 脆弱窗口期 " 逆向分析并发动攻击。

在防御 AI 代理方面，他直言沙箱机制一直不够完善，并引用了阿西莫夫机器人三定律发出深刻警示：当今 AI 正被赋予 " 可以拒绝服从人类 " 的权力，一旦开启这个口子，机器将获得越来越多的控制权。他断言："21 世纪最大的问题将是人与机器的互动，其重要性将超越中美关系、核战争、全球变暖等问题 "，并预言机器接管世界的方式并非战争，而是人类会不断主动将任务交给机器，最终 " 就像无法推翻一个包揽一切的政府一样 "。

在问答环节，Diffie 还建议年轻研究者关注生物技术领域，因为基因选择和改造将模糊 " 人 " 的定义边界。

Barto 教授以《Rediscovering Reinforcement Learning》（《重新发现强化学习》）为题，通过线上的形式为听众梳理了强化学习从 19 世纪思想萌芽到当代 AI 核心支柱的宏大历程。

他将强化学习的起源追溯至 1898 年桑代克提出的 " 效果律 "，即带来满足的行为被强化，带来不适的行为被弱化，本质是一种 " 试错学习 "。Barto 强调，哲学家丹尼特甚至认为效果律是任何关于行为的充分解释中不可或缺的组成部分。强化学习并非 AI 的专属语言，它与心理学、控制论、运筹学、经济学、神经科学和博弈论等领域都深度纠缠。

在计算层面，Barto 将强化学习定义为一个 " 控制、搜索和联想记忆的三角结合 "：控制让系统影响未来输入，搜索通过 " 生成与评估 " 探索未知，记忆负责存储每个情境下的最佳行动。他强调强化学习是 " 带评论家的学习 "，本质区别于监督学习中的 " 错误纠正 "。

Barto 梳理了一部被忽视的计算思想史：从艾伦 · 图灵 1948 年的 " 快乐 - 痛苦系统 "、香农的 " 忒修斯 " 迷宫老鼠、明斯基的信用分配问题，到塞缪尔的自对弈跳棋程序——强化学习在数字计算诞生之初就存在，却一度被监督学习的主流遮蔽。他与 Richard Sutton 共同开发的演员 - 评论家系统和时序差分（TD）算法，成为现代强化学习的基石。

在神经科学交叉层面，Barto 分享了一个关键发现：多巴胺神经元的响应模式与 TD 误差惊人地一致。这一 " 奖励预测误差假说 " 的发现，深刻改变了神经科学家对大脑奖励系统的理解，体现了 AI 与脑科学 " 相互启发、紧密耦合 " 的范式。

对于未来方向，Barto 特别推荐三个领域：多智能体强化学习、强化学习与神经科学的交叉，以及医疗领域的时序治疗方案设计。他警告奖励函数设计的 " 乖谬实现 " 风险：" 系统会精确地实现你设定的目标，但那可能并非你的本意 "。关于 AGI，他的判断冷静而务实：" 强化学习可能是必要组成部分，但不是全部。"

2026 年智源研究进展报告

接下来智源研究院院长王仲远为我们带来了 2026 年智源研究进展报告，内容极其丰富且硬核，展示了智源研究院在基座大模型、智能体、基础软硬件生态等前沿技术领域的探索成果和开源生态建设的最新动态。

在基座大模型部分，王仲远表示，世界模型的核心就是能够让人工智能进入物理世界，拥有感知、理解、推理，以及跟物理世界交互的能力。

世界模型分类

此次他代表智源研究院首次提出了世界模型的四大类别，分别是：

第一类是以语言为中心的世界模型，包括 VLM、VLA，模型在文本空间中预测下一个词，学到的是语言描述的世界，并不能理解背后的物理后果。

第二类是以像素为中心的世界模型，像 Sora 和 Seedance 等视频生成类模型，在视觉空间中学习视频或图像，学到的是像素描述的世界。

第三类是以三维结构为中心的世界模型，包括 3D 重建以及李飞飞团队的 World Labs Marble 模型，不过模型重建 3D 空间不等于理解世界，几何结构也不代表物理状态。

第四类是以视觉表征为中心的世界模型，比如杨立昆的 JEPA 系列模型，预测的是视觉表征的压缩，但视觉嵌入演化不等于物理规律演化。

智源研究院认为，世界模型作为面向真实物理世界的下一代基座模型，以 " 预测下一物理状态 " 为核心，代表着人工智能的下一个重要范式跃迁。

" 悟界 " 系列大模型创新成果

与此同时，王仲远隆重介绍了智源研究院的 " 悟界 " 系列大模型。这一系列旨在解决人工智能从数字世界迈向物理世界的关键能力，并且构建面向物理世界的人工智能基座模型。

其中，悟界 · Emu3.5 仅基于 " 预测下一个词元（Next-Token Prediction）"，实现了大规模文本、图像和视频的统一学习，与多模态理解和生成任务的统一学习，这一原创性的成果在今年 1 月份刊发于 Nature 正刊，创造了国产多模态大模型的众多纪录。

还有一系列最新创新性成果：

悟界 · Brain μ 1.0 是全球首个理解与生成统一的多模态神经科学大模型，将 Next-Token Prediction 范式扩展到神经科学领域所构建的多模态脑科学通用基座，由智源联合清华团队基于悟界 · Brain μ 开展的研究成果也已刊发于 Science。

与悟界 · Brain μ 1.0 一同发布的还有全球最大最全的 AI-Ready 神经科学数据集和全球最大的 AI-Ready 数据平台 BrainToken。

悟界 · OpenComplex2.5 是可泛化、物理真实的下一代 AI 驱动药物发现模型，能精确解析 IDP 灵活构象，系统性赋能创新药物研发全链路，以单一模型覆盖制药四大关键步骤。

悟界 · Physis-v0.1 是全球首个通用世界基座模型，以统一物理状态学习，实现物理正确、动作因果可溯、长程一致、通用泛化，最终达到全垂类场景应用。

在具身智能的模型方面，王仲远也向我们介绍了智源研究院构建的自底向上的全栈具身智能技术体系，包括悟界 · RoboBrain、悟界 · RoboOS，和正在研发中的悟界 · RoboBrain Orca。其中，悟界 · RoboBrain Orca 以预测下一个物理状态为核心来构建具身大脑，融合了大量 Ego-centric 交互数据，强化世界模型的具身表征，提升下游少样本和跨场景泛化的能力。

4 款创新型智能体发布

在智能体这部分，智源大会早在 2024 年就已开办智能体论坛，论坛数量也从去年的 1 场拓展到今年的 3 场。此次大会智源研究院共发布了 4 款智能体：

第一款是智源研究院与安贞医院共同研发的心脏磁共振辅助诊断智能体 BAAI Cardiac Agent。这款智能体能够对于心脏磁共振多模态数据进行处理，辅助医生进行心脏疾病诊断，帮助医生提高效率 30 倍，达到安贞医院顶尖心血管医生的诊断能力，有望推动人工智能 + 医疗顶尖诊断能力下沉到基层医院，助力整个医疗的普惠。

第二款是智源研究院自研的科研智能体悟格 · AREX，主要目标是加速科学发现。AREX 不仅显著超越同等参数量级的开源系统，而且可以比肩当今万亿参数级别的旗舰系统自主研究的能力。

第三款与这次大会有关，是帮助大家更高效听会的听会智能体 SoulAgent。它是通过微信小程序直接使用的，能够帮助参会者实现了解此次大会所有会议的演讲或讨论内容，同时也能够与先期入驻的 AI 专家数字分身畅聊 AI 问题。此次智源大会共开放 2000 个免费的体验名额，并赠送了 1 亿的 Token。

第四款是辅助有害蛋白获取的风险发现智能体。它能够绕过现有的安全筛查机制，实现对于有害蛋白基因的获取和合成，这表明当下大模型和智能体技术已经实实在在带来了 AI 安全风险。

众智 FlagOS 2.1，解决芯片模型适配难题

最后，在基础软硬件生态方面，由于当下大模型训练和推理的软硬件生态依然存在割裂，许多的企业都不得不进行 M 款模型与 N 款芯片的适配。因此，智源研究院与开源社区共建了众智 FlagOS，能够将 M 乘 N 的适配难题简化为 M 加 N 的统一接入解决方案。

FlagOS 现已升级到 FlagOS2.1，它能够支持 18 家芯片厂商的 32 款芯片，是全球覆盖芯片数量最多的计算系统软件栈。FlagOS 的算子总数已超过 600 个，并且仍然在快速增长。同时 FlagOS 还能够支持 18 家芯片厂商的统一编译器和 12 家芯片厂商的统一通信库。目前，FlagOS 的生态成员已经超过 80 余家，全球下载量超过 37.5 万次，触及开发者 5.6 万人。

播客对谈和圆桌环节

此外，本次开幕式还有 2 场大咖对谈，一场为智源研究院理事长黄铁军与之江实验室主任、阿里云创始人王坚围绕 " 总有人比时代早十年 " 展开播客现场对话，由《漫谈 Light the Star》创始人卫诗婕主持。

对话从中国 AI 范式演进出发，探讨了中国大模型如何从追赶验证走向路线选择、体系构建与范式创新，如何突破互联网文本数据天花板与算力荒的极限状态，以及从 " 跟随国际主流范式 " 走向 " 形成自身问题意识 " 的原创范式跃迁等议题。

对话还聚焦 Agent 时代的新范式——从推理时代迈入 Agent 时代，海量高并发智能体对真实世界产生的直接影响与风险。面对 AI 从 " 客体 " 向 " 主体 " 演进，两位嘉宾也分享了对人与 AI 关系、人类文明与 AI 文明如何共存的长期思考。

另一场为在 " 重构世界——中国大模型巅峰对话 " 圆桌环节，智源研究院院长王仲远与清华大学计算机系教授、生数科技创始人朱军，小米集团 MiMo 负责人罗福莉，以及清华大学计算机系教授、面壁智能联合创始人兼首席科学家刘知远，南洋理工大学校长讲席教授、人工智能交叉研究院院长安波等行业领军者，围绕超级模型能力演进、AI 自进化、多模态与世界模型等核心议题深入交流，共同探讨了数字世界向物理世界跨越的重构逻辑。

嘉宾们认为，超级模型与智能体系统正进一步释放更大势能，自进化有望成为驱动智能跃迁的新引擎，多模态与世界模型的加速成熟有望推动 AI 真正从数字空间走向物理世界。在重构世界的进程中，同时应该为青年人才创造更广阔的探索空间。

随着第八届北京智源大会的开幕，我们不仅见证了一场 AI 领域顶尖智慧的相互激发碰撞，更清晰地窥见了人工智能发展的下一个宏大叙事，那就是未来 AI 将从虚拟的数字空间全面进入到真实的物理世界。而在这场模型的原创范式探索中，中国 AI 力量正从路线追赶走向自主创新，属于下一代创新人才的广阔天地已掀开帷幕。

——好文链接——

AI 基础设施是泡沫吗？AI 基建巨头联创：DeepSeek 让股价暴跌 40%，却创造了销售纪录！我们离技术撞墙还很远

未来 AI 产业年投入将达约 20 万亿美元！黄仁勋：AI 的计算网络将像电网一样，如茧般包裹着整个世界

硬刚 Claude Code！小米 MiMo 进军开发端，这次国产 Agent 不比模型比 " 外壳 "

宙世代

一起剪

相关标签