量子位 07-25
AGI是否需要世界模型?顶级AI专家圆桌论道,清华求真书院主办
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

2025 年 7 月 20 日,2025 基础科学与人工智能论坛在中关村展示中心会议中心举行。

清华大学人工智能研究院常务副院长孙茂松教授主持,北京中关村学院院长、中关村人工智能研究院理事长刘铁岩博士、清华大学电子工程系主任汪玉教授、美国纽约州立大学石溪分校顾险峰教授、曦智科技创始人兼 CEO沈亦晨博士四位顶尖 AI 专家齐聚一堂,围绕人工智能的根本问题展开了一场火花四溅的讨论。

从因果性到原创能力,从算力瓶颈到未来架构,这场论坛为我们勾勒出 AI 技术的前沿图景与未来挑战。

共有500 名来自清华大学求真书院、北京各高校、中学和科研机构的观众到场。

此外,本次论坛还是 2025 国际基础科学大会的特别活动之一,由清华大学求真书院主办,中信证券股份有限公司与中关村科学城管理委员会协办。

现已连续举办 3 届,旨在推动交叉学科合作交流,为青年学生搭建了了解科研前沿、激发探索兴趣的平台。

我们将论坛交流内容整理如下:

相关性≠因果性:AI 系统的科学化门槛仍在

面对人工智能技术发展的瓶颈与限制顾险峰教授指出,目前 AI 技术在方法上仍以 " 相关性 " 建模为主,缺乏对 " 因果律 " 的深刻掌握。

他认为,缺乏因果建模的能力是当前 AI 在自然科学、数理建模等任务上受到限制的原因。

同时他也强调,真正的科学建模需要简约假设、逻辑自洽的因果体系,不能仅靠大量数据推导模式。

刘铁岩教授则补充称,虽然大模型底层是统计学习的结构,但在高层语义表达中已出现 " 因果性功能的涌现 ",例如在处理逻辑推理、数学解题、文本论证等任务时,大模型展现出了 " 因为……所以…… " 的结构理解能力。

他呼吁对因果性的层次与表达保持开放态度,建议从 " 语义因果性 " 角度重新评估当前模型的能力边界。

Token 范式的尽头:AI 模型是否需要世界模型?

与会专家还就"Next Token Prediction 是否是通往通用智能的正道 "展开讨论。

孙茂松教授率先提出疑问:文本是天然一维的,图像是二维的,视频再加一维时间,世界则是四维的。当认知对象越来越复杂,是否需要彻底摒弃 token 预测,转向 " 世界模型 " 等新范式?

对此,汪玉教授持乐观态度。

他认为," 语言本身是人类认知的表达系统 ",图像、视频、物理结构等都可以在二维语言序列中进行展开。

基于此,他提出一个 " 可描述性 " 的新边界概念:如果人类能够通过语言准确描述某一对象或规律,AI 就有可能通过 token prediction 模型学会它;如果人类尚未找到语言描述方式,则 AI 也难以捕捉。

刘铁岩教授对此也补充道,"next token prediction 实际上是语言理解和创作领域的极佳范式 ",其泛化能力远超以往所有任务特定模型。

但当 AI 任务转向如偏微分方程求解、量子系统建模、工业优化等非语言任务时," 当前范式将无法胜任,需要全新学习目标与系统架构。"

AI 能否 " 原创 "?推理与建模能力仍不可替代

其次,学者们还进一步聚焦于AI 是否具备 " 原创能力 "

顾险峰教授直言:

在科学研究中,重大理论的提出绝非数据堆积所能催生。

另外他以自己学习拓扑学为例指出:

最关键的一步转化,AI 永远抓不住。

他强调,科学进步来自 " 对未知现象的预判与假设 ",而非对已知结构的不断模仿。

沈亦晨博士以围棋为喻指出,尽管围棋规则简单,但由于搜索空间巨大(约 10^360)," 纯靠套路是不足以解决全部问题的。"

他区分了 "90% 可类推问题 " 与 "10% 原创性突破问题 ",认为 AI 可以在大多数工程化问题中大显身手,但在人类科学的 " 皇冠上的明珠 " 领域,目前仍力有未逮。

刘铁岩教授则从产业视角提出:

即便 AI 无法做到 " 无中生有 ",但它在已知边界上的全覆盖与组合重构,仍将对科学研究产生深远影响。

他认为未来 AI 将在 " 从类比中发现新结构 " 方面具有巨大潜力,尤其是在 AI for Science 的具体子任务中表现出色。

高能效计算是 AI 基础设施的下一场革命

面对当前大模型对算力的依赖已呈指数增长的问题,孙茂松教授引用数据显示,最新一代大模型训练耗资约达 100 亿美元,需 20 万张 GPU 卡支持,预计 2035 年将可能突破至 1 亿张卡。

沈亦晨回应称:

未来未必真的需要 1 亿张卡,但百万卡级别的计算已成为现实挑战。

他介绍了曦智科技在光互联和光计算芯片方面的进展:

通过光作为连接介质,可以极大提升芯片间通信带宽与效率,解决分布式模型训练中 " 多芯片如一芯片 " 的问题。

他进一步强调,要充分发挥光计算的高能效优势,需在算法层面推动向低精度(int4/int8)模型优化。

汪玉补充指出," 未来的关键是让底层硬件异构对开发者透明。" 即芯片无论是电计算还是光计算,对开发者应 " 看起来就是一台机器 ",从而保障工程系统的稳定性与迁移效率。

刘铁岩则抛出一种范式设想:

真正的人工智能下半场,将是 "Experience-driven AI"。

他设想一个分布式交互学习系统,由 100 万个机器人在物理世界中实时感知、同步数据和模型权重,实现全域智能协同。

这将超越大模型集中训练范式,形成全新的进化路径。

圆桌论坛精彩纷呈、交锋密集,无论是从 " 相关性与因果性 " 的基本认知出发,还是围绕 "token 预测范式 " 的边界问题,亦或是对 " 原创能力 " 与 " 算力极限 " 的前景评估,专家们均展现出深厚的理论思考与实践视角。

正如孙茂松教授在总结中所说:

大模型的有效性是经验主义的,但它的问题也是根本性的。真正的突破,有赖于我们在理论与系统两端都迈出新的一步。

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 人工智能 中关村 清华大学 北京
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论