作者 | 柴旭晨
编辑 | 周智宇
迅猛迭代的 AI 似乎正迎来一次关键的转折。
9 月 11 日,在 2025 Inclusion · 外滩大会," 强化学习之父 " 理查德 · 萨顿(Richard Sutton)指出,AI 行业处在 " 人类数据时代 ",今天大多数机器学习的目的,是把人类已有的知识转移到一个静态、没有自主学习能力的 AI 上。
问题在于,这一路线下,人类数据红利正逼近极限,而持续学习对智能的效用至关重要。他认为,AI 正在进入以持续学习为核心的 " 经验时代 ",潜力也将远超以往。
萨顿在发言中表示,我们正进入 " 经验时代 ",需要一种由智能体与世界直接交互中生成的新数据源。这正是人类和其他动物的学习方式,也是近期 AlphaProof 在国际数学奥林匹克斩获银牌的路径。
萨顿解释," 经验 " 指的是观察、行动和奖励,这三种信号在智能体与世界之间来回传递。" 知识来自于经验,可以从经验中学习。一个智能体的智能程度,取决于它能预测并控制自身输入信号的程度。经验是一切智能的核心与基础。"
他同时指出,强化学习带领我们进入了新的经验时代,但要释放全部潜力,还需要两项目前尚不成熟的技术——持续学习(continual learning)和元学习(meta-learning)技术。
面对外界对 AI 带来偏见、失业甚至人类灭绝的担忧,萨顿认为,这种对 AI 的恐惧被夸大了,并且是被某些从中获利的组织和个人煽动起来的。他指出,只有当每个人有不同的目标和能力,经济才能运行得最好。同样,目标不同的智能体,可以通过去中心化的协作实现双赢。
" 人类最卓越的超能力,就在于比其他任何动物都更擅长协作。人类最伟大的成功在协作本身——经济、市场与政府都是成功协作的产物,"
萨顿表示,AI 和人类繁荣将来自于去中心化协作。" 协作并非总能实现,却是世间一切美好事物的源泉,我们必须寻求协作、支持协作,并致力将协作制度化。"
展望 AI 的未来未来,他提出了四条现实的 " 预测原则 ":第一,对世界应该如何运转并没有共识,但没有哪一种看法能够凌驾于其他;第二,人类将真正理解智能,并借助技术将其创造出来;第三,当今人类的智力水平,很快将会被超级 AI,或者超级智能增强的人类远远超越;第四条,权力和资源会流向最聪明的智能体。
基于此,他认为在人类的发展进程中,AI 的替代将是不可避免的。
放眼宇宙的历史,萨顿将其分为四个时代:粒子时代、恒星时代、复制者时代和设计时代。他认为人类的独特之处在于 " 把设计推向极致 ",创造出能自己设计的事物,这也正是今天通过 AI 所追求的目标。人类至少是催化剂,更是开启宇宙第四大时代—— " 设计时代 " 的先驱。
"AI 是宇宙演化的必然下一步,我们应以勇气、自豪和冒险精神来迎接它。" 萨顿表示。
登录后才可以发布评论哦
打开小程序可以发布评论哦