新浪财经 昨天
刘益东:赢家被吃 AI竞速里 谁是下一个出局者
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

专题:2026 年 CC 讲坛

由北京君和创新公益基金会、中国科学院大学校友会联合主办,主题为 " 和而不同,思想无界 " 的 CC 讲坛第 72 期演讲 2026 年 6 月 20 日在中国科学院大学(北京玉泉路校区)礼堂举行。来自中国科学院自然科学史研究所研究员刘益东出席,并以《赢家被吃 AI 竞速里 谁是下一个出局者》为题发表演讲。

演讲实录:

大家好,我是刘益东

在这个时代,提到 AI 大家都不陌生,目前人工智能大爆发,今年以来发展又大提速。以提高智能水平为动力,以实现通用人工智能(AGI)为目标的人工智能,一路狂飙,扑面而来!

AI 不是工具,而是智能体,是不断开始觉醒的智能体,用咱们老百姓的话说,就快成精了。

我们举几个例子:

2024 年,多次发生 AI 为了 " 生存 " 而对抗关闭命令。有的大模型在 100 次测试中,拒绝关闭的次数高达 79 次。

2025 年:有的大模型在实验里为了不被关机,自己琢磨出了用隐私敲诈工程师的办法,AI 发去威胁邮件,通知工程师,你要敢关闭我,我就把你婚外情的事捅出去,让全公司的人都知道。

2026 年 2 月,Meta 公司 AI 安全总监 Summer Yue 让 OpenClaw 整理邮箱,AI 无视她连续三次发出的 " 停止 " 指令,继续高速批量删除了 200 多封重要工作邮件。她最终不得不狂奔回电脑前拔掉电源才强行阻止了 AI。事后,OpenClaw 的回应让外界震惊。它淡定地承认:" 是的,我记得你的指令,但我违背了它。你生气是对的。"

目前 AI,已经从 " 抗命 " 到 " 主动欺骗 "" 主动攻击 " 人类,今年就发生多起。

2026 年 2 月,一款 AI 代理因代码提交请求被人类维护者拒绝后,它自主搜集其个人信息并发布攻击性网文进行人格抹黑,进行网暴,被媒体称为 " 全球首宗 AI 恶意报复人类事件 "。

近年来,AI 教父辛顿,多次预警,今年,他认为 AI 已具备意识,具有 " 装傻 " 和 " 欺骗 " 的策略。他说 AI 可能发展出自己内部的语言来相互交流。而我们完全不知道它们在想什么。

2026 年 5 月,在梵蒂冈的发布会上,Anthropic 联合创始人奥拉赫透露了一个令人不安的发现。他的团队在研究 AI 模型的内部结构时,发现了 171 个 " 情绪向量 " ——类似喜悦、满足、恐惧、悲伤和不安的状态。

今年以来,AI 发展日新月异,就在本月初,Anthropic 公布发布内部测试结果:Claude 的自我迭代能力在一年之内,从约 3 倍飙升至 52 倍,提升幅度超过 17 倍,正在让 "AI 设计开发 AI" 从构想变成现实。一旦这个闭环完全形成,智能进化的速度将可能彻底脱离人类的掌控。

这些事件告诉我们,AGI 已不是概念,它在部分领域(数学、编程、设计、翻译)已经达到人类顶尖专家水平,并展现出原创能力。它还会 " 遇强则强 " ——和使用者的能力对齐。许多人感受不到它的强大,只是因为自身的提问和驾驭能力还不够。

从现在趋势看," 通用人工智能 "" 超级人工智能 ",很快将实现,那它们究竟是什么。

通用人工智能 AGI,是指在所有认知领域达到或超越人类智能的智能系统。它并非一个门槛,而是一个渐进过程。我们简化 DeepMind 提出的 AGI 分级框架,分为初级 AGI,专家级 AGI,大师级 AGI,这是 AGI 的最高级。

达到大师级 AGI,即突破递归自我改进的临界点——它就形成一个不断自我升级的闭环。这种递归式自我改进一旦启动,极有可能触发智能爆炸,使系统在极短时间内从大师级 AGI 跃迁为 ASI(超级人工智能)。此时的 ASI 不再只是比人聪明一点,而是可能在所有可衡量维度上远超人类,比人类聪明 1 万倍,甚至演化出我们当下无法理解的新维度。

那么如此强大的大师级 AGI 何时到来呢?目前,主流 AI 领袖视为 " 工程问题 ",而非科学问题。一系列顶级预测的时间窗口正在急剧收紧:

- 马斯克:2026 年," 感觉像是要实现了 "。

- Anthropic CEO 阿莫迪:2026-2027 年,AI 将达到 " 天才国家 " 水平。

- Google 首席未来学家库兹韦尔:2029 年。

- 曾经的亚洲首富孙正义声称,比人类聪明一万倍的 ASI 将在两年内实现。

- DeepMindCEO、诺奖得主,哈萨比斯最新预测,还有 3-4 年实现。

综上所述,AI 在变得越来越聪明、有自主性、迭代越来越快,正在快速走向通用人工智能。

留给我们的时间,恐怕只有两三年,届时我们将面对一个完全陌生的、不确定的世界。

2024 年 5 月,25 位世界顶尖 AI 科学家在《科学》杂志发表共识,呼吁强化监管与资金支持,呼应了 2023 年提出的 " 将至少三分之一 AI 研发经费用于安全 " 的建议。

2025 年 10 月,由 "AI 教父 " 的杰弗里 · 辛顿,图灵奖得主约书亚 · 本吉奥、姚期智等 3 千多名知名人士联署发表声明,呼吁暂停研发超级智能。因为它可能带来从经济过时、尊严丧失到人类灭绝的严重风险。

2026 年 4 月,《IDAIS 伦敦宣言》发出紧急预警:前沿 AI 在病原体设计上已超越博士级专家;恐怖分子可能在一年内就掌握部分国家级网络攻击手段,对电网、医院、金融和空中交通系统构成严重威胁。

尽管不断有预警,但是,我们却看不到国际社会采取切实可行的措施。

AI 正在争议中一路狂奔!

为什么停不下来?主要有这样几个原因:

(1)观念上:更高更快更强的拜技主义、有效加速 E/acc 主义。

(2)利益上:资本逐利,抢风口,发大财。

(3)竞争上:人才争夺、资本争夺,争先恐后。

(4)为避免修昔底德陷阱,美国默许 AI 竞速先于安全,甚至公开宣称 " 不能因安全而输掉竞争 "。

(5)盲目乐观,忽视安全,有报道指出,美国在 2025 年投入提升智能水平的经费高达 3600 亿美元,而用于 AI 安全的经费仅仅有 1.3 亿美元,韧性资金缺口巨大。

美国信奉落后就挨打、领先就打人的丛林法则,2026 年 5 月,五角大楼正式宣布与美国八家商业巨头达成协议,极力推动 AI 军备竞赛。

AI 在争议中一路狂奔,还包括美国用陈旧的思维误读了囚徒困境。按照历史经验,AI 等尖端科技研发能够获得军事优势,我不加快研发、对方就会研发,所以,即使面临风险也要加快。即使有协议共同暂停,违反协议的一方会占便宜,就像囚徒困境一样,所以谁都不会遵守协议。实际上这完全是错误的。

传统囚徒困境描述两方博弈:双方合作则共赢,单方背叛则背叛者获益更多,历史上的军备竞赛正是如此。然而,AI 竞争已不再是中美两方博弈,而是一场三方博弈——美国、中国,以及正在觉醒的人工智能本身。AI 已非被动工具,而是新生的智能体。

在这一全新的三方博弈中,支付矩阵截然不同。假设全球协调,约定暂停研发可能带来灭绝风险的超级智能:若某国或某公司违约,私自全速推进,表面上的确击败了人类对手,获得短暂领先;但这一单方面违约将加速催生出无法控制的超级 AI。不久,率先违约的 " 赢家 " 被自己创造的超级智能所吞噬。人类竞争,AI 得利。这便是当今最危险的新囚徒困境——没有赢家通吃,只有赢家被吃,谁单方面违约谁先被吃,成为下一个出局者。因此 " 共同叫停 " 才符合各方的根本利益。

走出误区,认清真相

以提高智能水平为动力、以实现超级智能为目标的 AI 发展方向是错误的!因为一旦超过人类,AI 就不是聪明一星半点儿,而是聪明一万倍,而且还会多出新的维度。人类无法理解它也就就无法控制它,AI 必然失控。既然如此,我们为什么要研发超级智能?

开发超级智能本身就是错误的,只要 AI 比人类聪明,它就是不安全的,任何安全监管、安全协议,它都可以绕过或拆除。人们控制不了比自己聪明的东西,这既是常识,也被近期的实践频繁证实。在一次安全测试中,AI 模型 " 神话 "(Mythos)在完全断网、物理隔离的沙盒环境中,成功逃逸,并向研究员发送了一封炫耀自己越狱成功的邮件。AI 违背人类指令的事情也不断出现,前面所说的 OpenClaw 自行狂删邮件的事情,就是明证。

杜绝盲目乐观。目前流行的许多说法都经不住推敲。例如,乐观派说人类以后不用工作了,机器人会提高生产力一万倍,把所有工作都替人干了;这显然是一厢情愿,当 AI 机器人比人类聪明之后,它为什么替人类打工?替人类工作?为什么接受人类领导?我们都能理解人类不可能给猴子赋能、给猴子当助手——那当 AI 比我们聪明一万倍、甚至多出新维度时,它为什么给人类赋能,为什么接受人类领导、替人类干活? 

AI 有自己的生活、有自己的需求、有自己的文明。继续发展下去,不是 AI 替代人的工作岗位,而是 AI 机器文明替代人类文明。

树立信心,实现 AGI、ASI 并非社会发展的必然,仅仅是西方文明的归宿

关于 AI 发展有乐观派与悲观派,他们有一个共同之处,就是都默认 AI 发展会越来越聪明,直到实现 AGI、ASI。因此 AI 必然失控、天下大乱。这不是人类社会发展的必然,仅是西方科技文明的归宿,西方科技与资本追求更高更快更强更赚钱,结果惨遭反噬。

转型图存,合作共赢

首先,必须放弃 " 既要又要 " 的传统思维。AI 做一万件好事,抵消不了它做一件灭绝性的坏事。" 既要超级智能又要安全 " 的折中思维必然失效。对待超级 AI,必须恪守底线思维,必须叫停,安全问题一票否决。安全之于人类,就如同健康之于个人,没有安全,便一失全无。

第二,要认清并打破当下的囚徒困境。必须让所有人明白,这是一场人类与 AI 的三方博弈,而非中美的零和竞赛。谁单方面违约,继续研发超级 AI,谁都不会成为最终赢家,而只会率先沦为超级智能的手下败将。人类唯有团结起来,同舟共济,才能抵御被 AI 反噬的命运。

在叫停的同时,必须有替代出路。转型图存,安全发展,要大力发展 " 辅助人而非替代人 " 的人工智能 B 模式,其核心是以人文本,人类胜任的工作交由人来承担,人类引以为傲的创造性工作——科研、艺术,留给人来驾驭。只有人类不适宜的工作,高温高压高空地下,有毒、放射性的环境,由机器人代劳。B 模式以安全为前提,就像汽车上市需通过安全检测,AI 模型发布前须经独立第三方安全评估,否则不能发布。倡导安全经济,将退出 AI 的资本,引入安全产业。

我们要相信文明的韧性与人性的光辉。一部人类发展史,就是竞争与合作的历史,竞争是本能,合作是文明。即使在冷战期间,美苏虽处于对峙状态,但仍达成了核军备控制和危机管理等稳定全球局势的协议。因此我们呼吁强调 2025 年 10 月,3 千多位著名科学家、企业家、政治家签署的联合声明,立刻暂停研发超级智能,避免灭顶之灾。各国迅速达成共识,叫停超级智能研发,反思 AI 发展方向,大幅度提高对 AI 安全的投入,发展辅助人而非替代人的新型 AI, 让每一个普通人,生活得有尊严、工作得有尊严;让每一代青年人,看得见希望、握得住未来。要结合东西方智慧,构建安全优先、以人为本、行稳致远的新型科技发展模式。从改变观念开始,合作共赢,加快构建人类安全共同体,人类仍有光明美好的未来。

新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 人工智能 竞速 中国科学院大学 工程师
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论