阿里吴泳铭云栖演讲：超级人工智能ASI才是终极方向

导读

这场演讲揭示了一个正在加速逼近的未来：AI 不仅将重塑技术生态，更将重新定义人类文明的进程。这不仅是一场技术预言，更是理解未来几十年产业变革的底层逻辑。我们每个人都将以不同方式、不同程度地卷入和经历这时代的大浪潮。

来源 |9 月 24 日吴泳铭云栖主题演讲

摘编 | 智慧君

编者按：

在今年云栖大会的主题演讲中，阿里巴巴集团 CEO 吴泳铭提出了一个大胆而清晰的未来判断：AGI（通用人工智能）的实现只是起点，真正的终极方向是能够自我学习、自我迭代，并全面超越人类智能的超级人工智能（ASI）。他回顾了 AI 从 " 学习人 " 到 " 辅助人 "，再到未来 " 超越人 " 的三阶段演进路径，指出大模型将成为新一代操作系统，超级 AI 云则是未来的计算机。吴泳铭说，阿里将坚定走开源路线，全力支持开发者生态，并通过饱和式投入打造全球领先的 AI 基础设施，迎接即将到来的 ASI 时代。

（以下是演讲全文）

各位开发者朋友，大家上午好！

我觉得在我开始演讲之前，我想特别感谢一下支持整个中国乃至全球科技行业的开发者朋友。因为今天是云栖大会，我们算起来，云栖大会已经走过了十周年，但真正的云栖大会，起源于阿里云的开发者大会。我觉得是广大屏幕后面的开发者，推动了中国乃至全球的云计算、AI 和科技行业的发展。所以在演讲之前，我想特别给全球的开发者，以及今天到场的开发者，致以最高的谢意！

今天很高兴和大家再次相聚在云栖。每次站在这里，其实我都能感受到，都能感受到一种扑面而来的技术热浪和创新热情。在经历了几年 AI 的高速发展之后，AI 的演进路线在我们看来，已经看得越来越清晰。今天，我特别想和大家分享的是，我们对未来的判断，以及阿里巴巴的思考和行动。

1. 智能化革命——从 AGI 到 ASI 的必然之路

我们觉得当前的世界，一场由人工智能驱动的智能化革命，刚刚开始。过去几百年，我们看到，工业革命通过机械化，放大了人类的体能；信息革命通过数字化，放大了人类的信息处理能力。而这一次非常不同，因为智能化革命将远超我们的想象。通用人工智能 AGI，不仅会放大我们人类的智力，还将解放人类的潜能，为超级人工智能 ASI 的到来铺平道路。

最近的三年，我们已经清晰地感受到它的速度。几年时间，AI 的智力从一个高中生的水平，迅速提升到博士生的水平，还能拿到国际 IMO 的金牌。AI Chatbot 是人类有史以来，可能用户渗透率最快的功能，而 AI 的行业渗透率，将超过历史上所有的技术。我们看到，TOKENS 的消耗，每两三个月就会有翻一番的速度；最近一年，全球 AI 的投资总额，将会超过 4000 亿美元；未来五年，我们预计，全球 AI 的累计投入金额，将超过 4 万亿美元。这是人类历史上最大的算力和研发投入，我们相信，这必然将会催生更强大的模型，加速 AI 在各行各业应用的渗透。

我们看到，实现 AGI —— 一个具备人类通用认知能力的智能系统，现在从行业看来，已经成为确定性的事件。然而我们觉得，AGI 并非是发展的终点，而是全新的起点。AI 肯定不会止步于 AGI，它将迈向超越人类智能、能够自我迭代进化的超级人工智能，行业内称为 ASI 的系统。

我们知道，AGI 的目标，是将人类从 80% 的日常工作中解放出来，让我们专注于创造与探索；而 ASI，将作为全面超越人类智能的系统，有可能创造出一批超级科学家和全站的超级工程师。ASI 将以我们难以想象的速度，解决现在未被解决的科学和工程问题，比如攻克医学难题、发明新材料、解决可持续能源和气候问题，甚至助力未来的星际旅行。ASI 将以指数级的速度推动科技的飞跃，引领我们进入一个前所未有的智能时代。

2. 三阶段：学习人、辅助人、超越人

我觉得，根据我们的理解和判断，我们认为通往 ASI 之路，大概将经历三个阶段。

第一个阶段，我们称为 " 智能涌现 "，特征是 " 学习人 "。这个阶段，大家有非常清晰的感受，这是前两年的主要感受。过去几十年，互联网的发展为智能涌现提供了基础，核心是互联网将人类历史上几乎所有的知识、科学理论、书籍都数字化了。这些语言文字所承载的信息，代表了人类知识的全集。基于此，大模型首先通过理解全世界的知识集合，具备了泛化的智能能力，涌现出了我们现在使用最多的通用对话能力，可以初步解决人类的问题、理解人类的意图，并逐渐发展出思考多步问题的推理能力。现在我们看到，经过两三年的发展，AI 已经逼近人类各个学科测试的顶级水平，比如国际数学奥林匹克竞赛的金牌水平，AI 将逐渐具备进入真实世界、解决真实问题、创造真实价值的可能性。这是我们看到的 AI 发展过去几年的主线。

第二个阶段，我们称为 " 自主行动 "，特征是 " 辅助人 "。在这个阶段，我们现在刚刚处于开端。我们看到，AI 已经不再局限于语言的交流，而是具备了在真实世界中使用和制作工具、自主完成与数字世界和物理世界交互的能力，能对真实世界产生巨大影响。这正是我们当下所处的阶段。

实现这一跨越的关键，我们看到，背后首先是大模型的能力越来越强，具备了非常强的 Tool Use 能力，让大模型有能力去连接所有数字化的工具，完成真实世界的任务。回顾历史，人类加速进化的起点，是当我们开始创造和使用工具；现在大模型也一样，具备了使用工具的初步能力。通过 Tool Use，AI 可以像人一样，调用外部软件接口和物理设备，执行复杂的真实世界任务。

这个阶段，由于 AI 能够辅助人类、极大地提高生产力，我们看到它将快速渗透到各行各业，比如物流、制造、软件、商业、生物医疗、金融，以及科研领域等几乎所有的行业领域。

还有一个关键点，我们看到大模型的 coding 能力的提升，可以帮助人类解决更复杂的问题，并将更多的场景数字化。现在的 agent，我们看到其实还处于技术的非常早期，解决的主要任务，大部分还是一些标准化和短周期的任务。要想让 agent 能够像人一样，解决更复杂、更长周期的任务 —— 这个更长周期并不是一天，也许是一个季度这样的长周期任务，最关键的是让大模型的 coding 能力有一个巨大的提升。因为如果 agent 可以自主 coding，理论上就能解决无限复杂的问题，像工程师团队一样理解复杂需求，并通过自主完成编程、测试来实现。我们认为，发展大模型的 coding 能力，也许是通往 AGI 的必经路径。

未来，我们判断，自然语言就是 AI 时代的源代码，任何人用自然语言，就能创造自己的 agent。你只需输入母语，告诉 AI 你的需求，AI 就能够自己编写逻辑、调用工具、搭建系统，完成数字世界几乎所有的工作，并通过数字化接口来操作物理设备。未来，也许会有超过全球人口数量的 agent 和机器人，与我们一起工作，对真实世界产生巨大的影响。在这个过程中，AI 将能够连接真实世界绝大部分的场景和数据，为未来的进化创造条件。这一点我认为非常关键，AI 连接真实世界的所有原始数据，对 AI 未来的进化至关重要。

随后，我们觉得 AI 将会进入第三个阶段，我们称为 " 自我迭代 "，特征是 " 超越人 "。这个阶段，我们觉得有两个关键要素，这两个关键要素将会促成这个阶段跨越一个重要的拐点。

第一个关键要素，我们刚才已经讲到了：AI 在帮助人类解决复杂任务的过程当中，它将逐步连接几乎所有物理世界的场景和数据。目前 AI 进步最快的领域，我们看到的是内容创作、数学和 coding 这样的领域。那这些领域的特征是什么？AI 为什么能进步得特别快？因为这些领域的知识 100% 是人类定义的，人类定义和创造的内容都体现在文字里，这些文字所承载的知识和数据，代表了这三个领域百分百的原始数据。

但对于其他任何领域，包括更广泛的物理世界，今天的 AI 所接触到的，更多是人类归纳之后的知识，缺乏与物理世界广泛交互的原始数据，这些信息是非常有局限的。我举一个简单的例子：比如说我是一家汽车公司的 CEO，我们明年要迭代一款汽车产品，我们大概率会通过无数次的用户调研，或者内部讨论，来决定下一款汽车将要具备什么样的功能，与竞争对手相比，我们要实现哪些方面的长板、保留哪些方面的能力以缩小差距。我觉得这些事情，现在的 AI 其实还很难做到，核心点在于，它所获得的数据和信息，全都是我们的员工或合作伙伴调研来的二手数据。

那如果有一天，AI 有机会在一夜之间，把这款汽车 365 天生命周期之内所有用户交互的数据、所有用户与它交互的操作、所有用户的投诉、所有用户给公司打电话的反馈，全部读完所有资料和数据，它可能创造出来的下一款汽车的定义，会远远超过我们现在通过无数次头脑风暴所创作出来的下一款汽车的定义。这只是人类世界中一个我们现在能想到的例子而已，更何况更复杂的物理世界科学规律，这些远远不是通过人类现在归纳的知识，就能让 AI 理解的。

所以，我们觉得 AI 要进入更高的阶段，就需要直接从物理世界获取更全面、更原始的数据。就像我们看到，在自动驾驶的早期阶段，只靠人类总结的 rule based（基于规则）的方法去实现自动驾驶，其实无法达到很好的效果；而新一代的自动驾驶系统，大部分采用端到端的训练方法，直接从原始的车载摄像头数据中学习，实现了更高水平的自动驾驶能力。所以即便是我们现在看来好像相对简单的自动驾驶问题，仅仅依靠人类归纳的知识，其实也无法很好地解决，更何况整个复杂的物理世界和社会环境。只让 AI 学习人类归纳的规律，其实是远远不够的。只有让未来的 AI 系统与真实世界持续互动，获取更全面、更真实、更实时的数据，才能更好地理解和模拟世界，发现超越人类认知的生成规律，从而创造出比人类更强大的智能能力。

第二个关键要素，我觉得在第三个阶段非常重要，我们称为 "self learning"（自我学习），也就是让模型能够自我学习。随着 AI 渗透到更多的物理世界场景、理解更多物理世界的数据，我们相信 AI 模型和 agent 的能力也会越来越强。未来，它们将有机会为自己的模型升级搭建训练架构，为自己的模型升级优化数据流程、升级自己的模型架构，从而实现 self learning。这会是 AI 发展的关键时刻。

随着能力的持续提升，未来的模型将通过与真实世界的持续交互，获取新的数据并接收实时反馈，借助强化学习与持续学习机制，自主优化、修正偏差，实现自我迭代与智能升级。每一次交互都是一次微调，每一次反馈都是一次参数优化。当经过无数次的场景执行，以及与真实世界结果的反馈循环后，AI 将自我迭代出超越人类的智能能力，一个早期的超级人工智能系统将会成型。

所以，如果我们的科技一旦跨过刚才所描述的这个基点，人类社会就会像按下了加速键，科技进步的速度将会超越我们的想象，新的生产力爆发将推动人类社会进入崭新的阶段。这条通往超级人工智能的道路，在我们眼前正在日渐清晰。

3. 阿里的战略选择与未来愿景

随着 AI 技术的演进和各行各业需求的爆发，我们觉得 AI 也将催生整个 IT 和科技产业的巨大变革。在这个巨大变革当中，我们有两个关键判断。

第一个判断：大模型是下一代的操作系统。并不是说大模型替代了 Windows 或者 Linux 这样的操作系统，而是我们觉得，大模型以及相关的系统，在整个物理世界和数字世界的交互当中，将承载现有操作系统的地位。未来，几乎所有连接真实世界的工具接口，都将与大模型进行链接；所有用户需求和行业应用，将会通过大模型相关的工具执行任务。LLM 将会是承载用户软件、agent 与计算资源交互调度的最核心中间层，成为 AI 时代事实意义上的 OS。

做一些简单的类比：自然语言可能就是未来 AI 时代的编程语言，agent 就是未来的新软件，context 就是新的 memory（内存）；大模型通过 MCP 这样的接口，链接各类工具和 agent，类似 PC 时代的总线接口；agent 之间又通过 A to A（agent to agent）这样的协议，完成多 agent 之间的互相操作和交互，类似我们现在各个软件之间交互的 API 接口。

所以，大模型将会 " 吞噬 " 软件。大模型作为下一代的操作系统，将允许任何人使用自然语言创造无限多的应用。未来，几乎所有与计算世界打交道的软件，可能都是由大模型产生的 agent，而不是现在由各个软件公司创作的商业软件。潜在的开发者将从几千万变成数亿，甚至数十亿的规模。以前由于软件开发的成本问题，我们看到只有少量高价值的场景，才会被工程师开发出来变成商业化的软件系统；未来，所有终端用户都可以通过大模型这样的工具，非常低成本地满足自己的需求，所以任何长尾的场景都有可能被数字化。

同时我们也判断，模型的部署方式也会多样化，它将运行在所有的计算设备上。现在主流的通过调用 API 的方式来使用模型，我们看到其实只是 AI 发展的初级阶段，做个类比，这非常像早期甚至没有 PC 时代的主机时代的分时复用阶段 —— 当时每个人只有一个带 memory 的 terminal（终端），去连接大型主机做分时复用。但我们看到，这种方式其实无法解决我们现在系统中很多关键的问题，比如无法解决数据持久化、缺乏长期记忆、实时性不够、隐私无法保障、可塑性不足等。未来我们相信，模型将运行在所有计算设备当中，并具备可持久记忆、可塑性，能够实现端侧与云端联动的运行状态，甚至可以随时更新参数、自我迭代，类似我们今天的 OS 运行在各种环境之中。

正是基于这个判断，阿里巴巴做了一个重要的战略选择：通义千问选择开放、选择开源路线，我们的目标是打造 AI 时代的安卓系统。我认为在 LLM 时代，开源模型创造的价值和能够渗透的场景，将会远远大于闭源模型。我们坚定地选择开源，就是为了全力支持开发者生态，与全球所有开发者一起，探索 AI 应用的无限可能。

我们的第二个判断：超级 AI 云就是下一代的计算机。大模型是运行于 AI cloud（AI 云）之上的一个新的 OS，这个 OS 可以满足任何人的需求。每个人都将拥有几十个甚至上百个 agent，这些 agent 24 小时不间断地工作和协同，需要海量的数据和计算资源。

数据中心内的计算范式，我们看到也在发生革命性的转变：从以 CPU 为核心的计算，正在加速转变为以 GPU 为核心、以大模型驱动的 AI 计算。新的 AI 计算范式需要更稠密的算力、更高效的网络、更大的集群规模，这一切都需要充足的能源、全站的技术，需要数百万计的 GPU 和 CPU 协同，网络芯片、存储、数据库在数据中心内高效运作，并且能够 24 小时处理全世界各地的需求。这需要超大规模的基础设施和全站的技术积累，只有超级 AI 云，才能够承载这样的海量需求。

我们觉得，未来全世界也许只会有 5-6 个超级云计算平台。在这个新的时代，AI 将会替代能源的地位，成为最重要的商品，驱动千行百业每天的工作。绝大部分 AI 能力将以 TOKEN 的形式，在云计算网络上产生和输送，我们觉得 TOKEN 就是未来的 " 电 "。

在这个崭新的时代，阿里云的定位也要做一个改变：阿里云的定位是 " 全站人工智能服务商 "。我们将提供世界级领先的智能能力，以及遍布全球的 AI 云计算网络，向全球各地的开发者提供开发者生态友好的 AI 服务。

同时，阿里云还提供一站式的模型服务平台 " 百炼 "，支持模型的定制化以及 agent 的快速开发；同时提供 agent 运行环境 " 灵码 Q" 等一系列开发者套件，让开发者可以方便地使用模型能力和创建、使用 agent。

其次，阿里云运营着中国第一、全球领先的 AI 基础设施和云计算网络，是全球少数能够做到软硬件垂直整合的 AI 云计算平台。在硬件和网络层面，阿里云自研的核心存储系统、网络架构、计算芯片，构成了阿里云大型计算集群中最坚实的底座。阿里云正在全力打造一台全新的 AI 超级计算机，它同时拥有最领先的 AI 基础设施和最领先的模型，可以在基础设施架构设计与模型架构设计上协同创新，从而确保在阿里云上调用和训练大模型能够达到最高的效率，成为开发者最好用的云。

AI 行业的发展速度远超我们的预期，行业对 AI 基础设施的需求也远超我们的预期。我们正在积极推进 3800 亿的 AI 基础设施建设，并计划追加更大的投入。从我们现在看到的 AI 行业远期发展规律，以及当前客户需求的角度出发，结合我们的远期规划，为了迎接 ASI 时代的到来，对比 2022 年这个 " 深层次 AI 元年 "，到 2032 年，阿里云全球数据中心的能耗规模将提升 10 倍。这是我们的一个远期规划，我们相信通过这样的饱和式投入，能够推动 AI 行业的发展，迎接 ASI 时代的到来。

所以我觉得，如果 ASI 时代真的到来，我们很多人，包括我们团队内部开会思考时，也会讨论：未来 AI（从 AGI 到 ASI）的能力越来越强，甚至出现超越人类智能的 AI 系统，那我们人类和 AI 将如何相处？

我对未来充满乐观：超级人工智能到来之后，人类和 AI 将形成一种崭新的协同方式。这种协同方式，其实我们现在在工作中已经能看到雏形 —— 比如程序员可能已经感受到了，我们可以下一个指令，通过 Coding 这样的工具，让它在晚上 12 个小时内，就能创造出我们需要的一个系统。从这里，我们看到了未来人与 AI 共同协同的早期雏形。

所以我们觉得，从 "Vibe Coding"（协同编码）到 "Vibe Working"（协同工作），未来每个家庭、工厂、公司，都会有众多的 agent 和机器人 24 小时为我们服务。也许未来，每个人都需要使用 100 张 GPU 芯片来为自己工作。

我对未来充满乐观：正如 " 电 " 曾经放大了人类物理力量的杠杆，ASI 将指数级地放大人类的智力杠杆。过去，我们消耗 10 小时的时间，只能获得 10 小时的结果；未来，我们的 10 小时，可能产生十倍、百倍的价值杠杆。

回顾历史，每次技术革命解锁更多生产力之后，都会创造更多的新需求，人类也将会变得比历史上任何时候都强大，也会比任何时候都繁忙。

最后我想强调：一切才刚刚开始。AI 将重构整个基础设施、软件和应用体系，成为真实世界的核心驱动力，掀起新一轮的智能化革命。阿里巴巴将持续投入，与合作伙伴和客户一起，让 AI 深入产业，共创未来。

祝大家度过一个充实愉快的云栖大会！谢谢大家！

—— · END · ——

为您推荐：

预告：华人学者 " 家族企业传承治理第一人 " ——香港中文大学范博宏教授家族传承治理专栏即将推出，敬请关注后续连载！

华夏基石管理咨询集团

中国管理咨询的开拓者和领先者

彭剑锋、黄卫伟、包政、吴春波、杨杜、孙健敏领衔

战略丨营销丨研发丨生产丨运营丨品牌

企业文化丨组织人力丨 AI 应用

咨询合作扫码

感谢阅读和订阅《管理智慧》，为了便于您及时收到最新推送，敬请星标本公众号。

宙世代

一起剪

相关标签