“苏妈”上海行：Agent时代CPU不够用了

记者郑晨烨

" 过去的大语言模型，你问它问题，它给你回答，这很酷。但这个阶段正在过去。"5 月 19 日，美国超微半导体公司（AMD.US，下称 AMD）董事会主席、CEO 苏姿丰在上海的 AMD AI 开发者日上说。

在半导体行业，CEO 们大多有自己的绰号，英伟达的黄仁勋被称为 " 黄教主 "，苏姿丰则被叫作 " 苏妈 "。苏姿丰 2014 年出任 AMD CEO 时，这家公司已濒临破产，市场普遍认为 AMD 已经没有翻身机会，12 年后的今天，AMD 市值接近 7000 亿美元。

苏姿丰认为 AI 正在进入 Agent（智能体）时代，Agent 需要自主拆解任务、规划步骤、调用外部工具、处理数据、检查结果，这些编排和调度工作全部由 CPU 完成，GPU 只负责其中 " 调用模型做推理 " 的环节。

在苏姿丰看来，数据中心里 CPU 与 GPU 的配比正在从过去的 1:4 甚至 1:8，向 1:1 靠拢。

两周前的 5 月 6 日，AMD 发布了超出市场预期的 2026 年一季度业绩：当季营收约 103 亿美元，同比增长 38%；其中数据中心业务收入 57.75 亿美元，同比增长 57%。同期，英特尔（INTC.US）数据中心收入 51 亿美元。

根据市场研究机构 Mercury Research 发布的 2026 年一季度数据，AMD 在全球服务器 CPU 市场的营收份额达到 46.2%，创历史新高。

在 2026 年一季度业绩交流会上，AMD 把 2030 年全球服务器 CPU 市场规模预期上调到 1200 亿美元以上，对应年复合增速从此前的 18% 提升至超过 35%。

从 1:4 到 1:1

事实上，在 2025 年 11 月的一场投资者交流活动中，AMD 给出的 CPU 市场年复合增速预期还只是 18%。但在 2026 年 5 月 6 日的一季度业绩交流会上，苏姿丰表示，基于当前观察到的需求信号，公司已将这个预期增速上调至超过 35%。

在上述业绩交流会上，苏姿丰认为，服务器 CPU 的需求可以分成三类。第一类是传统的通用计算需求，增速相对温和。第二类是作为 GPU 头节点的 CPU。在数据中心的服务器集群里，通常需要 CPU 来管理和调度旁边的 GPU 运算，这颗 CPU 就是 " 头节点 "。第三类是专门为 Agent 工作流服务的 CPU，负责任务编排、数据处理和工具调用。

苏姿丰表示，在上述三类 CPU 中，增速最快的是第三类，即专门为 Agent 工作流服务的 CPU。

5 月 19 日，苏姿丰在上海又谈到了这个趋势。她说，未来每个人可以同时拥有 5 个、10 个甚至 100 个 Agent，" 想想你能多做多少事 "。

每个 Agent 运行的时候，都在持续调度 CPU。Agent 执行任务的流程大致如下：先把目标拆分成若干子任务，然后依次调用不同的 AI 模型做推理，模型和模型之间需要传递数据，中间可能还要去调用搜索引擎或者从企业内部的数据库获取额外信息，拿到结果后做汇总检查，如果发现结果不对，就重新规划再来一轮。

在上述 Agent 执行任务的流程中，GPU 只在 " 调用模型做推理 " 这一步起作用。其余每一步，分配任务、搬运数据、调用外部工具、检查结果、重新规划，都由 CPU 完成。

也就是说，Agent 处理的任务越复杂，中间来回的步骤越多，CPU 的工作量越大。

在 AMD 的上海活动现场，零一万物 CEO 李开复在与苏姿丰的对话中亦提到，2024 年行业关心的是 AI 能不能通过考试，2025 年是能不能完成工作流，2026 年是能不能代替一家公司的某个职能部门。

李开复认为，Agent 经济本质上是推理经济。和大模型训练不同，推理对延迟极其敏感，多个 Agent 之间协作时，响应时间需要控制在 100 毫秒以内才会流畅。他说，单个 Agent 的能力有上限，真正的方向是多智能体架构，让擅长规划的、擅长执行的、擅长风控的多个 Agent 分工协作，像一个委员会一样运转。

李开复还说了一句：如果你的 AI 部署没有改变公司季报上的某个数字，那你做的只是在运营一个 AI 实验室。

根据 Mercury Research 2026 年一季度数据，AMD EPYC（霄龙）服务器 CPU 按营收计算的全球市场份额达到 46.2%，按出货量计算为 33.2%，两项均创历史新高。营收份额比出货量份额高出 13 个百分点，原因是面向 AI 和云计算场景的高端 EPYC 服务器 CPU 全球出货占比在提升，拉高了单颗 CPU 的均价。

2026 年一季度，AMD 服务器 CPU 收入同比增长超过 50%。苏姿丰在上述业绩会上给出的二季度指引更高——同比增速超过 70%。她同时表示，这个增长势头会延续到 2026 年下半年和 2027 年。

值得注意的是，CPU 需求的快速增长并非 AMD 的一家之言。英特尔 CEO 陈立武在 2026 年一季度业绩电话会上也表示，CPU 与 GPU 的比例正在从 1:8 向 1:4 走，还会继续向 1:1 方向发展。

虽然眼下 GPU 仍然是 AI 算力的核心需求，但 CPU 正在成为 AI 基建中增速最快的品类之一。

中国机会

李开复在与苏姿丰的对话中还提及，中国开发者和大模型公司承受不起美国闭源模型所需的算力成本，" 出于绝对的必要性，找到了一条路 "，即用工程效率和开源协作来弥补硬件资源的不足。

李开复说，中国企业对数据主权的要求很高，不愿意把核心业务数据发送到云端，AMD 本地化部署的方案 " 契合了中国企业的需求 "。

对本地部署和数据主权的需求，是 AMD 在中国市场看到的机会所在。对此，苏姿丰强调 " 中国是驱动我们产品路线图的核心部分 "，AMD 在北京、上海、深圳和中国台北设有研发中心，中国团队超过 4000 名工程师，上海研发中心是 AMD 全球规模最大的研发基地之一，EPYC 处理器目前为中国主要云服务商的超过 700 个云实例提供支撑。

值得一提的是，上海这场 AI 开发者日是 AMD 首次在北美以外地区举办的 AI 开发者日，现场来了超过 2000 名开发者。AMD 在活动上还宣布，面向中国 AI 开发者推出免费的 GPU 开发者计划，同时与阿里云旗下的魔搭社区（ModelScope）进行合作。

魔搭社区是中国规模最大的开源 AI 模型托管和开发平台之一，开发者可以直接在社区的在线开发环境里选用 AMD GPU 运行 AI 任务，不需要自己装驱动或做额外配置。

阶跃星辰是当天活动上另一个值得关注的参与者，该公司由前微软全球副总裁姜大昕创立，总部位于上海，是国内头部大模型公司之一。该公司核心管理层包括董事长印奇（旷视科技创始人）、CEO 姜大昕、首席科学家张祥雨和 CTO 朱亦博。

朱亦博在当天活动上分享了阶跃星辰与 AMD 的合作进展，该公司今年 2 月发布的 Step 3.5 模型大约 2000 亿参数，专门针对 Agent 任务优化。这个模型经过压缩处理后，体积大幅缩小，可以在搭载 AMD Ryzen AI Max 处理器、配备 128GB 统一内存的笔记本电脑上完整运行，推理速度接近每秒 100 个 token。

每秒 100 个 token 是什么概念？这个速度接近甚至超过很多云端大模型在线服务的响应速度，而它跑在一台可以装进背包的笔记本上。朱亦博说，未来的方向是端云协同——日常的、对隐私敏感的任务在本地跑，只有特别复杂的任务才需要调用云端大模型，本地推理的 token 成本趋近于零。

AMD 工程师刘畅当天在一台搭载 Ryzen AI Max 处理器的笔记本电脑上做了现场演示，用本地部署的通义千问大模型运行了三个 Agent 协同工作的医疗问诊辅助系统，全程没有连接网络。

他还演示了开发者的 " 晨间简报 "Agent，在人睡觉时自动从 GitHub、掘金等技术社区抓取当天的重要信息并按优先级排序，GitHub 是全球最大的开源代码托管平台，掘金是国内开发者常用的技术内容社区。

刘畅说，同样的工作如果调用云端 API 每天至少花 25 元人民币，本地运行不花钱。

发力 GPU

除了越来越乐观的关于 CPU 需求的预期，在 GPU 方面，AMD 也在加速推进。

英伟达在数据中心 GPU 市场的份额目前超过 90%，但 AMD 正在拿到越来越多的大客户订单。

AMD 的 GPU 产品线面向数据中心的品牌叫 Instinct，对应英伟达的 A100、H100 等产品。目前 AMD 即将量产的最新一代数据中心 AI 芯片是 MI450，AMD 的服务器 CPU 产品线品牌叫 EPYC（霄龙）。

今年 2 月，Meta 与 AMD 签了覆盖多代产品、总计 6 吉瓦算力的订单，包含基于 MI450 架构的定制 GPU 和第六代 EPYC 服务器 CPU。此前，AMD 还分别与 OpenAI、甲骨文达成大规模算力部署合作，其中甲骨文已宣布将部署 MI450 GPU。

MI450 计划今年三季度开始向客户交付，四季度进入大规模出货。

苏姿丰在 2026 年一季度业绩会上就曾表示，AMD 对 2027 年数据中心 AI 业务 " 实现数百亿美元年收入充满信心 "。她还透露，AMD 计划在下半年启动 Helios 的量产。

Helios 是 AMD 新推出的机架级 AI 计算系统，把自家的 Instinct AI 芯片和 EPYC 服务器 CPU 装进同一套机架里统一调度，和英伟达目前最高端的 NVL72 机架方案属于同类产品。

宙世代

一起剪

相关标签