
记者 郑晨烨
6 月 1 日,英伟达在台北电脑展期间举办的 GTC Taipei 2026 大会上发布了 Vera CPU,其同期发布的新一代 AI 超算平台 Vera Rubin,首批客户包括 OpenAI 和 Anthropic。
这是英伟达第一次推出独立的 CPU 产品线,英伟达过去 20 年的增长几乎完全建立在 GPU 之上。英伟达 CEO 黄仁勋在发布会上表示,在 AI 智能体时代,CPU 已经成为数据中心性能的关键瓶颈,不能让 CPU 拖慢 AI 工厂的 token(词元)生产速度。
此前的 5 月份,AMD CEO 苏姿丰在财报电话会上宣布,将服务器 CPU 的市场规模预测从 600 亿美元翻倍上调至 1200 亿美元以上,对应 2025 至 2030 年的复合年增长率从 18% 提高到 35%。
根据 IDC 统计,2025 年全球服务器市场规模达到 4441 亿美元,同比增长 80.4%,其中 AI 服务器贡献了大部分增量。瑞银在近期的半导体行业研报中预测,服务器 CPU 的潜在市场规模将从 2025 年的约 300 亿美元增长到 2030 年的约 1700 亿美元,5 年增长近 5 倍。
市场调研机构 Mercury Research 的数据显示,2026 年一季度 AMD 的服务器 CPU 收入份额达到 46.2%,英特尔为 53.8%。但 AMD 的出货量份额只有 33.2%,英特尔仍占到 66.8%。也就是说,AMD 用更少的芯片创造了更高的收入,高核数产品的溢价能力在这一个季度得到集中体现。
芯片说 ICTIME 首席分析师林美炳告诉经济观察报,CPU 是当前这一轮 AI 周期里最超预期的变量。AI 从对话走向 Agent(智能体),推理对 CPU 的需求量已经超过训练。
GPU 在 " 等 "CPU
英特尔与佐治亚理工学院在 2025 年 11 月联合发表了题为《以 CPU 为中心的智能体 AI 视角(A CPU-Centric Perspective on Agentic AI)》的论文。在这篇论文中,研究团队对五类典型的 Agent 工作负载进行了实测,结果显示 CPU 端工具处理所占用的时间,达到总延迟的 43.8% 到 90.6%。
一位长期跟踪半导体板块的券商分析师称,在大模型训练阶段,CPU 的工作量占比大约只有一到三成,某些工作负载可能达到近四成,绝大部分计算由 GPU 承担。这是因为 AI 大模型训练的计算过程高度规整,数以亿计的参数在海量数据上反复做矩阵乘法,GPU 的并行架构就是为这类任务设计的,CPU 在其中负责数据加载、通信调度和结果拷贝,不涉及核心的矩阵运算。
但到了推理阶段,这个比例开始翻转。CPU 承担的工作量占比上升到七成以上,Agent 场景下会更高。因为 Agent 任务需要多步推理、调用外部工具、执行代码、读写数据库、搜索网页,然后将中间结果编排成最终输出。
编程助手、数据分析工具、自动化研究 Agent 都属于这一类,也是目前大模型应用中增长最快的场景。这些工作的共同特征是控制流密集、分支复杂、输入输出频繁,GPU 面对这类串行、碎片化的任务利用率会明显下降。
多位业内人士表示,在 Agent 任务中,GPU 的整体利用率普遍不到 50%,远低于传统推理服务的 70% 到 85%。Agent 方式下 AI 部署的 token 消耗量通常是普通对话的 20 到 30 倍,因为一次用户交互背后往往包含数十次工具调用和中间推理。
据 IDC 预计,全球 Agent 年执行任务数将从 2025 年的约 440 亿次增长到 2030 年的超过 400 万亿次。
英特尔管理层在 2026 年一季度财报电话会上表示,AI 智能体时代每吉瓦功耗所需的 CPU 核心数可能从当前的约 3000 万增长到 1.2 亿。市场研究机构 Gartner 也预测,到 2027 年将有 40% 的 Agent 项目因基础设施成本超支而被收缩或取消,其中相当一部分超支来自 CPU 端持续产生的工具调用和上下文管理开销。
Agent 在处理长对话和复杂任务时会产生大量中间数据。AI 系统在推理过程中需要记住之前所有的对话内容和工具调用结果,行业术语叫 KV Cache(键值缓存),它会随着对话轮次不断膨胀,但 GPU 自带的存储容量非常有限,英伟达 H100 只有 80GB,下一代 B200 也只有 192GB,一个复杂的 Agent 任务产生的中间数据很容易就超过这个上限。
目前,业界普遍采用的办法是把这些中间数据从 GPU 转移到 CPU 一侧。CPU 可以外挂 DDR5 内存,单颗容量达到数 TB,比 GPU 存储大出一到两个数量级。
由英特尔、AMD、ARM 等芯片厂商组成的 CXL 行业联盟在 2025 年 11 月发布了 CXL 4.0 协议(Compute Express Link,一种用于芯片之间高速互联的开放标准),允许多颗 CPU 共享同一个大容量内存池,减少数据在芯片之间搬运的开销。
由此,CPU 不再只负责任务调度,还要负责 AI 推理过程中的数据存储和内存管理。
北京清微智能科技股份有限公司研发副总裁李彬称,当 AI 算力集群扩展到数千颗芯片直连的超节点规模时,芯片之间的互联和调度复杂度呈指数级增长,清微智能的方案已经可以实现 4096 颗芯片直连,互联成本较传统方案大幅降低。
李彬说,超节点技术本身并不新,是大模型的参数规模增长让这类架构有了用武之地,在这种规模的集群中,CPU 承担的协调和管理工作量远超小规模部署。
另外,CPU 本身在过去几年也经历了密集的技术升级。服务器 CPU 的核心数从 2017 年的 28 核,攀升到 2026 年的 288 核(英特尔 Clearwater Forest) 和 256 核(AMD Venice),密度提升接近 10 倍。
英特尔在 2023 年引入了 AMX(高级矩阵扩展)指令集,让 CPU 第一次具备专用矩阵计算单元。根据英特尔方面的测试数据,在深度学习推理场景下,搭载 AMX 的第四代至强处理器 AI 性能较前一代最高提升近 10 倍。内存子系统也从 DDR4 升级到 DDR5,单平台带宽和容量均实现翻倍。
核心数和指令集的升级,也对应着 CPU 与 GPU 配比的变化。英特尔 CEO 陈立武在 2026 年一季度财报电话会上说,训练场景下通常是 7 到 8 颗 GPU 配 1 颗 CPU,推理场景下收敛到 3 到 4 颗 GPU 配 1 颗 CPU,Agent 场景下有望进一步收敛至 1:1。
英特尔 CFO 大卫 · 辛斯纳(David Zinsner)在同一场电话会上补充表示,行业整体的 CPU 与 GPU 配比已从过去的 1:8 收敛至约 1:4。
十多年来首次大涨价
上述配比变化已经传导到产品定价上。
深圳一家 CPU 经销商的市场负责人贾彬告诉记者,从 2026 年 2 月起,英特尔和 AMD 陆续上调了全系列服务器 CPU 价格,整体涨幅在 10% 到 15% 之间,部分高端 AI 服务器 CPU 的现货溢价更高,下半年可能会有新一轮价格上调。
贾彬说,过去十多年,服务器 CPU 基本是 " 加量不加价 ",性能随制程提升,但单价维持不变,今年的涨价幅度在行业里很少见。英特尔主力产线的产能利用率已经从此前不足 80% 上升到 100%,多个型号处于缺货状态,交货周期在 3 到 4 个月。
AMD 同样面临产能紧张。贾彬说,2026 年是他入行以来第一次看到英特尔和 AMD 的服务器 CPU 产能基本被全部订满," 过去 CPU 的供给一直是充足的,今年反过来了 "。
贾彬还注意到,客户在采购 AI 服务器时对 CPU 的需求正在分化成两类。一类是机柜内部配合 GPU 运算的 CPU,追求极限核数,128 核以上,均价在 4000 美元以上,传统服务器 CPU 均价只有 2000 多美元。另一类是机柜外部独立部署的 CPU,用于 Agent 的工具执行、沙箱运行和任务编排,不需要极限性能,64 核左右就够,但数量要大得多。
贾彬说,每个 Agent 任务在理想状态下独占一颗 CPU,独立部署比虚拟化分区效率更高,柜外 CPU 均价约 3000 美元," 核数越高单价涨幅越大,不是按比例增长的。所以,柜外用中档产品铺量,柜内用旗舰产品保性能,是目前客户的普遍做法 "。
美银证券在 6 月 11 日发布的一份题为《智能体崛起(Rise of the Agents)》的半导体行业研报中,将 2030 年服务器 CPU 的总潜在市场规模(TAM)预测上调至 1700 亿美元以上,并首次将这个市场拆成三个部分:传统云计算 CPU 约 300 亿美元,AI 集群头节点 CPU 约 700 亿美元,AI 智能体独立节点 CPU 约 700 亿美元。其中,第三个部分在 2025 年的规模接近于零,是 2026 年才开始出现的全新市场。
摩根士丹利在 6 月 4 日的一份研报中也预测,智能体 AI 将在 2030 年前为服务器 CPU 市场带来 325 亿至 600 亿美元的新增需求。中泰证券在 6 月 7 日发布的 CPU 深度研报中将 2026 年定义为 "CPU 受益 AI 放量的元年 "。
上述美银证券研报还列出了一组出货量的历史对比:2022 年 AI CPU 的出货量相当于 AI 加速器(GPU 等)出货量的 19%,到 2025 年这个比例升至 51%,预计 2030 年将达到 127%。按照这个预测,AI 服务器中 CPU 的数量将在 5 年内超过 GPU。
国产 CPU 的新需求
英伟达在台北电脑展期间公布的信息显示,其最新发布的 Vera CPU 基于 ARM 架构(一种以低功耗和高能效著称的 CPU 指令集,与 x86 并列为两大主流架构),单机柜可部署 256 颗,采用液冷散热。
在 Agent 沙箱场景中,Vera 的性能是 x86 处理器的 1.8 倍。在英伟达最新发布的 Vera Rubin 超级计算集群(英伟达下一代 AI 数据中心平台)中,一个 40 机架的 POD(由多个机架组成的最小完整计算单元)包含 1152 颗 Rubin GPU 和最多 1088 颗 Vera CPU,两者配比接近 1:1。
英伟达方面还提到,此前发布的 Grace CPU 已累计出货近 250 万颗,2026 年 CPU 相关收入有望接近 200 亿美元。
贾彬认为,上述 200 亿美元的统计口径较宽,涵盖了 CPU 在多种产品形态中的收入归属,与传统意义上单独销售 CPU 芯片的收入不完全相同。但即便考虑口径差异,对一个 2024 年还没有独立 CPU 业务的公司来说,这个体量已经不小。
林美炳认为,英伟达做 CPU 的信号意义大于产品本身,过去 AI 服务器以 GPU 为核心,CPU 只是配套,当全球最大的 GPU 公司亲自做 CPU 并把首批客户锁定为 OpenAI 和 Anthropic,CPU 的市场地位已经和两年前完全不同。
根据 AMD2026 年一季度财报,该公司数据中心业务收入达到 57.75 亿美元,首次超过英特尔同期的 51 亿美元。并且,苏姿丰在财报电话会上提出了一个五年目标:数据中心年营收迈向 1000 亿美元。
英特尔 CEO 陈立武也在多个公开场合表示,他对 CPU 在 AI 时代的核心作用抱有坚定信心。
这对中国的 CPU 产业链企业也是一个机会。贾彬称,国内头部云厂商今年在加大服务器 CPU 的采购力度,一方面是为新建 AI 数据中心配套 GPU 采购 CPU,另一方面是因为 CPU 与 GPU 的配比从过去的 1:8 收敛到 1:4 甚至更高,同一个数据中心需要的 CPU 数量比去年多出一倍以上。
事实上,在国内,围绕服务器 CPU 已经形成了相对完整的产业链。
海光信息(688041.SH)是目前国内 x86 架构服务器 CPU 出货量最大的厂商之一。根据相关财报,海光信息 2025 年的营收为 143.77 亿元,同比增长 56.92%;2026 年一季度营收为 40.34 亿元,同比增速进一步提高到 68.06%。
海光信息副总裁应志伟告诉记者,AI 算力竞争已经从单一芯片的性能比拼转向系统级协同。海光是国内少数同时具备高端通用 CPU 和 DCU(AI 加速器)两条产品线的芯片设计公司,两条产品线的协同可以覆盖 AI 训练和推理的全场景需求。海光 C86 系列 CPU(兼容 x86 指令集)目前也已构建起超过 6000 家合作伙伴的国产开放生态。
应志伟表示,商业领域超过九成的存量应用基于 x86 架构开发,这种生态兼容性是海光在信创替换中的核心优势。另外,除了数据中心,边缘推理和具身智能也正在成为 x86 CPU 的新增量场景。比如,优必选、宇树等机器人厂商的主流方案目前仍以 x86 CPU 搭配 GPU 为主,x86 的软件生态在具身智能领域的先发优势明显。
根据公开信息,华为鲲鹏走 ARM 全栈自研路线,鲲鹏 920/950 与昇腾 AI 芯片深度协同,主要服务华为自有生态和信创市场。
在配套芯片方面,澜起科技(688008.SH)的主营产品是内存接口芯片(服务器 CPU 与内存条之间的信号中转芯片)。根据公开信息,其内存接口芯片在 2024 年以 36.8% 的市场份额位居全球第一;另一条产品线 PCIe Retimer 芯片(用于高速数据传输中的信号放大和修复),2024 年全球市场份额为 10.9%,排名第二。
在封测制造环节,根据公开信息,通富微电(002156.SZ)是 AMD 在全球范围内最重要的封测合作伙伴之一。
李彬告诉记者,国产芯片的软件生态正在接近一个临界点。他举了一个例子:DeepSeek V4 发布当天,多家国产芯片厂商在同一天内完成了适配,而此前 DeepSeek R1 的适配周期需要 1 到 2 个月。适配速度的大幅加快说明国产芯片的软件工具链和驱动层正在快速成熟,这对整个国产 CPU 和加速器产业链都是利好。
在林美炳看来,国产 CPU 的受益逻辑分为两层:一层是全球服务器 CPU 需求增长带来的行业增长,另一层是信创政策驱动的国产替代。
根据国资委 2022 年下发的相关文件要求,央国企要在 2027 年底前完成信息化系统的国产化改造。记者在采访过程中也了解到,国内高端服务器 CPU 的国产化率目前仍较低,替代空间广阔。距离政策节点还有不到 2 年时间,信创 CPU 的交付窗口正在收窄,这对海光信息、龙芯中科(688047.SH)等国产 CPU 厂商的产品成熟度和出货能力都是一次集中检验。
林美炳认为,当前这一轮 CPU 涨价周期和过去不同,增量来自 AI Agent 对 CPU 的全新需求,而非制程升级带动的换代需求。
应志伟的判断类似。他说,过去几年市场的注意力几乎全部集中在 GPU 上,但当 AI 应用真正进入大规模落地阶段,CPU 承担的调度和管理职能只会越来越重。在他看来,这不是 CPU 要取代 GPU,GPU 依然重要,但接下来真正拉开差距的是 CPU 和 GPU 之间的协同能力,而非单颗芯片的性能参数。


登录后才可以发布评论哦
打开小程序可以发布评论哦