财联社-深度 昨天
CPU重返数据中心C位 “某国内大模型厂商CPU需求提高了5倍”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

财联社 6 月 8 日讯(记者 付静)Computex 2026 电脑展期间,巨头们再次强调了一个行业趋势:通过 CPU、GPU、存储与网络高效协同构建系统级能力,才能真正释放 AI 规模化应用的价值。当 AI 迈向智能体时代,由于既要承载高密度 CPU 集群中的数据预处理、编排调度与任务分解等工作,又要在 GPU 智算服务器集群中承担主控 CPU 角色,CPU 正重返现代 AI 基础设施的中心。

日前,占据 " 主场优势 " 的英特尔已推出了 Intel 18A 制程首款数据中心 CPU,同时据财联社记者观察,芯片厂商均瞄准了 AI 浪潮中数据中心 CPU 的机遇,各巨头的 " 混战 " 已打响。

" 随着 AI Agent 兴起,CPU 在 AI 架构中重要性提升,需求明显增加,近四周以来,有多家公司 CEO 打电话联系,希望取得更多 CPU。" 英特尔 CEO 陈立武透露。

英特尔中国区技术部总经理高宇在最新接受财联社记者采访时表示," 今天,我们如果把 AI 数据中心当作未来世界的超级工厂的话,它的产出是 Token,它的生产机器有三台:一台是 GPU 集群,一台是 CPU 集群,一台是高性能存储集群。驱动这三台机器的都是同一个东西,英特尔至强处理器。"

英伟达 CEO 黄仁勋则在媒体见面会上表示,英伟达首款自研数据中心 CPU Vera 将比公司的 GPU 更受欢迎,因为 Vera CPU 在处理信息方面起着至关重要的作用,"Vera CPU 将成为我们新的主要增长动力。"

CPU 重返数据中心 C 位

今年以来,一组预测数据已经多次出现在媒体报道中:Agentic AI 需求带动下,数据中心领域 CPU 和 GPU 的配比将从传统的 1:8,慢慢变成 1:4、1:2 甚至 1:1

" 我们其实并没有严格计算过,但是我认为我们不要把它看作是数据中心内部,或者是单台服务器内部的比例,应该从全球的业务量去看。" 谈及上述比例,腾讯云计算产品运营总监周驰告诉财联社记者。

韩中工商联盟总会 AI 存储专委会委员长、芯枢科技总经理林美炳向财联社记者表示,实际上两类芯片无硬性固定架构配比,可随业务需求灵活调配。

林美炳向财联社记者举例称,AMD Helios 机柜中 CPU 与 GPU 配比为 1:4,英伟达 GB300NVL72 机柜中 CPU 与 GPU 配比为 1:2。另外,谷歌第 8 代 TPU 采用了 1 颗自研 CPU 搭配 2 颗 TPU 芯片的配比设计。

英特尔数据中心集团副总裁兼中国区总经理陈葆立还介绍,某国内领先的大模型厂商,从去年到今年 CPU 需求提高了 5 倍。"这是来自真实客户的反馈,至于说未来到底是不是 1:1 甚至更高,由于 AI 的发展还处于早期阶段,目前还很难下定论。"

无论数据中心 CPU 和 GPU 的配比重构实际进展几何,CPU 重返现代 AI 基础设施中心,已成行业共识。

IDC 预测,2026-2027 年,企业场景中的活跃智能体数量同比增长超 200%。而财联社记者从业内采访获悉,在智能体工作流中,绝大多数任务编排与工具调用相关的负载都运行在 CPU 上。

具体而言,CPU 负责以下几大核心场景:信息检索与工具执行,比如网页搜索、数据库查询、各领域相关 API 调用;流程编排与指令控制,包括智能体工作流的规划、管理及各模块之间的依赖关系处理;数据处理,如输入解析、摘要生成(如词法)、中间结果的处理。在许多智能体工作负载中,CPU 密集型操作往往占据了执行期的绝大部分,很大程度上影响了系统的端到端延迟。

林美炳告诉财联社记者,CPU 在 AI 时代回归核心地位的核心逻辑在于计算负载的结构性变化。传统 AI 计算以 GPU 为主导,但 AI Agent 的普及推动交互任务激增,涉及查询、调度、编排及互联互通等环节,这些任务主要依赖 CPU 执行,导致其在端到端延迟中占比高达 80%-90%。

美银证券预估,到 2030 年,全球服务器 CPU 市场规模将上看 1250 亿美元,年复合增长率 31%,其中 AI 服务器 CPU 占比将高达 77%。

财联社记者另从英特尔方面了解到,行业当前对数据中心 CPU 有三大核心诉求:提升性能密度,在减少机架空间的同时处理更多的任务;提升每瓦性能,降低 TCO;为关键业务部署提供高可靠性保障。

英特尔执行副总裁兼数据中心事业部(DCG)总经理 Kevork Kechichian 介绍,数据中心的客户需求广泛,工作负载分为三大类:需要高密度计算的横向扩展(Scale-out)工作负载和网络,需要平衡性能和数据吞吐量的通用工作负载,计算密集型和 AI 工作负载(包括训练和推理)。其中,AI 工作负载在过去几年快速增长,除了基础工作负载及当前以训练为主的 " 前沿模型 "(主要依赖加速器和 GPU 进行训练)之外,越来越多需求正向推理侧迁移。

芯片巨头 " 混战 " 打响

刚刚落下帷幕的 Computex 2026 电脑展,是业内多款重量级硬件新品的集中发布窗口,亦成为了芯片巨头们宣告 " 混战 " 打响的最佳舞台。

此次,Intel 18A 制程首款数据中心 CPU 至强 6+ 处理器正式推出。同时,英特尔面向中小企业入门级服务器还推出了 12 核至强 6300 系列处理器,目前已通过主流 OEM 厂商正式发售。

从具体参数看,至强 6+ 拥有 288 颗能效核,支持 8000 MT/s 的 DDR5 内存及 576MB 末级缓存(LLC)。同时,至强 6+ 采用了 PowerVia 技术(实现更短、更直接的供电路径,从而降功耗)、RibbonFET 技术(增强性能一致性)。

财联社记者还获悉,英特尔推出了一项硬件功能 Intel AET(英特尔应用能效遥测技术),支持数据中心运营商在工作负载层级实时查看 CPU 核心的功耗与运行状态,进而实现能效更优的资源编排、精准成本分摊,并针对负载优化应用落地能效激励机制。

至强 6+ 已在电信网络基础设施中进行测试,并开始配置到数据中心系统中,整个生态系统均有可用平台。其中包括来自华硕、戴尔、爱立信、技嘉、慧与(HPE)、联想、超微等厂商所提供,或在其方案中采用的服务器、网络和集成解决方案。另外,腾讯云基于全栈自研的星星海服务器,即将推出搭载至强 6+ 的新一代云服务器实例。

同时,英特尔、SambaNova 和富士康宣布计划构建基于至强处理器的机架级 AI 基础设施,并在 Computex 2026 现场展示了已具备量产条件的机架。按合作计划,富士康将为全新机架级 AI 基础设施提供系统集成支持,并计划制造一款高 CPU 密度的机架级基础设施变体。

近期,AMD 首席执行官苏姿丰也在台北表示,CPU 市场过去三四年时间里增长并不明显,增速可能在 3%-4% 左右,产业聚焦 GPU 方面。随着 AI 朝着推理和智能体方向发展,预计未来五年 CPU 市场每年将增长超过 35%,且这一领域的需求非常强劲。

智能体时代 CPU 价值被重估,至强及其竞品均迎来了机会。

不过陈葆立告诉财联社记者,现在市场非常火爆,(市场需求)是所有供应商都无法快速满足的。

他进一步谈到:" 过去两个月我跟我的工程师团队做了很多讨论。有友商一出来就宣称单靠一种 CPU 架构就能‘打天下’。后来我们研究后发现其实答案是否定的。第一,智能体应用以数量为优先,很多新的智能体在后台做各种工作,这非常适合核数多但单核性能不需要太高的处理器。第二,当智能体真正开始做事情的时候,所触发的任务负载完全不同。比如数据库极度消耗性能,当你需要调用 100 次数据库时,背后调用的其实是 100 个高性能核(P 核),而不是普通的轻量核。"

林美炳对财联社记者表示,CPU 市场将形成 " 传统 x86 双雄 +ARM 新锐瓜分增量 " 的三足鼎立格局。英伟达 Vera、ARM AGI 为代表的 ARM 架构快速渗透,三年内服务器 ARM CPU 份额有望实现大幅提升。同时,英伟达、谷歌、AMD 等大厂定制化 CPU、AI 芯片及网络芯片,推动生态分化;ARM 自身芯片聚焦通用场景,与厂商定制产品形成互补,共同推动生态演进。

Kevork Kechichian 预计,到 2030 年,现有数据中心底层架构仍将持续发挥价值,且会承载近 50% 工作负载。

谈及 ARM 和 x86 的竞争,英特尔方面称,"ARM 从 2009 年就开始布局服务器领域,多年来形成自身生态。但在今天的应用场景中,预计到 2030 年,全球在网运行的服务器部署量超过 8000 万台,其中 80% 依然是 x86 服务器。这得益于 x86 架构多年的积累、产品的成熟度、广泛的生态以及产业链的支持。"

当前,英特尔也在数据中心 GPU 战场积极进攻。英特尔最新披露了其下一代数据中心 GPU(代号 "Crescent Island")的更多技术细节。据悉,Crescent Island 基于 Xe 3P 架构,LPDDR5x 显存可提供 480 GB 容量,支持从原生 FP4/MXFP4 到 FP64 的广泛数据类型和微缩放格式,专为智能体系统打造,解决功耗与内存瓶颈。

财联社记者注意到,市场亦关注服务器 CPU 市场供需变化带来的价格波动。

此前有市场消息指出,英特尔 5 月对服务器 CPU 进行了年内的第三次提价,今年来累计涨价约 30%。不过,财联社记者问及 CPU 定价问题,公司方面未作明确回应。

林美炳表示,全球 CPU 供需紧俏格局或将延续至 2027-2028 年,其中商用服务器 CPU 年内价格稳步上行,行业确存供需缺口,但缺口幅度低于市场极端预判,终端需求扩容节奏整体理性可控。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

数据中心 ai 英特尔 gpu 财联社
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论