随着 AI 重心从训练转向推理,尤其是加速进入 Agentic AI 智能体时代,GPU 加速器、CPU 处理器的角色悄然间发生了翻天覆地的变化。
整个行业都意识到,GPU 为王的时代已经过去了,CPU 正在回归 C 位,重新成为数据中心算力需求的中流砥柱,尤其是 x86 架构。
在这种形势下,Intel 至强、AMD EPYC 这类产品的价值都得以愈发凸显。
正是在这种大背景下,Intel 最近正式发布了新一代至强 6+ 处理器,并举办了盛大的数据中心日活动。
Intel 全球副总裁兼首席市场营销官 Brett Hannath 指出,无论是通用计算平台还是 AI 平台,CPU 尤其是 x86 CPU 的核心作用都在于统筹编排、调度协调、全面把控,它的角色就是计算的基石,就像一个交响乐团的指挥。
随着 AI 推理和智能体 AI 的崛起,我们不再需要单纯、暴力地堆砌算力,更需要整个计算平台的协同作战,涵盖各种不同的工作负载和应用场景,统领 CPU、GPU 和存储、网络等各种组件,开发出真正落地的商业应用,而 CPU 正是其中的中枢大脑。
唯有如此,AI 尤其是智能体 AI 才能走出概念,变成真实体验,为企业带来实实在在的商业回报。
数据显示,2025 年中国 Token 调用量指数级增长到了 2.11 亿亿,其中 AI 推理数据量首次超过 AI 训练数据量。
我国《关于深入实施 " 人工智能 +" 行动的意见》中明确提出,预计到 2030 年,新一代智能终端、智能体等应用的普及率将超过 90%。
而在现实中,2026-2027 年中国企业的活跃智能体数量每年都会增长超过 2 倍,预计到 2031 年将达到 3.5 亿个。
正是在这一浪潮中,CPU 强势回归,并重新塑造 AI 智算中心的基础设施格局,因为无论智能体 AI,还是强化学习、物理 AI,恰恰都是 CPU 的拿手好戏。
从智算中心到企业级私有云,从部门级平台到员工个人办公,从家庭大脑到个人 PC,全场景的混合式 AI 部署,都离不开 CPU 这一核心角色。
原本在智算中心里 CPU、GPU 1:8 的配比,甚至会逐步变为 1:4、1:2 乃至是 1:1。
尤其是 x86 架构的 CPU,过去半个世纪以来一直都在默默支撑着全球的数据中心,而且这种统治力还将持续强化。
IDC 预计到 2030 年,全球新部署的服务器中,每 10 台里依然会有 8 台采用 x86 架构。
按照 Intel 的新思路,至强 6、至强 6+ 处理器通过在 "算力、存力、连接力、保障力" 四大方面的全方位提升,并依托 CPU、GPU、IPU 等单元的密切协同,兼顾算力效率与应用落地,将智能体 AI 真正转化为让全球企业触手可及的现实生产力。
其中,基于 P 性能核架构的至强 6 ( Granite Rapids ) ,主打更强的吞吐性能、更高性价比的 Token 供应,适合高性能的智能体 CPU 集群,或者为 GPU 集群提供机头支持。
基于 E 能效核架构的至强 6+ ( Clearwater Forest ) ,主打更高的并发度、更优的成本,适合高密度的智能体 CPU 集群。
至强 6+ 适合一系列关键的基础性工作负载,包括:
- 云基础设施:容器与虚拟机管理、编排与管理、服务与调度、负载均衡与网关;
- 多媒体处理:CDN、转码与流媒体、视频会议、图像处理;
- Web 与微服务:服务网格、代理服务器、Web 托管、内容管理系统、电子商务平台;
- 存储:分布式存储、冷数据及温数据存储层;
- 数据库:OLTP ( 联机事务处理 ) 、非关系型数据、文档数据库、KV 键值存储。
至强 6+ 是首款采用 Intel 18A 新工艺的数据中心产品,集成最多达 29 个不同模块,可提供最多288 核心 288 线程 ( 支持双路 ) 、288MB 二级缓存、576MB 三级缓存。
至强 6+ 还支持 12 通道 DDR5-8000 内存、96 条 PCIe 5.0 通道、64 条 CXL 通道、192 条 UPI 2.0 链路,热设计功耗 300-500W。
首次支持 AET 应用能效遥测技术,可以为运营商提供实时、工作负载级的 CPU 活动和能耗遥测数据,实现更节能的编排调度、更精准的成本分摊核算。
首次支持 SHA-512 加密算法和 SM3/SM4 国密算法,并继续支持 SGX、TDX 安全计算技术和 AVX2 加速指令集,集成 QAT、DLB、IAA、DSA 四大类 16 个加速器,具备 6 大类 52 项 RAS 可靠性能力。
封装接口采用和至强 6 6900P 系列相同的LGA7529,可以无缝兼容,便于企业客户在同一平台上部署不同系统,满足不同需求。
Intel 指出,至强 6+ 单个核心就能运行 4 个智能体,单颗处理器即可同时部署上千个智能体。
凭借最多 288 核心,至强 6+ 可以在单个 32U 液冷机架空间内,配置最多 128 颗、36864 个核心。
还有合作伙伴展示了基于至强 6+ 的高密度高能效全液冷机柜,做到恐怖的 160 颗、46080 核心,从而支撑几万乃至几十万个智能体并发运行。
后边你甚至会看到,这远不是极限……
为方便管理海量智能体部署,Intel 展示了全栈式的智能体运行中台方案,可以实时显示负载数量、CPU 和内存占用、启动速度、延迟、错误等等。
性能方面,根据官方数据,旗舰型号至强 6990E+ 288 核心对比上代至强 6780E 144 核心,性能平均提升 1.26 倍,能效平均提升 55%。
尤其是新加入的 SM3/SM4 硬件支持将相关加密性能提升了多达 15.2 倍,SHA-512 性能也高出 5.2 倍。
如果企业还在使用古老的第二代至强,至强 6+ 更是可以将同等性能机架服务器的所占空间,缩减至 1/9。
对比竞品 AMD EPYC 9965 192 核心,号称每线的性能和能效平均都能高出 30%,SM3/SM4 加密性能高 6.2 倍,SHA-512 性能高 2.6 倍。
当然,要想打造一整套高效的 AI 智算中心,只有一颗 CPU 处理器是不够的,需要存储、GPU 加速、网络等诸多系统组件的配合,做好系统级协同。
存储即存力方面,AI 尤其是智能体 AI 带动全球数据量呈现指数级增长,也对存储性能、密度、能效提出了更高要求,智能体 AI 应用更是十分注重海量小文件的高并发。
为此,至强 6+ 做了大量优化设计,包括更强的 I/O 处理能力、优化数据压缩与传输加速技术、更高的存储效率等等。
比如 Intel 与合作伙伴正在利用 PCIe 5.0 扩展能力,探索 24-30 盘位存储+2x400G 数据网络,部署高密度存储节点。
实测显示,NVMe SSD 多盘并行时,单盘性能可以到标称值的 80-100%,而且 24/26/28/30 盘一路增长下来,无论顺序读写还是随机读写,性能都可以做到完全线性增长,延迟则始终保持稳定。
至强处理器长期以来内置的 QAT 压缩技术,也找到了新的用武之地,尤其是大幅减少 KV Cache 占用空间、提升首词元延迟 ( TTFT ) 多达 4 倍,在当前形势下恰好缓解了对存储的需求压力。
代号 Crescent Island 的下一代 Xe3P 架构推理 GPU,搭配多达 480GB LPDDR5X 内存 / 显存,既能满足 AI 对于大容量、高带宽的渴求,又降低了成本。
它还支持从 FP4 到 FP64 的全数据格式,能效又特别高,整卡功耗仅 350W,风冷即可满足。
新一代以太网卡方案 E835,支持最高 200GbE 带宽和多种端口配置,而且功耗仅仅 12W,能效比竞品高出多达 90%。
搭配至强 6+ 平台,它可以提供硬件级的保护能力,还支持多种管理协议,提升运维效率,而长达 10 年的生命周期更可保障用户没有后顾之忧。
广泛的行业生态合作,一向是 Intel 的杀手锏,至强 6+ 也第一时间迎来了诸多软硬件伙伴的新方案。
云尖信息,GPU 智算服务器、通用计算服务器、高密度存储服务器,全面升级至强 6+,1U4S 单机柜可以做到 40000+ 核心,1U6S 单机柜更是恐怖的 60000+ 核心!
腾讯云,之前独家部署至强 6 ( Sierra Forest-AP ) 288 核心处理器的服务器实例,广泛用于微信 /QQ/QQ 音乐 / 腾讯广告 / 腾讯会议等业务,即将上线基于至强 6+ 的下一代服务器实例,基于星星海实验室的自研服务器。
金山云,基于至强 6+ 的第十代云服务器 SE10,已经开始内测,单路最高 264 核心、528MB 三级缓存,对比上代能效提升超过 10%,单路性能提升接近 140%。
还有新华三的 UniStor X20000 AI 数据存储平台、阿里云基于 QAT 技术的加解密和压缩 / 解压缩性能提升 4 倍,火山引擎基于 TDX 技术的 AICC 机密计算平台,等等。
最后是部分现场展示方案:
云尖信息 G7886X7,8U 双宽 16 卡 AI 服务器,双路至强 6/6+,提供 25 条 PCIe 5.0 插槽,支持 16 块双插槽宽度、600W 功耗的 GPU 加速卡,单机柜最高 64 卡。
中兴通讯 R6A00G6,智算服务器,双路至强 6/6+,支持 16 块双宽全高全长的 GPU 加速卡,还有 24 条内存、24 个 2.5 寸 SSD。
新华三
超聚变
中兴
联想
畅快算
立讯精密
睿启
宏创
【本文结束】如需转载请务必注明出处:快科技
责任编辑:上方文 Q


登录后才可以发布评论哦
打开小程序可以发布评论哦