雷锋网 前天
创纪录的288核至强服务器CPU,为什么离不开Intel 18A?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

9 月底在美国亚利桑那州举办的 Intel Tech Tour(ITT)上,英特尔预览了即将在明年正式推向市场的两款拳头产品,代号 Panther Lake 的英特尔酷睿   Ultra 处理器(第三代)PC 级处理器,以及代号 Clearwater Forest 的英特尔至强 6+ 服务器处理器。

这两款全新的处理器的共同特点是基于领先的 intel18A 制造工艺,以及背部供电技术 PowerVia。

" 两者结合,强上加强。" 英特尔公司客户端计算事业部副总裁兼中国区总经理高嵩说,"Intel 18A 制程技术的引入,至少为我们接下来三代产品的推出奠定了坚实基础。"

对于服务器处理器至强 6+ 而言,3D 封装技术 Foveros Direct 3D 也至关重要,先进制程 + 背部供电 + 先进封装是至强 6+ 能够实现创纪录的 288 核服务器 CPU 的关键。

"Intel18A 实现了更高的单元(cell)密度,结合 3D 堆叠封装技术,可将三级缓存与 CPU Compute Die 解耦。" 英特尔技术专家对雷峰网表示,"解耦之后就可以摆脱原来核心密度受到单个芯片尺寸的限制,可以将处理器核心数量从 144 个翻倍到 288 个"

对于英特尔来说,这应该是一种久违的自豪感。芯片产业最重要的环节莫过于设计和制造,设计一直是英特尔的强项,但制造技术英特尔在过去几年间面临挑战,如今重回世界领先水平的 Intel 18A 的量产,让英特尔的拳头产品的产品力拥有了大幅领先竞争对手的机会。

创造了整个 CPU 行业核心数量纪录的至强 6+ CPU,正是英特尔技术和产品力再次引领行业的积极信号。 

RibbonFET+ 背部供电技术,英特尔未来三代产品的基石

过去几年间,AMD 产品的成功离不开台积电全球领先的制造工艺,与此同时英特尔面临的巨大压力也来自其制造工艺遭遇问题。特别是,无论是在 PC 级处理器市场还是服务器处理器市场,Arm 架构处理器都获得了不小的成绩,也给英特尔增加了不少压力。

这也更能体现出 Intel 18A 对于英特尔的重要性,只有拥有了全球领先的制造工艺,才能让英特尔的产品具备显著的竞争优势,毕竟在芯片这个高度竞争的行业里,只有设计和制造能力顶尖才能拥有顶级的芯片产品。

Intel 18A 非常关键的是栅极环绕技术。过去数十年间,晶体管从二维的 MOSFET,到了三维的 FinFET,Intel 18A 采用了最新的三维堆叠 RibbonFET。

简单来说,栅极环绕 RibbonFET 可以进一步增强晶体管开关控制、响应速度,还能够显著抑制漏电。其优势在于同等频率下能够降低工作电压,或者在同等工作电压下提升驱动能力,每瓦性能的显著提升。同时,通过调节纳米片的宽度和层数,搭配上工作电压的不同阈值,可以在同一工艺平台上衍生出高性能或者低功耗等多种晶体管规格,拥有更高自由度。

"RibbonFET 技术不仅是物理尺寸上的微缩,还是对整个晶体管控制理念的重大创新,重新定义了控制逻辑,为下一步尺寸缩减预留了空间,可以让摩尔定律在 Intel 18A 及后续的节点上继续延展。" 英特尔技术专家表示。

RibbonFET 的创新想要发挥出全部价值,还需要 PowerVia 背部供电技术。

传统晶体管顶部堆叠多层金属互连层,用于供电和信号传输。然而随着晶体管的密度接近物理极限,正面的布线已经非常拥挤。PowerVia 改变了原有的思路,将供电网络下沉到晶圆背部,晶圆正面只保留了信号连接,这样被供电线占据的正面走线空间被释放,布局堵塞问题马上就被缓解。

但要将供电网络下沉到晶圆背面,背部供电需要采用纳米级的 TSV(硅通孔),这种 TSV 是常用 TSV 的 1/10,通过纳米级 TSV 可以直接通过更短的路径将电源从封装传递到晶体管内部,从而实现更高的电源布线效率。

根据测算,结合 RibbonFET 和 PowerVia,可以将单元利用率提高 10%,在相同功耗下性能提高 4%。

英特尔技术专家指出,"RibbonFET 技术可以释放晶体管的潜能,PowerVia 又为扫清了供电障碍,这两个技术共同支撑起了 Intel 18A 制程在密度和能效上的同步提升。"

通过 RibbonFET 和 PowerVia 的结合,英特尔给出的数据是,相较于上一代工艺,Intel 18A 的芯片密度提升到了前一代的 1.3 倍,有 30% 巨大提升,这意味着可以用更小的芯片尺寸,更低能耗实现更高性能。

另外,相比上一代工艺,在相同功耗下,每瓦性能提升超过 15%,如果达到相同的性能,功耗降低超过 25%。

实际上,除了英特尔,业界其他领先的芯片制造工厂也都在研究能给芯片带来显著收益的栅极环绕和背部供电技术,谁能率先量产就更有机会占领先机。

"Intel 18A 制程工艺已经开始量产,这个量产是在亚利桑那州 Fab-52 工厂开始,今年年底之前会有一个产量爬坡的过程。" 高嵩表示。

英特尔技术专家透露," 对比当前 Intel 18A 的生产数据以及过往 15 年里英特尔各个核心技术节点的数据,Intel 18A 当前的良率大于等于之前每一代节点。我们预计 Intel 18A 在 2025 年四季度能够达成大规模量产的良率目标。"

有了领先的先进制程作为基石,设计的提升将变得更加容易。 

288 核服务器 CPU 成功的关键—— 3D 封装

开篇已经解释过了 3D 封装对于至强 6+(Clearwater Forest)实现 288 核的重要作用,通过 Clearwater Forest 的架构能够更深刻地理解 3D 封装的重要价值。

Clearwater Forest 的最上层是计算模块(蓝色),支持 12 个计算单元,每个计算单元包含 24 个 Darkment 能效核。这 12 个计算模块通过 Foveros Direct 3D 技术焊接在 3 个有源基板上。

这里有两个关键,第一个是 Foveros Direct 3D 可以支持 9 微米量级的凸点间距,支持铜对铜的键合。Foveros 技术原理并不复杂,难点在于多个 Die 堆叠的时候,连接的精密度、以及整个拼接的完整度、信号的稳定性,以及全面封装之后的良率。

"Foveros Direct 3D 可以实现高密度、低电阻的晶片间互联,可以达到 0.05pJ/bit 的功耗 / 比特性能,0.05pJ 大概是 2.5D 技术所能达到的功耗的 1/10。" 英特尔技术专家说," 利用 Intel 18A 和 Foveros Direct 3D 技术,可以将 Clearwater Forest 的能效比达到前所未有的新高度。"

第二个关键是计算模块通过 3D 封装连接的是有源基板。

"Clearwater Forest 有源硅基板并不是传统的简单工艺,而是采用 Intel 3 工艺来支持更高的互联以及三级缓存。" 英特尔技术专家强调," 有源硅基板除了能够完成 Die 和 Die 之间的互联,还可以引入一些先进的逻辑和存储单元,从而实现更高的跨 die 间的互联以及更大的三级缓存。"

回到 Clearwater Forest 的架构,三个有源硅基板和分布在左右的两个 I/O 单元,通过 EMIB 形成 2.5D 的互联。最终,Clearwater Forest 在一个非常小的尺寸里堆叠了 29 个芯片。

堆叠带来的性能和能效收益很高,但也会面临更严峻的散热挑战。

英特尔技术专家对雷峰网表示,"3D 封装在横向散热过程当中带来了更大的热阻,确实在散热上会有更高的要求。PowerVia 的金属供电层分布在晶圆背部,也在一定程度上有助于导热。"

" 另外,至强 6+ 的设计目标是希望无缝兼容当前的至强 6 平台,因此已经考虑到了功耗的要求以及散热的系统边界条件,所以我们针对至强 6+ 散热上做了比较大幅度的优化,能够在核数增加、算力堆叠技术之后,依然可以维持 CPU 500W 的 TDP 的目标。" 英特尔技术专家同时表示。

至强 6+ 上使用的 I/O 单元和至强 6 的性能核处理器一致,可以实现无缝升级,这也是即将发布的 Clearwater Forest 即便实现了巨大的性能飞跃,名称是至强 6+ 而非至强 7 的关键原因所在。

但需要指出的是,288 核的 Clearwater Forest 基于 Birch Stream AP 服务器主板平台。这意味着,如果客户当前使用 Granite Rapids AP 服务器系统,可将 Granite Rapids CPU 平滑替换为 Clearwater Forest CPU,无需任何硬件改动,仅需软件更新即可直接使用。如果是使用至强 6E 能效核的系统,无法直接替换 Clearwater Forest AP CPU。

微架构升级,至强 6+ 计算性能翻倍

制程以及封装技术让至强 6+ 实现了更好的性能和能耗,Clearwater Forest 的 CPU 内核微架构上也实现了非常大幅度的提升。

对比 Sierra Forest(至强 6E)所用的 Crestmont 的内核,Clearwater Forest 使用的 Darkmont 内核在指令解码、分配、微操作队列、缓存窗口以及指令派发等方面都带来了 30%-50% 不等的性能提升。

算力单元的提升更加显著,包括标量算术逻辑单元、向量算术逻辑单元、地址生成单元、二级缓存带宽上都实现了翻倍的提升,从 4 个算术单元提升到 8 个,从 2 × 128bit 的向量计算,提升到 4 × 128bit 向量计算。

基于大量的提升,Darkmont 相比 Crestmont,在相同功耗情况下,可以带来每核 IPC 17% 的性能提升。

如果把整个功耗和性能的影响算在一起,相比 Crestmont,至强 6+ 处理器的 Darkmont 可以带来 1.9 倍以上的性能提升,同时在整体负载范围之内带来高达 23% 的能效提升,可以达到 8:1 服务器整合的效果。

这就意味着如果将至强 6+ 和第二代的至强处理器进行横向对比,使用 20 台机架 180 台至强 6+ 服务器就可以替代 70 个机架 1400 台第二代英特尔至强服务器,也就是 8:1 的服务器整合比例。

同时由于服务器和机架功率降低,可以降低整机功耗 750KW,降低 71% 的数据中心占用空间,同时提升 3.5 倍的性能 / 功耗比,每台机架上也可以增加 2.3 倍的虚拟机部署数量。

除此之外,Clearwater Forest 还有内存、安全性等方面的升级,支持多达 12 条 8000MT/s DDR5,整个 Clearwater Forest 支持 576MB 的末级缓存以及 96 条 PCIe Gen 5 的 I/O 通道,其中有 64 条支持最新的 CXL 技术。

Clearwater Forest 还引入了英特尔最新的应用能耗监测功能以及内置了完备的安全防护功能,即 TDX 和 SGX。

从设计、制造到封装,Clearwater Forest 每一个环节都实现了飞跃,将三项提升叠加,Clearwater Forest 能够带来的性能和能效的提升将会远超普通的产品代际升级,这是一次跨越式的升级,至于具体的产品以及最终的产品力表现,期待 2026 年至强 6+ 的正式发布。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

英特尔 intel 芯片 美国 arm架构
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论