一、前言:能与 Zen 5 不相上下的 E-Core
如果一个月前有人告诉你 1 款拥有 16 个大核的高性能笔记本能有 23 小时续航时间;Intel 低功耗核显的游戏性能强于桌面版 RTX 3050……
没人会相信。
但是现在 Intel 真的做到了!
1 月 6 日,Intel 发布了新一代的 Panther Lake 处理器,也就是酷睿 Ultra 3 系列。
这是一款足以颠覆大多数 DIY 玩家认知的革命性产品,也是当今最优秀的移动处理器,没有之一!
今天搭载 Panther Lake 的笔记本正式上市,旗舰型号为酷睿 Ultra X9 388H。
下面我们就来看看这款产品到底做了哪些技术上的革新!
1、与 Zen 5 不相上下的 E-Core

酷睿 Ultra X9 388H 拥有 4 个代号为 Cougar Cove 的 P-Core,另外还有 8 个 E-Core 和 4 个 LP E-Core 则都是 Darkmont 架构。
整数性能方面,Darkmont 核心拥有 8 个标量 ALU 和 7 个标量 AGU,这个数字与此前酷睿处理器的 P-Core 相当,是前代 E-Core 的 2 倍。
Zen4 拥有 4 个 ALU 和 3 个 AGU、Zen 5 则分别是6 个和 4 个。
从这方面来说,相同频率下,Darkmont 的整数性能可以超越 Zen5!
至关重要的 ROB 乱序重排序缓冲区(Reorder Buffer),它是让处理器性得以充分发挥的关键因素。
早前的 Intel Atom 凌动处理器没有乱序执行能力,而代号为 "Gracemont" 的初代 E-Core 则有 192 个 ROB 条目指令。
现在 Darkmont 将这个数字提升到了 416 个,这是什么意思呢!
Zen 4 拥有 320 个 ROB 条目指令,Zen5 则是 448 个。
也就是说 Darkmont 的乱序执行能力远超 Zen 4,与 Zen 5 接近。
现在再来说浮点性能!
Panther Lake 之前的 P-Core,内置 2 个 256bit 浮点 AVX 2 单元,Darkmont 则是 4 个 AVX-128 浮点单元。
在处理 AVX256 指令集时,Darkmont 是通过将 2 个 128-bit FPU 合并运算来实现,此时的性能表现与前代的 P-Core 大致相当。
但在处理器 AVX128 指令集时,拥有 4 个 128-bit FPU 的 Darkmont 的性能就能达到前代 P-Core 的 2 倍。
这样的核心再将它称为小核明显不再合适,事实上 Intel 也一直反对 " 大小核 " 的称呼。
因此在某种意义上我们可以说,酷睿 Ultra X9 388H 拥有 16 个完整的大核心(P-Core)。
由于时间和篇幅关系,我们不再对 Panther Lake 的性能核 "Cougar Cove" 做过多描述,你只需要知道它是增强版的 P-Core Pro Max 就行。
2、比桌面版 RTX 3050 更强的Arc B390 核显
上代的 Arc 140V 拥有 8 个第二代 Xe2 核心 1024 个流处理器),整体性能基本持平 Radeon 780M。

Arc B390 采用了与Arc B580 相同的新一代的 Xe3 架构,不同的是将制程工艺从台积电 N5 升级到了 N3E。
Xe3 架构用的是可伸缩扩展的渲染切片设计,12Xe GPU 的每个切片包含 6 个 Xe3 核心,6 个光追单元,以及 6 个采样器、几何单元、光栅单元、HiZ 单元 ( 层次 Z ) 、两个像素后端等模块。。
而每个 Xe3 核心具有 8 个 512 位的矢量引擎,8 个 2048 位的 XMX 引擎,64b 原子操作支持,一个升级版的 256KB 的 L1/SLM 缓存。

Arc B390 设计了 2 渲染切片,共拥有 12 个 Xe3 核心,1536 个 FP32 单元(也可以说是 1536 个流处理器),12 个光追单元和 96 个 XXM AI 引擎,16MB 二级缓存。
与前代 Arc 140V 相比, Arc B390理论上提升了 50% 的性能,而实际游戏帧率则能提升 70%(是不是很魔幻),当然也远远超越了 AMD Radeon 890M GPU,整体性能与桌面版 RTX 3050 相当。
能将 16 个大核、强悍的 Arc B390 GPU 整合在一起,背后的功臣自然是 Intel 18A 制程工艺。
3、Intel 18A 制程工艺
Intel 18A 标志着半导体制程工艺的一次重大突破,尤其是它首次加入了两大全新革命性技术:RibbonFET 全环绕晶体管、PowerVia 背部供电。

先说背上供电,它是将传统上位于晶圆正面的供电电路,转移到背面,这是 Intel 的独家技术。
这一做法为晶圆正面节约了 10% 的空间,一定程度上提升了晶体管密度。
更大的好处就是有效减少压降 ( IR Drop ) 最多达 30%,提升芯片运行频率最多 6%,进一步提升了 Panther Lake 的能效表现。

至于 RibbonFET 全环绕晶体管,它其实是 GAA 全环绕晶体管结构的一种实现方式,台积电、三星也都有类似的技术,但具体设计各有各的特色。
RibbonFET 采用 4 条垂直堆叠的纳米带 ( Nano Ribbons ) 结构,使得栅极能够完全包围沟道,再加上沟道结构和栅极控制的优化,相比传统 FinFET 立体晶体管结构,驱动电流可增强 20%,晶体管开关速度可提升 15%。
同时,它还能有效减少漏电现象,支持八个不同的逻辑阈值电压,芯片设计也可以更加灵活。
另外,RibbonFET 还融入了 Intel 的诸多工艺创新,包括全新的栅极光刻工艺、功函数工程优化、短沟道效应控制等等。

两大技术的融合,使得 Intel 18A 对比 Intel 3 综合能效提升最多 15%、同等性能下功耗降低最多 25%、芯片密度提升 30%。
4、酷睿 Ultra X9 388H 处理器

酷睿 Ultra X9 388H 处理器包含 4 个 P-Core、8 个 E-Core 和 4 个 LP E-Core,拥有 18MB 三级缓存。
其中 P-Core 每核心拥有 3MB 二级缓存、加速频率 5.1GHz、全核频率 4.8GHz。
E-Core(Darkmont)有 2 组,每组 4 个核心,共享 4MB 二级缓存,基础频率 1.6GHz、加速频率 4.0GHz。
4 个 P-Core 和 8 个 E-Core 共享 18MB 三级缓存。
另外还有 1 组单独存在 LP E-Core(Darkmont),也是 4 个核心,共享 4MB 二级缓存,基础频率 1.6GHz、加速频率 3.7GHz。
由于 LP E-Core 的性能已经足够强悍,日常低负载使用时,Panther Lake 都可以做到完全关闭 P 核和 E-Core。
低负载办公场景下,仅开启 LP E-Core 的酷睿 Ultra X9 388H 的整个 SOC 功耗可以控制在 1~3W 以内,笔记本整机功耗则是 4W 左右,配合 99Wh 的锂电池,轻松实现 20 小时以上的续航。

本次我们将会使用联想小新 Pro 16 GT AI 元启笔记本进行酷睿 Ultra X9 388H 处理器的首发评测。
它内置了 9.6Gbps 速率的 LPDDR5X 32GB 内存,99Wh 大容量锂电池,一块支持 HDR1000 的 16 英寸 OLED 屏幕。


登录后才可以发布评论哦
打开小程序可以发布评论哦