去年 9 月底,我们三易生活在 Intel Tech Tour(技术之旅)活动中,提前接触到了英特尔的 18A 制程工艺,以及使用这一工艺的消费级和服务器 CPU 产品线。

不过那时候,由于相关芯片大多还处于测试阶段,所以虽然 " 摸 " 到了实物,但实际得到的产品信息大多还是偏向架构、制程之类的理论值。
好在,英特尔方面显然对他们新的消费级处理器信心十足。所以就在 2026 年刚开始,他们就在 CES 2026(国际消费电子展)上,联合一众 OEM 厂商展出了大量基于第三代酷睿 Ultra 处理器的量产产品。仅仅几天后,我们也得到了更详细、基于量产产品和参考平台的各种实测成绩及细节信息。

当然,因为这些数据绝大多数其实已经在不久前结束的 CES 期间公布过,所以我们这次并不打算做简单的数据 " 复述 ",而是会从中挖掘出一些更细节,可能没人注意到的信息。
跑分的微妙变化,其中却藏着关键信息
如果大家有仔细看去年秋季揭晓的相关资料就会发现,英特尔在当时虽然已经给出了新架构与 LunarLake、Arrowlake 的性能对比数据,但在彼时的对比图表里,一方面并未明确指出所用处理器的具体型号,另一方面所用的测试软件也是对内存带宽敏感的 SPEC。这就不免 " 落下口实 ",让人容易以为英特尔是在有意制造数据差异。

但是在最新的官方数据中,英特尔已经 " 改正 " 了这些问题。一方面现在他们明确了参与对比的处理器分别是各架构的顶配型号,另一方面也将测试软件换成了更偏实际应用,且对内存速度没那么敏感的 CINEBENCH 2024。

结果在看似 " 不利 " 的条件下,第三代酷睿 Ultra(准确来说,是其顶配型号 388H)相比 LunarLake(288V)的同功耗多核性能,反而从此前的领先 50% 以上变成了领先超过 60%。哪怕是对比 " 看起来 "P 核数量更多(6P+8E+2LPE)的 ArrowLake(285H),新一代酷睿 Ultra 也快了 10%。

那么这意味着什么呢?简单来说,这就代表英特尔的 E 核、特别是 LPE 核在经过了数代的发展后,如今的 IPC 实际上已经越来越接近规模大得多的 P 核了。而且这还是在其 P 核、E 核的峰值主频,比前代都更低的前提下所取得的领先。

既然如此,未来我们会不会看到英特尔在消费级转向 " 全小核 "+" 超多核 " 设计,或是像当年以发展型 P6(酷睿)取代 P7(奔腾 4)路线那样,用小核作为主导重新推出 " 单一架构 " 的新处理器呢?从目前的信息来看,这个可能性似乎变得越来越大了。
核显进步超预期,更重要的是老产品也能获利
除了 CPU 部分的进步比去年秋季公布的数据更进一步之外,英特尔在 CES 2026 上公布的核显实测性能,也较去年刚披露时有了进一步的优化。

具体来说,拥有 12 核 "Xe3" 核心的 ARC B390 核显,在 45W TDP 下的平均游戏性能,就已经可以比 60W TDP 的 RTX4050 独显高出至少 10%。

请注意,这里有两个细节。一是英特尔明确表示,消费者现在更喜欢看 " 游戏实测 "、而不是 " 理论跑分 ",所以他们更改了显卡测试的呈现方式,不再强调 3DMARK 之类的跑分成绩,而是直接用游戏实测数据说话。
第二点就在于,英特尔公布的这些数据,甚至还是在没有开启多帧生成的前提下测得,而这就是他们目前最有 " 底气 " 之处。因为无论英伟达的 RTX40 系列、还是 AMD 的旗舰核显(Radeon 8060s),都因为各种各样的原因无缘使用各家最新的多帧生成功能。

相比之下,第三代酷睿 Ultra 处理器的核显,反而成为了目前在这个级别里,唯一自带多帧生成,甚至是支持 XeSS3 硬件 4 倍帧生成的方案。如果英特尔真的想要在游戏帧率上 " 作弊 ",完全可以打开这个功能来做对比。但他们并没有这么做。

此外我们还从英特尔方面了解到,ARC B390 的 4 倍帧生成功能并非 " 独占 ",它同样也会下放给英特尔过去的旧款核显以及独显产品。具体来说,只要是 MeteorLake 或之后型号处理器的核显,以及全系 ARC 独显,都将获得这一新功能的加持。
很显然,可以说英特尔这是看准了竞争对手目前产品线的弱点 " 有备而来 ",但这又能怪谁呢?只能说英伟达和 AMD 在对于老产品的支持力度上,如今确实不如英特尔做得有诚意。
NPU 算力相同、性能却有差?英特尔揭露了真相
最后,来看看第三代酷睿 Ultra 处理器在 AI 方面的一些官方数据,以及我们从中挖掘出的有趣细节。

根据英特尔方面目前的说法,第三代酷睿 Ultra 最高可以提供 180TOPs 的 " 平台算力 "。其中 120TOPs 来自 GPU,50TOPs 源自 NPU,剩下 10TOPs 则由 CPU 提供。
有看过我们三易生活此前一些相关内容的朋友可能还记得,对于绝大多数的 PC 来说,所谓 " 平台算力 " 这个说法其实都算得上是 " 耍流氓 "。因为在这些系统里,不同的部件往往并不能真正协同去计算一个 AI 项目。但英特尔是个例外,因为他们从一开始就有自家的异构应用接口(One API),只要应用程序支持,就可以发挥出处理器不同模块的 " 算力 "。

而且在第三代酷睿 Ultra 上,英特尔也格外强调了其 AI 引擎设计上的两个细节。一是它的核显与 NPU 都各自拥有独立的矩阵计算单元,且各自都能访问完整的系统内存池;二是它的 CPU、GPU 和 NPU 都支持 INT8、FP16 和 FP32 计算格式,因此才能确保真正的 AI" 异构融合 "。很显然,这也是瞄准了竞品在硬件架构上的 " 硬伤 "。
但英特尔在 AI 性能上曝光的 " 瓜 ",还没这么简单。比如他们表示,大家都用 NPU 运行同样大小的大语言模型,第三代酷睿 Ultra 的速度可以达到 AMD 锐龙 AI9 HX370 的 4.3 倍;而用 NPU 计算相同的 FP32 浮点项目,第三代酷睿 Ultra 的速度也有高通骁龙 X Elite 84-100 型的 2.6 倍速度。
这里我们我们提醒一下大家,第三代酷睿 Ultra 的 NPU" 理论算力 " 是 50TOPs,而 AMD 和高通被被拿来对比的处理器,它们集成的 NPU" 理论算力 " 同样也是 50TOPs。为什么明明理论算力相同的 NPU,实际测试的计算速度却有好几倍的差异呢?

这就不得不说到目前芯片行业在统计 " 算力 " 时经常耍的猫腻了,那就是大家普遍都只会用自家芯片 " 最擅长 " 的数据格式去声称算力水平。比如用低精度的 INT4 或 FP6 来统计算力,所以在遇到 INT8 或 FP32 的模型时,执行速度自然就会 " 缩水 " 数倍。
反之,当英特尔能够拿出明明是相同 "TOPs" 值,实际跑起来却要快上几倍的 AI 成绩时,似乎也表明他们的芯片架构设计,确实要更务实、更 " 实诚 " 些。


登录后才可以发布评论哦
打开小程序可以发布评论哦