三易生活 08-12
骁龙8至尊版2曝光,但最有看点的地方并不是跑分
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

虽然距离正式发布大概还有一个多月,但疑似骁龙 8 至尊版 2(SM8850)的跑分成绩已经在 GeekBench 的服务器上出现。

此次曝光的信息来自一台三星 "SM-S947U" 手机,所对应的可能是 Galaxy S26 Edge。从跑分来看,它在 GeekBench 6.4 中获得了单核 3393 分、多核 11515 分的成绩。

如果大家有关注我们三易生活的评测内容,那么对于这样的成绩就可能不会感到太过惊奇。毕竟,这只比现款骁龙 8 至尊版的典型跑分水准(单核 3000 上下,多核 10000 上下),高出了大概 10% 而已。

那么这是否意味着,骁龙 8 至尊版 2 的 CPU 性能进步幅度不大呢?并不尽然。一方面,根据更进一步的信息来看,这台三星手机在整个跑分过程中,CPU 的峰值频率只达到了 4GHz,而不是 " 满血 " 的 4.74GHz。这就表明它要么是遇到了过热节流问题,要么干脆就不是正式版的芯片或固件,所以频率就 " 没上去 ",并不能代表骁龙 8 至尊版 2 的真实峰值性能。

但这次曝光的信息中真正让我们感到 " 触动 " 的,压根就不是骁龙 8 至尊版 2 的跑分数字本身,而是 GeekBench 除了性能测试之外,所 " 探测 " 的到其他东西。

从 128 位到 2048 位,骁龙新旗舰多了 " 超算血统 "

我们先将视线集中在此次曝光的跑分截屏下方区域,在这里 GeekBench 列出了它所识别到的,骁龙 8 至尊版 2 所支持的一系列指令集信息。

从中可以清楚地看到,骁龙 8 至尊版 2 除了支持 " 古老的 "neon 指令集外,还支持 sve 和 sme2 这两个新得多的指令集。

这是什么概念呢?通过查询公开信息可知,neon 指令集诞生于 ARM v7 时代,最早见于 2005 年的 Cortex-A8 架构,它最大支持 128bit(位)的向量计算字长。

而 sve 和 sme2 则要 " 先进 " 得多,它们分别诞生于 2016 年和 2021 年,最初都是由超级计算机的 CPU 首发,用于 AI 训练等繁重的工作。所以这两个指令集最先进的地方,就在于它们都可以支持到最大 2048bit 的超大规模字长,甚至超过了目前 x86 服务器 CPU 所支持的 512bit AVX 指令。在它们被 " 移植 " 到移动平台后,这一关键技术特性也并没有被 " 阉割 "。

当然,这并不是说高通给骁龙 8 至尊版 2 增加这两个新的指令集,就一定与超算有关(虽然他们确实可能有借助 Oryon 架构重回超算市场的打算)。

它们真正的意义在于,一方面 sve 和 sme2 作为 ARM IP 体系下最新的、旨在增强处理器浮点性能的指令集,相比于古老的 neon,能够大幅增强现代 ARM 处理器在面对复杂多媒体任务的性能表现。说人话,就是能增强游戏、视频编辑等场景的 CPU 效率。而且这两个指令集在超算上本就是为 AI 而生,所以 " 移植 " 到移动端后,对增强 CPU 的 AI 计算能力自然就意义不小。

最新版的 Intel 指令集文档显示,AVX10.2 将强制大小核全部支持 512bit 计算能力

另一方面,关注 PC 行业的朋友可能知道,目前消费级 x86 CPU 普遍支持 256bit 加速运算的 AVX2 指令集。最快到 2026 年,英特尔就会在 NovaLake-S 平台加入 AVX10.2 指令集,实现全部核心的 512bit 加速运算功能。

而现阶段的高通 Oryon 架构,因为只支持最大 128bit 的 neon 指令集,就导致其在 PC 平台(也就是骁龙 X 系列)上运行需要 AVX2(256bit 指令集)的程序时,效率大受影响。因此当骁龙 8 至尊版 2 加上最大能够实现 2048bit 向量计算的这两个新指令集后,就让我们会对大概率也将采用新架构的下一代骁龙 X PC 平台的性能、以及 x86 转译的兼容性,有了更高的期望。

下一代是变强了,可这一代反而成为了 " 奇迹 "

如果大家以为,我们仅仅就只是因为骁龙 8 至尊版 2 引入了新指令集,可能会带来巨大的浮点性能改进而感到兴奋,就未免把事情想得太过简单了。

首先,大家都知道骁龙 8 至尊版是基于 ARM v8.7 IP 的架构设计,这意味着它在最底层的指令集上,要落后于苹果 A18 Pro、联发科天玑 9400、小米玄戒 O1 等竞争对手。因为后者全都是基于 ARM v9.2 的架构方案,从 " 根子上 " 来说,确实要比现在的骁龙 8 至尊版更先进。

苹果 A18 Pro,ARM v9.2,有 sve、也有 sme2

联发科天玑 9400,ARM v9.2 ,有 sve、无 sme2

小米玄戒 O1,ARM v9.2,有 sve、无 sme2

那么这是否意味着,上述的这几款 ARM V9.2 的处理器,早就已经能支持 sve、sme2 这些先进指令集了呢?我们同样找来了它们的 GeekBench 跑分信息。可以看到,其中只有 A18 Pro 确实早早就内置了 sve 和 sme2,而联发科和小米的 ARM V9.2 方案,就都只有 sve,并未配备 sme2 指令集。

从 ARM 的商业模式来说,哪怕大家都是 v9.2 代次的架构,具体内置哪些指令集其实也是 " 可选 " 的。所以苹果敢于早早地实装先进的浮点加速指令集,很大程度上是因为他们有封闭生态,所以有信心可以 " 督促 " 开发者尽可能积极地对新架构、新指令集做适配。

而其他家的 ARM v9.2 方案不选择 sme2,显然也不只是为了节约成本,而是多少有考虑到这一先进指令集在目前的安卓生态里还过于小众,即便硬件上了,也不一定能够促使开发者去主动进行适配。

但大家要知道,与它们同期的骁龙 8 至尊版,别说是没有 sme2(因为它是与 ARM v9 绑定,基于 v8.7 的 Oryon 自然就不可能有),就连 sve 指令集也并没有配备。

换句话说,如果高通的竞争对手真能在 2024 年底到 2025 年秋季的这段时间,充分地宣传 " 使用 ARM v9 CPU 的好处 ",并敦促那些游戏和大型 APP 开发者使用 sve 指令集,其实他们原本是有可能在性能上充分发挥出代次优势的。

可结果呢?大家都知道,无论是在本就支持 sve、sme2 的跑分软件里,还是在各主流游戏和生产力应用中,在上述这段时间里的那些、本来架构更先进的竞争对手,结果却并没有一个能够真正在 " 实际性能 " 上超越骁龙 8 至尊版。换句话说,也就是高通用了一个相对落后的底层设计,却做出了更好的实际表现。

要知道从以往的经验来看,这可不是一件容易的事情。比如早年间的英特尔 Monahans(即 PXA310)、英伟达 Tegra2,甚至包括高通自己的双核版本 Scorpion(MSM8260),都曾因为底层的指令集、架构缺憾,在市场宣发和 " 钱景 " 上遭遇了设计更完善竞争对手的 " 强烈冲击 "。可到了骁龙 8 至尊版这里,却完全颠覆了 " 落后(架构)必然挨打 " 的常识,硬生生地用较老的底层设计,打翻了一票明明更先进的竞争对手。

优势不只取决于硬件,骁龙的表现再次证明了这一点

那么,骁龙 8 至尊版到底是怎么做到这种 " 反杀 " 的呢?

从硬件设计层面来说,大家都知道骁龙 8 至尊版与同期的竞品相比有两个明显特征,一是主频要高得多,二是去掉了 L3 和 SLC 缓存,用超大的、带宽更高的 L2 缓存取而代之。也就是说,高通当时的 Oryon 架构或许在底层指令集上 " 有点老 ",但他们确实用了更高的成本,在硬件规模上堆出了当时 " 公版 ARM 架构 " 实现不了的超高主频和超大缓存。

相比之下,无论是同期的苹果和联发科,还是后来的小米,首先在处理器的部分单元设计上确实都呈现出逊色于高通的水准,至少它们都没能搞定那么恐怖的主频。

从部分平台明明用了 ARM v9.2 指令集,却 " 不愿意 " 实装 sme2 这个现象来看,所反映出的也不只是相关厂商想要节约成本这么简单。因为这实际上也体现出,它们对于说服开发者 " 抛弃 " 高通、专为自己做优化可能还缺乏信心。

其实这也很好理解。毕竟我们不久前在《高通攒了个 " 游戏生态 " 的局,再次秀出技术优势》中,报道过他们今年的 " 骁龙游戏技术赏 "。在此次活动中,比起高通的代表,来自各大手机厂商、游戏引擎平台、游戏开发者方面的登台时间显然要长得多。从这些合作伙伴对于骁龙 8 至尊版硬件性能、开发工具,以及性能优化套件的盛赞来看,高通如今所取得的成绩,显然不仅仅是来自于硬件设计或者分优势那么简单。

而这也就很直接地提醒了目前所有的芯片厂商,比起单纯地追求硬件规格、架构方面的领先,生态和软件建设在很多时候也能对市场表现起到关键性的作用。当然,如果在这个基础上,硬件还能做到足够强大,那自然也就更加 " 无敌 " 了。

【本文部分图片来自网络】

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

骁龙 arm 高通 超级计算机 三星手机
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论