三易生活 前天
Arm全新IP解析:功耗值得关注,小核前景堪忧
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

最近这几天,Arm 在上海召开 Arm UNLOCKED 峰会,正式发布了面向移动端的 Arm Lumex 计算子系统(Compute Subsystem, CSS)。

什么是 Lumex CSS?用最简单的话来说,它其实就是 Arm 如今的一种 " 营销概念 "。Lumex CSS 至少包括 Arm 全新的 C1 系列 CPU 架构设计、G1 系列 GPU 架构设计、C1-DSU 核间总线设计,以及其他一些周边系统 IP 设计,全部 " 打包 " 起来的产物。

需要注意的是,Lumex CSS 并不等于完整的 SoC 架构授权,因为它本身并不包括 NPU、基带、电源管理、ISP 等许多常见移动平台的必备组件。这也是为什么今年 "Arm CSS" 这个概念最开始引发外界关注时,就有不少人辟谣 " 即便买了完整的 Arm CSS,也没法直接做成手机 SoC" 的原因。

当然,从目前网络中流传的部分信息来看,现有的各一线大厂,基本都是基于 Arm 的架构、甚至指令集授权去做二次开发。所以 Lumex 作为 " 官方公版 " 的意义,本质上还是与过去一样,主要针对的是自研能力不足的中小芯片厂商。

但即便如此,这并不意味着此次公布的 Lumex CSS 对于关注手机行业,对下一代移动设备平台好奇的朋友来说就没有意义了,因为深入探究其中的内容,还是可以发现不少有趣的、值得一讲的东西。

产品命名逻辑大改,但实际效果还有待商榷

首先正如前文中已经提及的那样,Arm Lumex CSS 这次包含了全新的 CPU 和 GPU IP。而且与过去 Arm 经常 " 只更新大核、不换代小核 " 的操作不同,这一次他们不仅将全部的 CPU、GPU 架构都进行了换代,并且将整个产品命名体系都做了很大的调整。

具体来说,Arm 发布了四款新的 CPU IP,分别是 C1-Ultra、C1-Premium、C1-Pro 和 C1-Nano。

从定位来看,C1-Ultra 代表的是旗舰 SoC 里的 " 超大核 ",也就是接替现在 Cortex-X925 的位置。

C1-Premium 代表的是 " 次旗舰大核 ",Arm 对它的解释是架构与超大核相同,但缓存没那么大,且使用密度库(也就是主频会更低、但能耗也更低)制造。换句话说,它其实相当于是将联发科之前用过的 Cortex-X4m" 转了正 ",正式独立为一条 CPU 产品线。

剩下的 C1-Pro 和 C1-Nano 就很好理解了,它们分别继承了 Cortex-A725 和 Cortex-A520 的产品定位。

与此同时,Arm 还发布了名为 "Mali G1" 的 GPU IP 家族。它从最入门的版本到最高配型号之间倒是并无架构区别,而仅以着色器核心数量进行版本区分。其核心数量可在 1 核心到 24 核心之间进行定制,并根据核心数量的不同,被区别为 G1-Ultra、G1-Premium、G1-Pro 至少三个级别。

但这里 Arm 既没有提到每个版本之间具体的核心数量标志差异,也并未说明是否存在入门款的 "G1" 或 "G1-Nano"。

新 IP 性能普遍提升,不过功耗值得注意

其实从命名逻辑来说,Arm 这一轮新品体系很显然是想要表达它们 " 全新的 "、" 与过去不同 " 的身份。另一方面,与过去的三位数字命名法相比,新的 IP 命名规律显然是想要让未来换代之后的 " 代次区分 " 变得更明显。比如将来的 G2、G3,大家很快就能知道比现在的 G1 更新,的确就会比现在 X925、A710、A520 这样的命名来得更易区分 " 新旧 " 关系。

但 Arm 现在的这种命名方式也带来了一个问题,那就是消费者更难直观地判断同代次之间的核心性能高低程度了。是的,C1-Ultra 当然要比 C1-Nano 快得多,但具体 " 快多少 " 呢,就更不方便进行判断了。

而且哪怕是对比上代产品,Arm 也并没有将新 IP 的性能进步幅度完全说清。

比如他们声称,与前代 " 超大核 "Cortex-X925 相比,C1-Ultra 的 IPC(单时钟周期性能)提升了 12%,微架构性能表现提升了 26%。

但 Arm 方面却没有给出 C1-Premium 相比于前代 " 次旗舰超大核 " 的性能改进幅度具体数据。虽然这可能是因为 X925 本身就没有次旗舰变体,要对比就只能找出前前代的 X4m,但也不排除新的次旗舰架构进步幅度没那么大、对比数据不够好看的可能。

相比之下,他们对于 C1-Pro 的性能进步幅度给出的数据又变得具体了起来。根据 Arm 方面的说法,与 Cortex-A725 相比,C1-Pro 在同等性能下的功耗要低 26%;如果是达到同等功耗,那么 C1-Pro 的性能将可以比 Cortex-A725 块 11%。同时如果两者均设定为相同的主频,则 C1-Pro 的性能最高可以比 Cortex-A725 高出 16%。

从这三组数据就可以知道,在相同主频的前提下,新的 C1-Pro 大核功耗其实是会比 Cortex-A725 略高一点的,但因为性能进步更大,所以算起来能效比依然是上涨了。

最后,则是 " 小核心 "C1-Nano。Arm 对于它的性能数据给得比较详细,但可惜从这些数据来看,C1-Nano 本身的改进并没有将重点放在性能上,而是更多地体现为面积的缩小、功耗的降低,以及支持最新的指令集。

按照 Arm 方面的说法,在 SPECint2017 中,C1-Nano 对比 Cortex-A520 综合跑分提升大约为 5.5%。在处理相同程序的前提下,它的能效提升了 26%。

最后,则是 Mali G1-Ultra GPU。Arm 方面表示,它在跑分软件和游戏中的性能相比上一代(G925)提升了 20%,同时单帧功耗降低了 9%。那么经过计算就可知,此时它的整体功耗其实是上涨了的,涨幅约为 9.2%。好在此时 G1-Ultra 的光追性能可以达到前代的两倍,对于未来可能出现的 " 重光追 " 手游来说,它依然有望带来远超 20% 的帧率提升幅度。

新的旗舰手机注定更快,但入门款则前途未卜

说了这么多,那么 Arm 的这一批新架构对于即将到来的新一代智能手机以及 SoC 来说,意味着什么呢?

首先必须要注意的一点,是无论在 Arm 的规划还是目前出现的传言中,新的旗舰移动平台都不可能使用 C1-Nano" 小核心 "。Arm 的说法,是顶级旗舰可能会使用两颗 C1-Ultra 搭配六颗 C1-Pro,我们甚至不排除厂商减少 " 中核(C1-Pro)" 数量、加入更多的 " 次大核(C1-Premium)",来换取更高跑分成绩的可能。

综合前面的分析以及行业里近年的动向来看,除非台积电的 N3P 工艺再度 " 发威 ",否则在各家大概率会在进一步提高旗舰 SoC 峰值主频的前提下,基于新 CPU、新 GPU 的新款旗舰平台,峰值功耗恐怕会有进一步的上涨、而非下降。

当然大家倒也不必紧张,因为新架构的 IPC 确实是提升了,这也就意味着在跑分之外的场景、包括重负载游戏,只要不出现新的 " 性能杀手 ",那么新旗舰的实际运行频率注定会比现在的平台更低。结果就是日常使用的能效肯定会有显著改善,甚至重负载游戏功耗都有可能会进一步降低。

相较之下,更让人担心的反倒是那些单纯基于 C1-Nano 的低功耗设备。虽然目前的各种证据显示,新架构客观上对比 Cortex-A520 的确有所改进,但一方面它的性能进步幅度显然比其他的 " 大核 " 们要小许多。另一方面,随着越来越多的旗舰、次旗舰平台 " 弃用 "CPU 小核,无论软件开发者、芯片设计厂商,甚至是未来的 Arm,都有可能会对小核的改进越来越失去 " 动力 "。

要知道在隔壁苹果的 Apple Watch 里,驱动手表的 CPU 架构早就已经是源自 A16 能效核的 ""Sawtooth" 方案,也就是缩小版的 " 中核(定位更接近 A725 或这次的 C1-Pro)" 了。对于主流消费电子产品来说,纯粹低功耗 " 小核 " 的退场,很有可能已经只是时间问题。

【本文图片来自网络】

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

arm gpu 上海 辟谣 芯片
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论