雷科技 11-10
苹果M4 Ultra性能爆杀英伟达,Arm成芯片市场的超级变量
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

自从苹果在 10 月份发布了搭载 M4 Pro 和 M4 Max 的 MacBook Pro 后,M4 系列芯片的性能表现就引起了很多关注。但是,了解苹果产品线的朋友都知道,M4 系列还有一个隐藏 BOSS —— M4 Ultra 尚未发布。

虽然 Ultra 型号缺席了前代 M3 系列,但是 M2 Ultra 的性能却给大家留下了深刻印象,加上很早之前就曝光 M4 Ultra 已经流片,无疑让人们对这颗苹果的真 · 旗舰芯片性能有了很大期待。

在海外媒体的推算中,如果 M4 Ultra 采用与 M2 Ultra 相似的架构设计,也就是将两个 Max 版芯片通过 UltraFusion 封装技术连接在一起,那么 M4 Ultra 的 GPU 性能应该会是 M4 Max 的 1.7 倍左右。

再结合 M4 Max 在 Geekbench 6 的 GPU 测试中得到的 197754 分,M4 Ultra 的 GPU 测试得分大概率会在 330000 左右,作为对比,目前消费级的最强显卡 RTX 4090 得分也只有 310000-320000。

图源:Max Tech

M4 Ultra 爆杀 RTX 4090?这个消息恐怕老黄看了都要做噩梦,不过也有人提出疑问:M4 Ultra 的 GPU 真的能有这么高的性能吗?在实际使用场景中真的能媲美 RTX 4090 吗?

M4 Ultra 虽然还未发布,但是我们可以从已经发布的 M4 Pro 和 M4 Max 上一窥这个系列芯片的性能表现。如果单看 Geekbench 6 的测试结果,你会发现 M4 Pro 的得分属实恐怖,在单核测试中以 3925 的成绩超越了 AMD 和英特尔的最新桌面端旗舰处理器,而在多核测试里,也明显领先 Ryzen 9 9950X,仅略输于酷睿 Ultra 9 285K。

至于性能定位更高的 M4 Max,则是在单核、多核测试中均碾压了 Ryzen 9 9950X 和酷睿 Ultra 9 285K,让整个 PC 市场感受到了苹果的强大。而且,在测试中 M4 系列芯片的核心主频及核心数都明显低于两个对手,只有 4.5GHz,但是却展现了更高的单核及多核性能。

可怕吗?很可怕。要知道酷睿 Ultra 9 285K 和 Ryzen 9 9950X 都是桌面端处理器,满载功耗均超过 200W,而 M4 Pro 和 M4 Max 却是 MacBook Pro 的移动端芯片,足见其能效比之高。

以目前 M4 Max 的性能推算,采用两颗 M4 Max 芯片组合而成的 M4 Ultra 在多核性能上或将达到 45000 分,是酷睿 Ultra 9 285K 的两倍。单核性能则一般不会有太大提升,不过仍然会高于 M4 Max,成为目前消费级市场的最强处理器。

再来看看 GPU 性能,曝光称其跑分会超过 RTX 4090,而依据则是 Geekbench 6 的 GPU 测试,这个测试涉及 GPU 的图像处理、计算摄像、机器学习、物理模拟和计算金融五个模块,并不单单测试游戏性能,这就给了 M4 Ultra 更多的得分空间。

所以,结合目前实测的 M4 Max GPU 性能数据,这个推测是有一定道理的,在极客湾的实测中,M4 Max 的 AI 大模型计算性能已经达到 RTX 4090 的 60%。甚至可以在 RTX 4090 因为爆显存而性能暴跌的情况下, 借助 128G 统一内存的优势继续流畅运行更大参数量的 AI 模型。

图源:极客湾

这也意味着,只要 M4 Ultra 的架构不发生根本性变化,至少在 AI 计算等方面的性能是可以超越 RTX 4090,成为消费级最强的 AI GPU。

那么游戏方面呢?从目前的实测结果来看,M4 Ultra 的游戏性能肯定无法与 RTX 4090 相比的,因为即使是运行原生 Mac 游戏《博德之门 3》,高分辨率下帧数也只是比 RTX 4070 移动版略高 30%,尚未达到 RTX 4080 移动版的水平。

而在 3DMark 的测试中,RTX 4090 桌面端的性能约为 RTX 4080 移动端的两倍,这也意味着 M4 Ultra 在最理想状态下,游戏性能也只能达到 RTX 4090 的 75% 左右。不过若是对比移动端的 RTX 4090,那么倒是有机会反超,毕竟移动端 RTX 4090 本质上就是 RTX 4080 桌面端,差距还是非常明显的。

另外,如果是非原生游戏,那么 GPU 的性能还会受到明显的削弱,实测中帧数直接从领先 RTX 4070 移动版 30% 变成落后 30% 甚至 50%,这时候别说挑战 RTX 4090 了,可以直接考虑和 RTX 4060 坐一桌。

对于想用 M4 Ultra 打游戏的朋友来说,个人建议是不如拿一万装台游戏电脑,体验会比 M4 Ultra 好很多。但是如果你的需求是用来跑本地 AI 大模型、视频剪辑、模型渲染等,那么 M4 Ultra 的表现或许会超过目前最强的消费级 PC 也说不定,对于英伟达和 AMD 的消费级 GPU 市场部门来说,这并不是一个好消息。

苹果的自研 M 系列芯片跑分屡创新高,着实让英特尔、AMD 等传统半导体厂商冷汗直冒,甚至不得不联手成立 x86 架构生态小组,共同探讨 x86 架构的未来,能让两个曾经的死对头联手,可想而知 Arm 带来的压力有多大。

实际上很多人也好奇,为什么 Arm 架构芯片的能效比可以如此惊人?其实关键就在于指令集上,Arm 的指令集相较于 x86 要精简很多。

你可以将 x86 看作是一台复杂的多功能卡车,它可以一次性处理大量的数据和任务,但是在面对简单任务时,复杂且庞大的指令集也让其难以降低自己的资源占用率。而 Arm 则是摩托车,虽然每次只能执行单个任务和少量数据,但是可以通过灵活的车辆调度,分配执行任务的最佳车辆数,让 Arm 芯片在运行时有着更好地能效。

基于 Arm 架构的特性,苹果等企业很快就意识到通过增加核心数(准备更多的摩托)和优化指令集(专车专用提升效率),就可以让 Arm 芯片在性能上取得突破,Arm 指令集的高能效比也让 Arm 芯片可以轻松堆砌大量核心,而不用过多的考虑功耗问题。

此外,Arm 架构的灵活性,让苹果可以根据需求定制化设计专门的模块负责对应的任务,使得芯片效率进一步提升,加上统一内存架构带来的低延迟特性,让 M 系列芯片的整体执行效率远程传统芯片。

图源:苹果

得益于多项优化,量变最终引起了质变,让 Arm 芯片成功在单核及多核性能上都超越了传统 x86 芯片,成为 PC 市场的新兴势力,而不再是固守在移动设备市场。而且,苹果很快就发现这个套路在 GPU 上也同样可行,通过堆砌核心数的方式让 GPU 性能同样进入爆发式增长。

以 M4 Pro 和 M4 Max 为例,前者的 GPU 核心数为 20 个,后者则是 40 个,而在实际测试中,后者的各项性能基本上就是前者的两倍。理论上,只要苹果愿意,在达到芯片内部延迟的上限之前可以无限堆叠核心,打造更强的 GPU。

不过苹果本身并非半导体企业,其芯片设计更多的是为产品服务,所以并不会像英伟达、AMD 那样为了销售芯片而设计出功耗、性能都「爆炸」的产品。但是苹果不这么做,不代表其他企业也这么想,比如高通就一直在关注 Arm GPU 和 CPU,除了消费端,服务器和数据中心同样是高通的目标市场。

在 2024 年,高通就宣布重回服务器芯片市场,推出基于 Nuvia 内核设计的服务器芯片,截止目前为止,相关机构预估服务器市场的 Arm 芯片占比已经达到 10%。其中不少 AI 算力中心都有增加 Arm GPU 算力服务器的计划,因为 Arm 的高能效可以显著降低 AI 推理时的电力成本,进而降低单位算力的成本。

正是因为 Arm 架构所带来的巨大威胁,前段时间英特尔与 AMD 签署合作协议时,英伟达也同样到场,并且同为生态小组的合作企业之一。目前,对于英伟达等企业来说,最好的消息是苹果无意参与到半导体芯片市场中,而坏消息则是,高通的 Nuvia 内核表现不错,恐怕会成为 GPU 市场的一匹黑马。

可以预见的是,在未来的 PC 市场中,Arm 必然会有一席之地,并且有望彻底挑战 x86 架构和英伟达的市场地位。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

芯片 酷睿 gpu macbook pro 英特尔
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论