三易生活 17小时前
为什么NPU难以普及?一款新产品扯下了“遮羞布”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

PC 行业的 NPU,起步其实比大家知道的更早

早在 2023 年 9 月 21 日,微软方面就发布了一款名为 Surface Laptop Studio 2 的可变形笔记本电脑。从产品定位来说,它显然并不 " 大众 ",但这款产品在整个 PC 史上注定会有一个特殊的地位,因为这是首款量产发布、带有 NPU 的 "AI PC"。

当然大家都知道,直到三个月后,英特尔才会推出第一代内置 NPU 的 Meteor Lake 家族处理器。所以 Surface Laptop Studio 2 的 NPU 并非内置在处理器中,而是使用了一颗基于 PCIE 通道的 " 外挂 "Movidius 3700VC 方案,可提供大约 7TOPs 的 AI 算力。

我们手头也有一款使用 Movidius 方案的产品,只不过是更早的型号

不仅如此,"Movidius 3700VC" 实际完全可以视为英特尔自家 "NPU" 的 12nm 雏形。因为之后 Meteor Lake 以及 Arrow Lake 里集成的 "NPU3",其内部型号正是 "Movidius 3720",基本就是前者的制程提升 + 超频版本。

为什么英特尔要这么做?很显然,他们应该是希望实现旗下 NPU 的延续性,从而避免开发者面对这个 " 新玩意 " 一开始就被频繁更新、且互不兼容的架构给吓跑。但追求架构上的延续性,客观上却又制约了 "NPU3" 的算力上限。

于是乎,英特尔在 Lunar Lake 上推出了 48TOPs 的 "NPU4",在 Panther Lake 上则会将其更新到具有 50TOPs 算力的 "NPU5"。根据目前的爆料信息,我们最快明年就会看到搭载 74TOPs 算力 "NPU6" 的 NovaLake 处理器面世。

NPU 为什么不能普及?目前有两种主流观点

很显然,NPU 的算力正在快速膨胀,但它是否已经实现了普及,并被普通消费者所接受了呢?

答案其实是否定的。一方面可以看到,在如今主流的桌面 PC 市场里," 不带 NPU" 的处理器依然占据了多数市场份额,譬如锐龙 9 9950X3D、锐龙线程撕裂者、酷睿 7 251E,以及至强 W9、至强 6 这些或家用或专业向的高端处理器,它们甚至都并未内置 NPU。

大家不喜欢 Windows Recall,本质上其实是 " 人性问题 "

另一方面,即便是在那些内置高算力 NPU 的设备上,目前用户能够感受到的 " 好处 " 似乎也非常有限。比如在我们自己常用的一台 " 骁龙本 " 上,虽然 NPU 确实能用于摄像头虚化、实现麦克风降噪、辅助系统实时记录操作历史(Windows Recall)。但除此之外,对于日常大量使用的第三方软件,NPU 并不能起到什么 " 加速 " 作用。

为什么 NPU 从出现至今已经有两年多时间了,但始终没能真正普及、没能真正在大多数用户的 " 日常使用 " 中扮演重要角色呢?

其实前面举的这两个例子,就反映了目前行业中对于 "NPU 难以普及 " 的两种不同方向的观点。其中有一部分人认为,NPU 的优势纯粹在于 " 高能效 ",也就是说在处理 AI 任务时,NPU 的速度本就不如高性能显卡,它们的优势仅仅在于低功耗,所以 NPU 就只适合笔记本电脑这类供电、散热条件有限的设备,不应该出现在台式机上(即认为台式机有强大的 CPU 和独显,它的 AI 生态应该基于这两者去建设)。

而另一种观点则认为,NPU" 现在不受宠 " 纯粹是因为算力还不够高,只要再迭代几次、算力高起来了," 大家就会愿意用它了 "。

一款不常见的设备,扯下了 NPU 的 " 遮羞布 "

事实上,此前我们三易生活也基本同意上面的两种想法,但直到近日我们看到了一款足以颠覆这些的产品。

这是一款笔记本电脑,它的型号是戴尔 Pro Max 16 Plus。那么它有什么特别的呢?简单来说,这款笔记本电脑可以选配一块来自高通,型号为 "AI-100 Ultra" 的独立 NPU 卡。

根据产品信息显示,这个 NPU 卡会占用笔记本电脑里的显卡安装位,它的功耗高达 150W、自带 128GB 的 LPDDR5X" 显存 ",并可在 INT8 格式下提供 870TOPs 的 AI 算力水平。

很显然,这并不是一个为 " 大众消费者 " 准备的配置。有相关报道显示,它更多瞄准的是 AI 开发者,以及那些需要在工厂之类非联网场景获得足够高端侧算力的用户。

但即便如此,这款 " 独立 NPU" 还是刷新了我们的认知。一方面它似乎表明,现阶段的常见 NPU 方案,比如那些处理器里集成、15 到 50TOPs 算力的 NPU,性能确实是太低,所以才没法在真正的专业级软件里得到支持。

但另一方面,其实深入这款 " 独立 NPU" 的参数就会发现,150W 的功耗却 " 只能 " 提供 870TOPs 的算力,似乎也并没有特别大的优势。

打个比方来说,笔记本电脑上的 RTX5090 同样是 150W 功耗,但 AI 算力可以达到 912TOPs;而台式机上的 RTX PRO6000 显卡更是可以用 600W 功耗,实现最高 4000TOPs 的 AI 算力。也就是说如果我们真的要去计算 " 能效比 ",那高性能独显的 AI 能效比,还真的不见得比大家现在看到的、各种集成在处理器里的 "NPU" 来得低。

当然,我们并不是说现代 PC 里的 NPU 就一定比独显更耗电,毕竟大多数集成式 NPU 本来就规模小、算力低,所以真去比较 " 绝对功耗 ",当然就会得出集成式 NPU 较独立显卡省电的结论。

可相比于普通用户,开发者显然就没那么好糊弄。所以当一颗高功耗、能效也并不出色的 " 大 NPU",出现在专供开发者使用的电脑上时,实际上就已经构成了对当前 " 家用 NPU" 的嘲讽。它既让我们意识到目前的绝大多数 NPU 存在着绝对性能不足,所以无法真正被第三方软件所采纳。同时它的存在还表明,所谓 "NPU 效率高、NPU 比显卡更省电 " 的说法,似乎也值得去重新审视。

【本文部分图片来自网络】

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

英特尔 ai 锐龙 酷睿
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论