NVIDIA 桌面 CPU 出师不利,没想到黄仁勋也有 " 翻车 " 的时候。
在年初 CES 2025 展会聚光灯下,NVIDIA 黄仁勋手持一台迷你机大小的 "Project DIGITS" 向世界宣告:这是全球最小的 AI 超级计算机,将彻底改变边缘 AI 的游戏规则。
官方将其命名为 DGX Spark,其采用 NVIDIA 与联发科共同开发的 GB10 Grace Blackwell 芯片,这也被无数媒体解读为 NVIDIA 在牢牢占据 GPU 王座之后,欲加速侵入 CPU 市场。
原本 DGX Spark 的计划是在 7 月正式上市,合作伙伴包括华硕、戴尔、技嘉、惠普、联想、微星。这些厂商也都在准备自己的 GB10 主机,其中华硕预告 7 月 23 日发布搭载 NVIDIAGB10 的 Ascent GX10 主机。
图源:华硕
如今八月已至,这款被寄予厚望的设备却杳无音信,据外媒 Wccftech 报道,NVIDIA 和 OEM 厂商都没有任何官宣。在英国,有零售商给出的预计发货时间改到了 9 月 15 日。
NVIDIA 的桌面处理器首秀,意外卡在了起跑线上。硬件巨头的生态之路,可能远比芯片设计艰难。
照例,先谈谈 NVIDIA 这颗桌面 CPU,成色几何。
从华硕公布的数据来看,GB10 作为 NVIDIA 第一款 Arm 架构 CPU,算力约为 1000 TOPS(FP4),并配备了 128 GB LPDDR5X 的统一内存,256-bit 位宽,总带宽为 273GB/s。
单从配置来看,最大的特点就是高达 128GB 的内存,不过 GB10 的内存是直接集成在芯片内部,并不支持单独升级。NVIDIA 给到如此多的内存,其实就是为了确保 PC 的性能可以满足 AI 模型的推理需求,后续或许会增加别的内存规格供大家选择,比如 192GB 版本,以便适配更大参数规模的 AI 模型。
如果不考虑其他因素影响,这个规格的 PC 最高可以在 FP4 精度下运行参数规模达到 200B 的 AI 大模型,如果是 FP8 精度则是 100B 参数规模。虽然与动辄六七百 B,甚至上千 B 的满血 DeepSeek 等 AI 模型无法比,但是已经足够部署一个甚至数个专业垂类 AI 模型。
可能具体参数大家不太能理解,你只需要知道在同等体积下,这个世界上可能找不到比它更强的 AI PC 了即可,
问题在于,这么强的产品,怎么就 " 难产 " 了?
提到 " 难产 ",第一反应就是生产线的问题。根据官方数据来看,GB10 采用的系统级封装技术由 NVIDIA 与联发科联合设计,在单个主板上集成了高性能的 Grace CPU,包含 10 个高性能 Arm Cortex-X925 核心,以及 10 个低功耗 Cortex-A725 核心。同时还融入了 Blackwell GPU,总之 GB10 的集成度非常高。
雷科技猜测,正是因为集成度高,导致在量产时良品率偏低。GB10 这种创新架构虽能突破传统系统瓶颈,却将生产流程变成所谓的 " 多米诺骨牌 ",每一个环节都不能出现问题。
比如,台积电的 CoWoS-L 封装工序需要 17 天完成,内存堆叠环节的温差控制需精确到 ±0.5 ℃,任何环节的波动都可能导致全线停滞。
图源:英伟达
另外,黄仁勋可能还没搞定 " 如何定价 " 的问题,英国零售商泄露的预售页面显示,基础版 128GB 内存 +1TB 存储定价高达 3600 英镑(约 3.3 万元人民币),高配机型更是突破 4 万元门槛。这个价格虽比传统的 NVIDIA DGX 系统低一个数量级,却仍将普通开发者拒之门外。
在 Reddit 的开发者论坛,预订用户焦虑地表示,设备延期导致他们的边缘 AI 项目被迫搁置,而转向 AWS 云服务的成本将激增三倍。
另外,NVIDIA 面向笔记本的 N1、N1X 处理器最近多次现身跑分软件,但何时发布也是个谜,甚至有说法称推迟到了 2026 年底。
可见,无论产品有多强大,技术创新若无法兑现为可交付产品,愿景都终将成为镜花水月。
历史上,关于 Arm 架构 CPU 的难题确实不少。微软在 Arm PC 领域的十年探索,堪称一部 " 生态长征史 ",投入数十亿美元,却长期陷入兼容性泥潭与量产瓶颈,直到近期才稍有起色,NVIDIA 作为新入局者,面临的障碍只会更加严峻
首先是两座大山,在 CPU 领域,Intel 和 AMD 始终是 NVIDIA 难以逾越的鸿沟。
比如 AMD 就趁机发动了闪电战,7 月 31 日,Threadripper 9000 系列 64 核处理器如期上市,搭配 Radeon AI 显卡形成完整解决方案。不过更致命的是,根据 Mercury Research 最新公布的数据显示,AMD 服务器 CPU 份额在 2025 年 Q1 飙升至 39.4%,虽然这是服务器领域数据,但显示 AMD 在 CPU 市场的全面扩张势头,对 NVIDIA 形成包夹。
图源:AMD
AMD 之上,还有一个 Intel。纵横 PC 行业多年,与 Intel 几次交锋的 AMD,尚不能从 Intel 手中抢走太多客户端市场,更不用说新入场的 NVIDIA 了。正如同 Intel 进军 GPU 行业后,发布的几款独显反响平平,NVIDIA 进入 CPU 市场后,想要从 Intel 和 AMD 两大巨头手中抢走份额,难度同样很高。
除了两大巨头在前,NVIDIA 进军 CPU 领域,还要面临一大难题——软件生态。
微软虽在不断补足 Windows On Arm 生态,但现阶段原生 Arm 架构的应用依然太少了。在实际使用中小雷发现,32 位的 X86 架构应用转译到 Arm 平台后,性能损失严重,会出现明显的卡顿,64 位软件和部分游戏转译后则会直接卡死,而且各类 BUG 不少,十分影响日常使用。
当然,这只是针对消费级市场而言,在企业级市场,GB10 尽管首战延期,DGX Spark 代表的技术方向仍具颠覆性潜力,基于 GB10 的设备可在 55 瓦功耗下实现 1 PetaFLOPS 的 FP4 算力,这种统一内存架构消除数据搬运瓶颈的特性,正是边缘计算的决胜棋。
根据 IDC 预测,到 2026 年 15% 的高性能台式机将转向此类异构架构,市场规模突破 240 亿美元。
NVIDIA 押注的赛道没有错,只是起跑慢了。
在雷科技看来,迷你化的 AI 工作站必然会成为未来的趋势之一,就像普通计算机从原本占据整个房间的设备,变成能被随身携带。随着 AI 的需求增长,AI 工作站也必然会出现类似的变化:个人化、便捷化、一体化,如此才能更好地迎合 AI 普及的需求。
就在 NVIDIA 陷入延期困境时,竞争对手已开始瓜分市场。
AMD 的 Threadripper AI 方案如期而至,Intel 的反击也在酝酿,高通的下一代芯片虎视眈眈。NVIDIA 因延期失去的先机,正被对手迅速填补,时间,已成为比金钱更稀缺的资源。
图源:英伟达
而此时 NVIDIA 面临的生态困境,比微软当年更甚。
后者至少拥有操作系统厂商的深度绑定和长期磨合。而 NVIDIA 虽在 GPU 驱动和 CUDA 生态上建树颇丰,但在消费级 CPU 的软件栈构建、与海量独立软件开发商的深度合作上,近乎从零开始。其引以为傲的 AI 开发者生态,能否无缝迁移并支撑起一个全新的 Arm 桌面平台,仍是巨大的问号。
Arm 生态的本质是 " 合力工程 ",操作系统、硬件平台、应用开发缺一不可。
破局的关键在于,NVIDIA 能否找到一条 " 生态速成 " 的捷径?
个人拙见,我认为 NVIDIA 在 GPU 领域的成功,很大程度上源于其定义了标准(CUDA)并建立了近乎垄断的垂直生态。但在 CPU 领域,尤其是与庞杂的消费级 Windows 生态对接时,这种模式行不通。
GB10 纵有千 TOPS 算力,若用户日常使用的核心软件(如 Adobe 套件、专业工具)无法原生流畅运行,或陷入 32 位应用卡顿、64 位软件崩溃的 " 转译地狱 ",其颠覆性性能将沦为纸上谈兵。用户体验的割裂,是性能参数无法掩盖的硬伤。
因此,在壁垒森严的 CPU 战场,强如 NVIDIA,也无法仅凭一己之力颠覆游戏规则。
NVIDIA 也深知这个潜在危机,因此 DGX Spark 与主流 PC 产商合作,但华硕、戴尔等合作伙伴的耐心并非无限。延期已打乱其产品节奏,高昂售价更限制市场接受度。NVIDIA 需拿出更灵活的商务策略,甚至开放更多定制空间,与 OEM 形成真正的风险共担、利益共享体,而非简单的芯片供应商关系。
另外,可以与微软结成更紧密的 " 攻守同盟 ",共同投入资源,强力推动关键应用的原生 Arm 版本落地,并大幅优化转译层效率。这需要真金白银的投入和强大的谈判能力。
按照现在流行的说法,就是所谓的 " 生态协同 "。NVIDIA 若无法放下 " 单打独斗 " 的执念,其桌面 CPU 的雄心恐将止步于边缘计算的市场,难以撼动 Intel 与 AMD 把持的主流格局。
毕竟在 CPU 这个领域," 个人英雄主义 " 是行不通的。
登录后才可以发布评论哦
打开小程序可以发布评论哦