【ZOL 中关村在线原创分析】近两年,端侧 AI 发展速度之快超乎想像。2 年前 AI PC 刚刚诞生,是什么、能干什么、和传统 PC 有何区别是摆在大众面前的灵魂三问;1 年前,伴随稳定扩散模型和大语言模型的陆续爆发,人们开始对 AI PC 有了实质性概念;而今年,随着 AMD 锐龙 AI Max+ 395 这样的超大统一内存 + 可分配显存技术(VGM)的出现,端侧运行大模型的参数规模和运行效率得到了史诗级强化,至此,AI 赋能的高效体验逐渐深入人心,越来越多的生产力、创意、甚至游戏用户从 AI 中获益。
在这样的背景之下,AI 端侧计算设备的竞争也随之进入新的阶段。以 AMD 锐龙 AI Max+ 395 以及 NVIDIA GB10 Grace Blackwell 平台形成的两大高算力技术路线,开拓了小型化、低成本、高算力 MiniAI 工作站时代,相对于动辄数十万元的 AI 一体机而言,AMD 锐龙 AI Max+ 395 以及 NVIDIA GB10 Grace Blackwell 力求通过更低的价格成本让 AI 开发者、有本地化 AI 大模型需求的中小企业等用户突破算力桎梏。

不过,二者的目标虽然一致,但生态却大有不同。AMD 锐龙 AI Max+ 395 依托极为成熟的 x86+Windows 生态的深厚积淀,直接抹平了本地化 AI 计算的软硬件门槛,并保持了相关设备的泛用性;而以 ARM+Linux 生态为核心构建的 NVIDIA GB10 Grace Blackwell,则有着更加垂直的赛道,因此在泛用性、兼容性等方面,相对 AMD 锐龙 AI Max+ 395 而言并不适合大众用户。这意味着 AMD 锐龙 AI Max+ 395 可能是更适合 AI 入门开发者的优选方案。

· x86 Windows 成熟生态能大幅降低入门开发者技术门槛和中小企业部署门槛
x86 与 ARM、Windows 与 Linux,简简单单的两组名词道尽了 PC 行业的生态体系与目标群体。
从软件层面来看,x86 Windows 生态经过数十年发展,已为 AI 入门级到专家级开发者们构建了极为便利的资源链路。几乎所有主流 AI 开发工具和应用均提供 Windows 原生版本,无需复杂的环境配置即可直接安装,如 LM Studio、Ollama 等等,支持通过图形化界面一键部署和加载 Llama、Qwen、DeepSeek 等开源模型,AI 开发者甚至无需掌握命令行即可完成基础层面的开发。同时,Windows 生态下进行开发的学习成本相对较低,比如很多 AI 开发教程的系统环境均基于 Windows,可以轻松复现。
而 NVIDIA GB10 Grace Blackwell 的 ARM+Linux 生态,其实对于不少入门开发者来说就比较难以上手了。首先,部分 AI 开发工具即便提供 ARM 版本,但可能相应的功能也会有些许缺失,如 ARM 版 Tensor Flow 就不支持部分可视化工具 Tensor Board,导致入门者难以直观观察模型训练过程;其次,Linux 系统的命令行操作逻辑与大众习惯的图形化界面差异较大,有着较高的上手门槛,仅仅是如配置 Python 虚拟环境、安装相关驱动等基础步骤,就需要有一定的命令行语言基础。虽然 NVIDIA 提供了基于 Ubuntu 的 NVIDIA DGX OS 定制系统,规避了不同 Linux 版本操作指令的差异问题,但相应的学习成本也有所增加,没接触过的开发者自然需要重新学习相关内容,上手门槛较高。

硬件层面,基于 x86 架构打造的 AMD 锐龙 AI Max+ 395 平台,对于 AI 开发来说自然有着更加灵活且低成本的优势。整个平台的兼容性、泛用性、可扩展性优势是与生俱来的,而且相关产品的价格基本都在 15000 元以内,与 DGX Spark 新上市产品最低 32999 元的价格相比较来说成本更低、部署门槛更低,同时也具备出色的性能,单位投入获得的性能要高的多。

基于 ARM 架构设计的 NVIDIA GB10 Grace Blackwell,虽然有专属的 DGX OS 系统加持,但其兼容性、泛用性方面就会大打折扣,基本上只能用来做程序开发、AI 开发,除此之外的其它类型应用就极为有限了。而 AMD 锐龙 AI Max+ 395 平台除了可以作为 AI 开发平台,日常还能够满足用户的办公、3D 渲染甚至游戏需求,假设二者终端产品价格一致的情况下,兼容性、泛用性更优的 AMD 锐龙 AI Max+ 395 平台显然更对大众胃口。
其实说到泛用性,锐龙 AI Max+ 395 在当前的移动级平台中首屈一指。得益于 AMD 创新 Zen5 架构的能效优势,16 核 32 线程的多任务执行能力,以及最高可将 96GB 统一内存分配给显存的能力,锐龙 AI Max+ 395 在运行大规模参数量 MoE 混合专家模型优势显著。例如 Qwen3-235B-A22BMoE 模型的生成速度可以达到 14.72tokens/s,完全达到了实用级性能。

而在运行 30B 以下小参数量的稠密大模型方面,更是能够提供超过 10tokens/s 以上的生成速度。放在两年前 AI PC 刚刚起步之时,集成显卡平台能达到如此性能表现可谓是天方夜谭。

在执行高负载 AI 任务之外,锐龙 AI Max+ 395 借助多核心、高主频优势,可谓是真正实现了 " 一机多用 ",轻松应对多模态任务。在运行Office办公套件、浏览器多标签页时流畅无卡顿,甚至可同时开启多个 AI 模型进行调试优化、在线课程学习、文档编辑等多种复合任务也不会卡顿。而集成的 Radeon 8060S iGPU 还能满足视频剪辑、3D 建模渲染、甚至部分 3A 游戏需求,一机解决从 AI 开发到办公应用再到重负载生产力以及游戏的全场景应用需求。
相对于锐龙 AI Max+ 395 的泛用特征,NVIDIA GB10 Grace Blackwell 就显得更加专一,算得上是编程和 AI 开发的 " 偏科生 "。受限于 ARM 架构和 Linux 生态的局限,NVIDIA GB10 Grace Blackwell 注定无法成为普适型设备,因此其应用场景极为单一,并不适合作为 AI 入门开发的首选平台。
· 单位价格性能转化比锐龙 AI Max+ 395 优势显著更适合 " 大众体质 "
对于初创团队和个人开发者来说,产品价格也是敏感因素,对于企业用户来说,主要体现在 TCO,即总拥有成本方面的表现。
在这一点上,无论是锐龙 AI Max+ 395 还是 GB10 Grace Blackwell,都将终端产品设计成迷你 AI 工作站或笔记本形态的移动工作站,因此相对于需要占用专业机房、配备专业供电设备以及专业 IT 维护支持的 AI 一体机来说,总体成本更低。
不过,价格和管理维护所带来的成本只是一个方面,更多目标用户其实关注的是单位价格与性能之间的转化比,这一比值的高低往往反映硬件性能的价值,价值越高,自然就越适合 " 大众体质 "。
以目前上市的锐龙 AI Max+ 395 和 GB10 Grace Blackwell 机型来看,前者在这方面有着非常显著的优势。
目前上市的产品中,惠普 Z2 Mini G1a 工作站 21999 元,在 AMD Strix Halo 产品中,这已经算是最贵的产品了。而多数 Mini AI 工作站产品,价格都在 15000 元左右,像 13799 元的零刻 GTR9 Pro、14999 元的极摩客 EVO-X2 等等,价格都非常亲民。

而 GB10 Grace Blackwell 相比之下就没有太大的价格优势了,比如近期上市的 Dell Pro Max With GB10,其价格高达 45844.1 元。价格最低的华硕 NVIDIA Ascent GX10 也要 32999 元起,购机成本和采购成本瞬间拔高,并非普通个人开发者或小企业用户所能承担。同时,受限于系统生态,GB10 Grace Blackwell 所能够兼容的应用场景也很有限,比如除了专业开发,很难兼顾日常的 Windows 系统下的办公、创作等应用。

那么更加昂贵的 GB10 Grace Blackwell 是否有着大幅领先锐龙 AI Max+ 395 的性能呢?笔者从 Youtube 上找到了 Youtuber@BijanBowen 的测试数据,具体如下:

@BijanBowen 测试了 Llama3.3 70B、Qwen3 Coder、GPT-OSS 20B 以及 Qwen3 0.6B 四款大语言模型,其中 Qwen3 Coder 以及 Qwen3 0.6B 的生成速度上,GB10 Grace Blackwell 确实更快,但领先优势并不明显;而 Llama3.3 70B、GPT-OSS 20B 则比锐龙 AI Max+ 395 平台还要慢一些,在 TTFT 首 Token 生成速度上,锐龙 AI Max+ 395 也有优势。DGX Spark 的价格还要比 Strix Halo 贵 1~2 倍,AI 大模型生成速度却没有相应的优势体现,可见锐龙 AI Max+ 395 平台整体的 " 单位价格性能比 " 更高,对于用户而言显然是更超值的选择。
· 结语
其实对于个人 AI 开发者以及中小企业用户来说,选择 AI 终端设备的核心需求无外乎就是低门槛和高性价比,锐龙 AI Max+ 395 与其同样理念设计的 GB10 Grace Blackwell 相比,从硬件兼容性、系统生态再到单位价格的性能转化比,再到终端产品的泛用性、扩展性方面,无疑都有着相当显著的优势。正是锐龙 AI Max+ 395 的出现,才让 x86 Windows 这一原本就门槛非常低的 AI 开发、应用环境变得门槛更低,一台 MiniAI 工作站就能完成 AI 大模型的训练、调试和优化,而且相关的框架、库、应用都极为完善,再加上锐龙 AI Max+ 395 自身 CPU+GPU+NPU 的三大 AI 计算引擎加持,充分满足了用户既能跑通基础模型,又能支撑后续进阶 AI 学习和开发的需求。而且其 15000 元左右的价格,相对于价格 32999 元起的 GB10 Grace Blackwell 新品来说,价格优势、TCO 优势更加明显,更值得个人 AI 开发者以及中小企业用户选购。
同时,锐龙 AI Max+ 395 借助创新的 Zen5 架构以及 x86 Windows 生态,有着极为出色的泛用性,覆盖 AI 开发、文档办公、视频剪辑、3D 渲染、游戏等多元应用生态,相比 ARM Linux 生态的单一性,前者显然更符合大众用户的 " 一机多用途 " 购机理念。
 
    

登录后才可以发布评论哦
打开小程序可以发布评论哦