快科技 3 月 18 日消息,AMD 展示了其最新的锐龙 AI MAX+ 395 "Strix Halo" APU 在 DeepSeek R1 AI 基准测试中的表现,比 NVIDIA RTX 5080 桌面版显卡高出 3 倍以上。
锐龙 AI MAX+ 395 "Strix Halo" APU 集成了 16 核、32 线程的 Zen 5 架构处理器、50 TOPS 的 XDNA 2 神经处理单元(NPU)和集成显卡。
RTX 5080 显卡仅配备 16GB 的 VRAM,这在处理大型语言模型时成为明显的瓶颈,而 Strix Halo APU 的 128GB 统一内存可以灵活分配,最多可将 96GB 内存转换为显存,使其在处理大型 AI 模型时具备显著优势。
在实际测试中,AMD 使用了包括 llama.cpp 驱动的应用程序 LM Studio 在内的多种消费者 AI 工作负载进行基准测试。
结果显示,当 LLM 模型大小超过 16GB VRAM 时,Ryzen AI MAX+ 395 的性能优势尤为明显,其性能比 RTX 5080 高出 3.05 倍。
即使与更高端的 RTX 5090(32GB 显存)相比,Strix Halo APU 的 128GB 统一内存依然使其在处理大型模型时占据绝对优势。
AMD 表示,锐龙 AI MAX+ 395 相较于 Copilot+ 竞品的优势主要如下:
性能:
与英特尔 Arc 140V 相比,最高提升 2.2 倍的 token 吞吐量
最高可达 4 倍于 Llama 3.2 3b Instruct 等小型模型的首个 token 生成时间
最高可达 9.1 倍于 7-8B 参数模型的速度
14B 参数模型最高比英特尔酷睿 Ultra 258V 快 12.2 倍
内存:
提供高达 128GB 的统一内存,而竞争对手的最大仅为 32GB
可将高达 96GB 转换为显存
可运行其他 APU 无法处理的更大模型,如谷歌 Gemma 3 27B Vision
登录后才可以发布评论哦
打开小程序可以发布评论哦