电脑报 06-17
AMD的Zen5线程撕裂者9000有多强?性能得分捶爆对手!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

AMD 在 COMPUTEX 2025 上正式宣布了 Zen5 架构的 AMD 锐龙 Threadripper PRO 9000WX/9000 系列处理器和 RDNA 4 架构的 Radeon AI PRO R9700 专业显卡。而在当地时间 6 月 10 日,AMD 在美国加州圣何塞又举办了一场深入的 Workshop 技术沟通会,分享了更多相关的技术细节与性能数据。

Zen5 架构加持,新一代线程撕裂者再创性能巅峰

在工作站领域,AMD 可以说做到了全面覆盖,提供了全平台的解决方案支持。包括搭载锐龙 AI MAX PRO/AI PRO 系列处理器的工作站笔记本、搭载锐龙线程撕裂者 PRO 的桌面工作站与搭载 Radeon AI PRO 系列显卡的工作站。

Threadripper(线程撕裂者)系列可以说是 AMD 历代处理器产品中的传奇,从初代的 Ryzen Threadripper 1950X 到上代 Ryzen Threadripper PRO 7995WX,核心数量增长了 5 倍;内存带宽增长了 3 倍;PCIe 带宽也提升了 3 倍。

而现在,Ryzen Threadripper 9000 系列将与 Radeon 9000 系列打造出强大的新一代 AI 工作站解决方案。

Ryzen Threadripper 9000 系列采用了 Zen5 架构,同时在 SoC 部分也进行了升级。之前我们在锐龙 9000 系列处理器首发时已经详细介绍过 Zen5 架构,简单来讲就是大幅提升了 IPC 和能效表现,同时得益于新的制程,可以做到更高的加速频率。Ryzen Threadripper 9000 系列拥有最多 96 个 Zen5 核心、192 线程,为高负载计算进行了全面优化,支持 512bit 数据通道的 " 满血版 "AVX512,增强了 ISA 性能。SoC 部分,将内存频率支持提升到了 DDR5 6400 水平,支持最多 12 个 4nm CCX 芯片,同时还改进了能效表现。

Zen5 架构的改进我们之前详细介绍过,这里简单提一下重点。Zen5 架构增加到了 6 个 ALU,提升了执行性能,使用了新一代的分支预测,大幅提升了缓存效率,同时还具备 4 条管道支持双倍的 512bit/AVX512 加载。

Zen5 架构还大幅增强了 L2 缓存,包括将 L2 缓存连接性能翻倍、L2 缓存到 L1 缓存的数据路径加倍、L2 缓存带宽加倍等等。同时,还大幅降低了 L3 缓存的延迟。

经过一系列的改进,Zen5 在频率相同的情况下相对 Zen4 带来了 16% 的工作站性能提升,在 AI&ML 应用中更是获得了高达 25% 的性能提升。

从平台来看的话,Ryzen Threadripper 9000 系列的重要改进包含几大方面。内存部分,它支持最高 8 通道 DDR5 6400 内存,总带宽可达 410GB/s,甚至还能支持内存超频到 DDR5 7000+ 水平;主板部分,依然兼容现有 sTR5 平台,支持 AMD PRO 技术;I/O 部分,同样最多提供 128 条 PCIe 5.0 通道,但得益于 SoC 的改进,PCIe 带宽也得到了提升。

综合来讲,Ryzen Threadripper 9000 系列的重要卖点就是 IPC 相对上代提升 16%、支持 512bit 数据通道满血 AVX512、支持 8 通道 DDR5 6400 内存。

得益于一系列的改进和升级,Ryzen Threadripper 9000 系列堪称世界上最强的工作站处理器。它在设计与制造、建筑工程与施工、多媒体与娱乐、软件与科学计算方面都能提供极为强大的性能支持。

AMD 放出了 Ryzen Threadripper PRO 9995WX 与上代 Ryzen Threadripper PRO 7995WX 的性能对比数据。从图中可以看到,在多媒体和娱乐方面,PRO 9995WX 领先 PRO 7995WX 的幅度大约在 17%~26%;在设计与制造方面,领先幅度也是 17%~26%;在建筑工程与施工方面,领先幅度为 13%~15%;在软件和科学计算方面,大约领先 22%~23%。

如果拿 Ryzen Threadripper PRO 9995WX 和竞品的 Xeon W9-3595X 对比的话,纯 CPU 建模速度大约快 70%、渲染速度大约快 119%;如果搭载 GPU 进行对比,建模速度和渲染速度也分别快出 56% 和 22%。因此,AMD 也宣称 Ryzen Threadripper PRO 9000 是最好的设计与制造处理器。

在多媒体和娱乐方面,Ryzen Threadripper PRO 9995WX 和竞品的 Xeon W9-3595X 对比,纯 CPU 渲染速度大约快 118%~145%;如果搭载 GPU 进行对比,渲染速度快出 78%~83%。毫无悬念,Ryzen Threadripper PRO 9000 也是最好的多媒体与娱乐内容创作的高效利器。

在建筑工程和施工方面,Ryzen Threadripper PRO 9995WX 和竞品的 Xeon W9-3595X 对比,纯 CPU 建模速度最高提升 40%、渲染速度大约快 118%;如果搭载 GPU 进行对比,创作速度快出 40%、剪辑速度快出 34%。因此,在这个领域 Ryzen Threadripper PRO 9000 也是最强大的存在。

在软件和科学计算方面,Ryzen Threadripper PRO 9995WX 和竞品的 Xeon W9-3595X 对比,纯 CPU 编译,在 Chromium 中领先 52%、UE5.5 中领先 73%;MATLAB 中领先 75%。对于这方面的用户来讲,Ryzen Threadripper PRO 9000 同样是最高效的选择。

在 AI 方面,Ryzen Threadripper PRO 9995WX 和竞品的 Xeon W9-3595X 对比,在 DeepSeek R1 32B LLM 中 Toks/s 领先 49%,在 ComfyUI 中文生图领先 34%、Pugetbench Davinci Resolve Studio AI Extend Tests 中领先 28%,更多的核心 / 线程数量和更高的内存带宽功不可没。

具体产品规格部分,我们之前也介绍过。本次首发的锐龙 Threadripper 新品分为 PRO 9000WX 系列和 9000 系列,其中锐龙 Threadripper PRO 9000WX 系列针对专业高性能工作站,最高规格方面相对 9000 系列更高,一共拥有 6 款型号。

顶级旗舰 AMD 锐龙 Threadripper Pro 9995WX 拥有 96 核 192 线程,基础频率 2.5 GHz,最高加速频率 5.4 GHz,384MB 三级缓存。

AMD 锐龙 Threadripper Pro 9985WX 拥有 64 核 128 线程,基础频率 3.2 GHz,最高加速频率 5.4 GHz,256MB 三级缓存。

AMD 锐龙 Threadripper Pro 9975WX 拥有 32 核 64 线程,基础频率 4.0 GHz,最高加速频率 5.4 GHz,128MB 三级缓存。

AMD 锐龙 Threadripper Pro 9965WX 拥有 24 核 48 线程,基础频率 4.2 GHz,最高加速频率 5.4 GHz,128MB 三级缓存。

AMD 锐龙 Threadripper Pro 9955WX 拥有 16 核 32 线程,基础频率 4.5 GHz,最高加速频率 5.4 GHz,64MB 三级缓存。

AMD 锐龙 Threadripper Pro 9945WX 拥有 12 核 24 线程,基础频率 4.7 GHz,最高加速频率 5.4 GHz,64MB 三级缓存。

所有型号的 TDP 都是 350W,与上代保持了一致,但细心的朋友可能已经发现了,和上代核心越多加速频率越低不一样的是锐龙 Threadripper Pro 9000WX 系列的最高加速频率都是 5.4 GHz,可见 4nm Zen5 架构在体质和电气性能方面确实更为强悍。

接口方面,锐龙 Threadripper Pro 9000WX 依然使用了 sTR5,因此可以兼容 WRX90 和 TRX50 主板,上代线程撕裂者用户可以无缝升级。值得注意的是,WRX90 只支持 PRO 9000WX 系列,而 TRX50 可以同时支持 PRO 9000WX 和 HEDT 的 9000X 系列。当然,如果把锐龙 Threadripper Pro 9000WX 装到 TRX50 主板上,那么它也只能支持 4 通道 DDR5 6400 和 80 条 PCIe 5.0 通道。

接下来就是针对 HEDT 平台的锐龙 Threadripper 9000X 系列,这个系列面向 HEDT 用户,用来打造顶级的高性能 PC。

从 AMD 给出的 9 项测试数据来看,锐龙 Threadripper 9980X 相对竞品 Xeon W9-3595X 在内容创作方面领先 22%~92%;在 3D 制图和可视化处理方面领先 41%~108%;在软件和科学计算方面领先 41%~68%,可以说优势非常夸张了。

锐龙 Threadripper 9000 系列目前包含 3 款产品,分别是 64 核 128 线程的 AMD 锐龙 Threadripper 9980X、32 核 64 线程的 AMD 锐龙 Threadripper 9970X 与 24 核 48 线程的 AMD 锐龙 Threadripper 9960X。这 3 款型号与核心数量相同的 AMD 锐龙 Threadripper Pro 9000WX 系列拥有同样的频率、缓存、PCIe 版本、TDP 设定与主板接口标准,只是精简了针对企业用户的 AMD PRO 安全技术。此外,由于只能搭配 TRX50 主板使用,它们也只能最多支持到 4 通道 DDR5 内存。

Radeon AI PRO R9700 显存量大管饱,跑超大模型更给力

目前 AMD 针对不同规模的 AI 应用都有对应的 AI 生态解决方案。对于个人用户和中小型 LLM,可以使用搭载统一内存的 Ryzen AI MAX 平台;针对多 GPU 边缘计算用户和中小型 LLM,可以使用搭载超大显存的 Radeon AI PRO 平台;而对于机架扩展级别、需要训练超大 LLM 模型的用户,则可以选择 AMD Instinct 解决方案。

所以这次 Radeon AI PRO R9700 显卡就配备了更加高效的 RDNA 4 架构。主要带来了几大改进:优化的单片设计,使用 4nm 工艺、支持 PCIe 5.0 接口;改进了命令处理器,增强了包加速器;搭载高速 GDDR6 显存,最高提供 256bit/20Gbps/32GB 的规格,并增强了内存压缩;优化了缓存系统,内置 64MB 第三代无限缓存,配备 8MB L2 缓存,拥有 2MB CU 缓存;配备第二代 AI 加速器,提升了 Tensor 频率,支持新的 FP8 数据类型和结构化稀疏。

而在 RDNA 4 的 CU 单元方面,也带来了几大改进。包括:增强了矩阵操作;升级了标量单元;升级了调度器;提升了光线加速单元。

具体显卡部分,Radeon AI PRO R9700 拥有 128 个 AI 加速器,搭载 256bit/20Gbps/32GB GDDR6 显存,最高 FP16 稠算力可达 191 TFLOPS、INT4 稀疏算力可达 1531 TOPS。整板功率为 300W。

综合来看,Radeon AI PRO R9700 算力最高可达上代 Radeon PRO W7800 的 4 倍,从图中可以看到,对比每时钟 / 每 CU 的算力,Radeon AI PRO R9700 在 FP16/BF16 方面领先一倍;在 INT8 方面领先三倍;在 INT4 方面也领先三倍,并且新增了对 FP8 以及结构化稀疏的支持。

我们知道,现在流行的 AI 大模型由于参数的增加,对显存的需求越来越大,譬如 DeepSeek R1 Distill Qwen 32B Q6,就需要高达 28GB 显存。这就意味着显存低于 32GB 的显卡在运行它时就会爆显存。而具备 32GB 显存的 Radeon AI PRO R9700 自然就毫无压力了。

此外,更大的模型也意味着更高的精度和更好的计算结果。从图中可以看到,使用 8B 参数和 1B 参数实现的文生图完全不是一个档次的效果,参数越多越真实。同时,参数越多,最终得到的结果准确度也越高,8B 的时候只有 4/20 的准确度,而 32B 可以达到 20/20。

在单 GPU 配置下比较稀疏化 AI 性能,Radeon AI PRO R9700 在 DeepSeek R1 Distill Qwen 的 1.5B、7B、14B 和 Llama 8B 模型中分别领先 Radeon PRO W7800 大约 34%、74%、63% 和 105%,升级幅度巨大。

Radeon AI PRO R9700 还支持 4 卡并联,最高支持 180 个并发实例。从图中可以看到,在使用 DeepSeeK R1 Distill Qwen 32B 模型 /180 个并发实例时,4 块 Radeon AI PRO R9700 的 Tokens/s 可达 1780,性能是非常抢眼的。

AMD 的合作伙伴已经推出了搭载锐龙 Threadripper PRO 9000WX 和 Radeon AI PRO R9700 的工作站和服务器产品。例如 Supermicro 的 WS 2115HV-TNRT,就搭载了单颗锐龙 Threadripper PRO 9000WX 处理器、8 通道 DDR5 ECC RDIMM 内存和最多 4 块 Radeon AI PRO R9700。特别值得一提的是,这款 2U 机型还支持内存超频。

从 Supermicro 展示的数据来看,这颗 64 核 128 线程的锐龙 Threadripper PRO 9000WX 工程版在搭载 4 通道 DDR5 的情况下,已经将内存超频到了 7200MT/s。可见锐龙 Threadripper PRO 9000WX 这一代的 SoC 确实相当给力。

总结:AMD 在 AI 和高性能计算方面继续创造巅峰

最后简单总结一下 AMD 本次 Workshop 技术沟通会的内容重点。首先是 AMD 锐龙 Threadripper PRO 9000WX/9000 系列将架构升级到了 Zen5,IPC 和能效方面都得到了大幅提升,同时还加强了 SoC,支持最多 8 通道 DDR5 6400 内存,因此在各种专业应用领域都继续保持了绝对领先的地位;然后是 Radeon AI PRO R9700 专业显卡,它采用全面增强的 RDNA 4 架构,拥有 32GB 大显存和支持多卡并联,用它和 AMD 锐龙 Threadripper PRO 9000WX/9000 系列搭配打造的工作站 / 服务器,能够更好地面对更多参数的 AI 大模型、提供更高的推理准确度,为用户提供了强大而高效的 AI 硬件平台解决方案,对于高端内容创建者来说堪称无论如何都必须拥有的高效装备。搭载 AMD 锐龙 Threadripper PRO 9000WX/9000 系列和 Radeon AI PRO R9700 专业显卡的具体产品将在接下来的时间陆续上市,有需求的专业用户一定不要错过。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

amd 锐龙 线程撕裂者 美国 芯片
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论