AMD优化RDNA 5显卡核心指令，部分场景性能可飙升近100%

IT 之家 3 月 14 日消息，开源平台 Coelacanth-Dream 昨日（3 月 13 日）发布博文，发现 AMD 针对 RDNA 5 GPU 全面优化指令级性能，在部分负载场景下有望实现 GPU 性能近乎翻倍。

该平台长期追踪 Linux 系统补丁，发现 AMD 在近期提交的代码中，针对 RDNA 5 GPU 架构，计划引入双发射向量算术逻辑单元（Dual Issue VALU），实质性增强 FP32（单精度浮点）的运算能力，从而惠及多种高负载应用场景。

IT 之家注：双发射向量算术逻辑单元是一种处理器硬件设计，通俗来说可以想象一个收费站原来只有一条车道（单发射），现在开了两条车道（双发射），在同一时间内（一个时钟周期）可以处理两辆车（两条指令），理论上效率翻倍。

双发射向量算术逻辑单元并非 RDNA 5 的专属新技术，AMD 早在 RDNA 3 和 RDNA 4 时代就已将其引入硬件架构。该技术配备双 ALU（算术逻辑单元）通道，支持 GPU 在单个时钟周期内同时执行两条指令。

然而在过去几代产品中，游戏引擎编译器缺乏有效手段来对齐代码，导致硬件虽然具备双发潜力，却无法高效地对计算任务进行分组与调度，最终限制了实际性能的释放。

AMD 为突破这一调度瓶颈，在 RDNA 5 架构中引入了融合乘加（FMA）指令。简而言之，FMA 指令能协助编译器轻松配对复杂的 ALU 操作，并将其顺畅地分发至双计算通道中。

得益于这项调度技术的完善，GPU 现在能够如预期般充分利用双发射 VALU 的硬件资源，更轻松触及理论性能峰值，进而实现业界期待的 " 性能翻倍 " 效果。

落实到实际用户体验中，在传统光栅化游戏中，这项底层技术革新将为玩家带来更高且更稳定的帧率表现。

与此同时，FMA 指令对神经网络和 AI 工作负载同样至关重要，它将深度赋能 AMD 下一代 AI 驱动的图像超分技术（如 FSR Diamond）与帧生成技术。

宙世代