IT之家 03-14
AMD优化RDNA 5显卡核心指令,部分场景性能可飙升近100%
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

IT 之家 3 月 14 日消息,开源平台 Coelacanth-Dream 昨日(3 月 13 日)发布博文,发现 AMD 针对 RDNA 5 GPU 全面优化指令级性能,在部分负载场景下有望实现 GPU 性能近乎翻倍。

该平台长期追踪 Linux 系统补丁,发现 AMD 在近期提交的代码中,针对 RDNA 5 GPU 架构,计划引入双发射向量算术逻辑单元(Dual Issue VALU),实质性增强 FP32(单精度浮点)的运算能力,从而惠及多种高负载应用场景。

IT 之家注:双发射向量算术逻辑单元是一种处理器硬件设计,通俗来说可以想象一个收费站原来只有一条车道(单发射),现在开了两条车道(双发射),在同一时间内(一个时钟周期)可以处理两辆车(两条指令),理论上效率翻倍。

双发射向量算术逻辑单元并非 RDNA 5 的专属新技术,AMD 早在 RDNA 3 和 RDNA 4 时代就已将其引入硬件架构。该技术配备双 ALU(算术逻辑单元)通道,支持 GPU 在单个时钟周期内同时执行两条指令。

然而在过去几代产品中,游戏引擎编译器缺乏有效手段来对齐代码,导致硬件虽然具备双发潜力,却无法高效地对计算任务进行分组与调度,最终限制了实际性能的释放。

AMD 为突破这一调度瓶颈,在 RDNA 5 架构中引入了融合乘加(FMA)指令。简而言之,FMA 指令能协助编译器轻松配对复杂的 ALU 操作,并将其顺畅地分发至双计算通道中。

得益于这项调度技术的完善,GPU 现在能够如预期般充分利用双发射 VALU 的硬件资源,更轻松触及理论性能峰值,进而实现业界期待的 " 性能翻倍 " 效果。

落实到实际用户体验中,在传统光栅化游戏中,这项底层技术革新将为玩家带来更高且更稳定的帧率表现。

与此同时,FMA 指令对神经网络和 AI 工作负载同样至关重要,它将深度赋能 AMD 下一代 AI 驱动的图像超分技术(如 FSR Diamond)与帧生成技术。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

amd gpu ai it之家 用户体验
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论