快科技 6 月 15 日消息,AMD 显卡用户在 Windows 系统下试图同时运行 AI 推理和大型 DX12 游戏时,显卡常因驱动级资源冲突崩溃,错误代码为 exit code 2 或 0xc0000005。这一困扰开发者数年的局面,近日被 GitHub 用户 Beat-k 通过开源项目彻底解决。
该开发者通过 GitHub 开源项目 BEA_ROCm 发布补丁方案,在 Radeon RX 7900 GRE 显卡上首次实现了 DX12 游戏与 ROCm AI 推理的无冲突并发。
同时,他排查出导致崩溃的多层原因,包括 Flash Attention KV 缓冲区布局解析差异、SDMA 引擎队列冲突、显存过度分配、AMD AGS 库与 Adrenalin 驱动冲突,以及驱动遥测模块对内核调度的破坏。

需要指出的是,这些 Bug 存在层级依赖的堵塞效应,必须按顺序逐个解决才能暴露下一层问题。
修复方案采用双层补丁架构。第一层通过环境变量补丁集在 ROCm 子进程启动前应用环境变量预置修复。
第二层向 llama.cpp 提交 35 行 C++ 补丁,针对 gfx1100 架构进行 Windows ROCm 的流同步与 Flash Attention 门控处理。
实测结果显示,修复方案通过了 10 轮《彩虹六号:围攻》DX12 游戏 +Ollama 7B 模型推理的压力测试,游戏全程无一崩溃。
AI 推理平均延迟 12.2 秒,显存占用稳定在 9.5GB,DX12 负载在 6 轮游戏中保持饱和。
SDK 已开源,上游 PR 准备就绪,并已通过第三方在 gfx1101/Ubuntu 平台完成交叉验证。
这表示 A 卡用户终于可以在游戏的同时自由使用本地 AI,也为 RDNA 3 全系显卡在 Windows 平台上的 AI+ 图形多任务解锁了系统级的通用修复路径。



登录后才可以发布评论哦
打开小程序可以发布评论哦