快科技 4 月 18 日消息,NVIDIA AI 之强大,不仅仅在于硬件性能好,更离不开生态优化适配,可以发挥最佳效率,AMD 相比之下就差了很多,但也在努力追赶。
现在,Stability AI 发布了 ONNX 框架优化的 Stable Diffusion 模型,在兼容的 AMD Radeon 显卡、锐龙集显上最多可以提速达 3.8 倍。
AMD 表示,过去一年来,一直在与 OSV、OEM、ISV 厂商合作,优化 AMD 硬件上的 AI 应用,包括硬件设计、驱动程序、编译器、机器学习模型等等。
根据官方公布的数据,经过优化之后,SDXL 1.0、SDXL Turbo 在 AMD 硬件上的推理性能,对比基础的 PyTroch 模型最高提升 3.8 倍,SD3.5 则可提升最多 2.6 倍。
实际图片、视频生成应用中,SDXL 1.0、SDXL Turbo、SD3.5 Large、SD3.5 Large Turbo 在 RX 9070 XT 显卡上的效率分别提升了 3.1 倍、1.5 倍、3.3 倍、2.1 倍。
SDXL 1.0、SD3.5 Large、SD3.5 Large Turbo 在锐龙 AI MAX+ 395 上的效率,则分别提升了 1.4 倍、3.3 倍、3.0 倍。
AMD 硬件优化版的 Stable Diffusion 模型有一个特殊的 "_amdgpu" 后缀标记 ( 比如 stable-diffusion-3.5-large_amdgpu ) ,现在已经可以在 Stability AI 或者 Hugging Face 上下载了。
你也可以使用 AMD、TensorStack AI 联合打造的最新版 Amuse 3.0。
注意,AMD GPU 驱动版本不要低于 24.30.31.05 预览版,或者等待即将发布的 25.4.1 正式版。
登录后才可以发布评论哦
打开小程序可以发布评论哦