快科技 9 月 16 日消息,NVIDIA 在 AI 市场大杀四方,不仅是靠 GPU 性能强大,还有 CUDA 软件生态,这可以说是他们的 AI 护城河。
AMD 在 AI 生态上也在抓紧完善,6 月份宣布了全新的 ROCm 7,今天它正式发布了,这是 AMD 向 CUDA 开炮的关键一战,而且还是开源的,目前已经登陆 Github。
ROCm 7 的升级内容非常多,支持了 MI350X 及 MI355X 显卡,支持这两款 GPU 的 KVM 直通,支持了 PyTorch 2.7、TensorFlow 2.19.1、ONNX 1.22、Triton 3.3 以及 JAX 0.6.0 等一系列框架。
详细升级内容可以参考 ROCm 官网:rocm.docs.amd.com。
在此前的发布会上,AMD 还提供了 ROCm7 的实测结果,在 Llama 3.1 70B 模型上性能提升 3.2 倍,Qwen2-72B 上性能提升 3.4 倍,而 DeepSeek R1 性能提升 3.8 倍。
在训练任务上,Llama 2 70B、Llama 3.1 8B、Qwen 1.5 7B 模型上平均性能提升 3 倍。
AMD 之前还提到,今年内 ROCm7 还会不断提升生态支持,加入对锐龙平台笔记本 / 工作站的支持,完整支持 Linux 系统,还会正式加入对 Windows 系统的支持,可以说之前备受开发者吐槽的问题正在逐步解决。
登录后才可以发布评论哦
打开小程序可以发布评论哦