驱动之家 昨天
刚完硬件刚软件 AMD确认AI软件3倍性能提升:CUDA之敌
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 8 月 9 日消息,在 AI 市场上 NVIDIA 占据了 95% 的份额,这不仅是他们的 AI 显卡硬件性能强大,还得益于 CUDA 的软件生态更完善,毕竟 16 年来积累了 400 多万开发者,这是 NVIDIA 最大的护城河。

AMD 在 AI 市场上想抢占更多份额,除了明年推出性能 40PFlops ( 4 亿亿次每秒 ) 的 MI400 加速卡之外,还要在软件生态上取得突破,这方面就得靠 AMD 的 ROCm 软件了,而且还是开源开放的生态。

今年 6 月份 AMD 官宣了最新的 ROCm 7 软件,专为性能、兼容性和灵活性而设计,在推理和训练方面提供了重大增强,支持许多开箱即用的最新 AI 模型,并将 AMD 开放生态系统从云扩展到边缘。

在日前的财报会议上,CEO 苏姿丰也提到了 ROCm 7 的诸多优点,强调在这一财季中 AMD 取得了重大进展,提高了 ROCm7 的性能、易用性并扩大了其采用范围。

苏姿丰表示,我们发布了 ROCm7,对整个软件栈的每一层都进行了重大升级,与上一代相比,推理和训练性能提升了 3 倍以上,并增加了对大规模训练、分布式推理和低精度数据类型的支持。

为了加强与开发者的合作,AMD 推出了 ROCm 夜间构建版本,并扩大了即时计算基础设施的访问范围,包括推出了 AMD 首个开发者云,该云提供预配置的容器,可即时访问 AMD GPU。

在此前的发布会上,AMD 还提供了 ROCm7 的实测结果,在 Llama 3.1 70B 模型上性能提升 3.2 倍,Qwen2-72B 上性能提升 3.4 倍,而 DeepSeek R1 性能提升 3.8 倍。

在训练任务上,Llama 2 70B、Llama 3.1 8B、Qwen 1.5 7B 模型上平均性能提升 3 倍。

今年内 ROCm7 还会不断提升生态支持,加入对锐龙平台笔记本 / 工作站的支持,完整支持 Linux 系统,还会正式加入对 Windows 系统的支持,可以说之前备受开发者吐槽的问题正在逐步解决。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

amd ai nvidia linux 基础设施
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论