随着 AI 推理对内存需求的不断增加和模型复杂度的持续提升,开发者们寻求能够本地处理这些需求的硬件,同时不牺牲性能和灵活性。从大型语言模型到生成式工作流,现代 AI 负载需要具备强大计算能力和充足显存的 GPU。
为满足这一需求,AMD 很高兴宣布即将推出搭载 AMD Radeon AI PRO R9700 的工作站系统—这是其面向本地 AI 开发和高吞吐推理的新型专业显卡。该显卡将于 2025 年 7 月 23 日起,通过专注于定制高性能计算解决方案的精选 AMD 硬件合作伙伴,提供预装的工作站系统。
突破内存瓶颈,性能再造新标杆
为加速中大型 AI 模型在本地工作站上的运行,AMD Radeon AI PRO R9700 配备了 32GB 高速 GDDR6 显存、先进的 RDNA? 4 架构及对现代 AI 数据类型的广泛支持。凭借 64 个计算单元、128 个第二代 AI 加速器,以及对 FP8、FP16 和 INT8 精度的支持,R9700 提供强劲的 TOPS 性能和处理复杂 AI 任务所需的多样化能力。
凭借 32GB 高速显存,R9700 可将大型模型完整加载于显存中,无需依赖系统内存,从而实现更快的推理速度、更高的吞吐量及更广泛的模型兼容性。在高令牌数的大型语言模型提示和指令微调模型等真实应用场景中,其性能可大幅提升。
专为 AI 专业人士打造
AMD Radeon AI PRO R9700 针对对硬件性能有极高要求的 AI 专业用户设计,特别擅长自然语言处理、文本生成图像、生成式设计等需要大型模型或高显存流水线的复杂任务。无论是进行大规模推理、本地微调,还是支持多模态工作流,Radeon AI PRO R9700 均能提供充足的容量和速度,实现全程本地运算,提升性能、降低延迟,并增强数据安全性。
Radeon AI PRO R9700 完全兼容 AMD ROCm 开源软件平台,为开发者提供了强大且可扩展的 AI 与高性能计算环境。支持 PyTorch、ONNX Runtime 和 TensorFlow 等主流框架,ROCm 使用户能够高效构建、测试和部署基于 R9700 的本地 AI 模型。32GB 显存、RDNA 4 架构和 ROCm 6.4.1 的结合,实现推理、微调及定制模型工作流的加速表现,使 Radeon AI PRO R9700 成为追求性能、灵活性和开放标准的 AI 专业人士的理想选择。
凭借紧凑的双槽设计、PCIe 5.0 接口及鼓风式散热方案,Radeon AI PRO R9700 支持多 GPU 工作站部署。不同于采用轴流风扇设计、通常难适配高密度系统的消费级显卡,R9700 的鼓风设计确保高效的前至后气流,允许多张显卡在高性能紧凑环境中稳定运行,方便部署并行推理流水线、扩展多卡显存容量及支持更大规模并发模型负载,助力企业构建可靠、高吞吐的本地 AI 基础设施。
通过 Radeon Test Drive 亲身体验 Radeon AI PRO R9700
有兴趣评估 Radeon AI PRO R9700 用于本地 AI 工作负载的开发者, 即将能够通过 Radeon Test Drive 项目进行体验。该项目旨在帮助技术用户探索 AMD 支持 AI 的工作站 GPU,提供基于 AMD Radeon PRO GPU 驱动、搭载 ROCm 6.4.1 环境的高性能合作伙伴工作站的实操机会。无论是基准测试 PyTorch 等框架,还是评估本地大型语言模型推理,Radeon Test Drive 都是快速、无风险的入门途径。即刻申请访问权限:www.amd.com/en/developer/resources/cloud-access.html
登录后才可以发布评论哦
打开小程序可以发布评论哦