(全球 TMT2025 年 12 月 4 日讯)亚马逊云科技在 2025 re:Invent 全球大会上,宣布 Amazon EC2 Trainium3 UltraServers(Trn3 UltraServers)现已正式可用,由亚马逊云科技首款 3nm AI 芯片驱动,为不同规模的企业提供运行高强度 AI 训练与推理工作负载的能力,帮助客户更快更省地训练和部署 AI 模型。

与 Trainium2 UltraServers 相比,Trn3 UltraServers 在 AI 场景中提供高性能,实现高达 4.4 倍的计算性能、4 倍的能效提升以及近 4 倍的内存带宽,使 AI 开发速度更快、运营成本更低。Trn3 UltraServers 可扩展至最多 144 颗 Trainium3 芯片,提供高达 362 FP8 PFLOPs 的性能,延迟降低 4 倍,可更快速训练更大规模的模型,并支持大规模推理场景。包括 Anthropic、Karakuri、Metagenomics、Neto.ai、Ricoh 与 Splashmusic 在内的客户已经通过 Trainium 将训练与推理成本降低至原来的 50%。值得的一提的是,Amazon Bedrock 也已在 Trainium3 上运行生产级工作负载。
亚马逊云科技已经着手研发下一代 Trainium4,其设计目标是在各项性能指标上实现显著提升,包括至少 6 倍的 FP4 处理性能、3 倍的 FP8 性能以及 4 倍的内存带宽,以支撑下一代前沿模型的训练与推理需求。Trainium4 在 FP8 性能上的 3 倍提升是一次基础性飞跃,使 AI 模型的训练速度至少提升 3 倍,或处理至少 3 倍的推理请求,并可通过持续的软件增强与特定工作负载优化获得更多额外加速。为实现更强的扩展能力,Trainium4 将支持 NVIDIA NVLink Fusion 高速芯片互连技术。


登录后才可以发布评论哦
打开小程序可以发布评论哦