为满足大规模人工智能(AI)和高性能计算(HPC)不断增长的网络需求,包括 AMD、英特尔、博通、思科、HPE、Meta 和微软等,于 2023 年 7 月联合组建了 " 超以太网联盟(The Ultra Ethernet Consortium,UEC)",目前共有 97 名成员。
现在超以太网联盟宣布,发布了 UEC 1.0 规范。这是一个基于以太网的全面通信堆栈,满足了人工智能和高性能计算工作负载的苛刻需求,也标志着在为下一代数据密集型基础设施重新定义以太网方面迈出了关键一步。
UEC 1.0 规范是根据人工智能和高性能计算工作负载的性能和特性扩展无处不在的以太网技术,这种做法简化了从硬件到应用程序的整个技术堆栈的部署,一方面尽可能多地使用原有技术,保持成本效率和互操作性,另一方面通过单独的协议最大限度地提高效率。
UEC 1.0 规范提供了可编程硬件管道、可编程 RDMA 传输、可编程拥塞控制和通信库加速功能,最大限度地利用 AI 集群并减少延迟,保持 CPU 与 GPU 之间不间断的通信。除了性能的提升,还有望增强人工智能基础设施的可扩展性和可靠性,使其更适合大规模部署。
早在去年 10 月,AMD 就推出了业界首款 UEC 1.0 规范的网卡,型号为 "AMD Pensando Pollara 400 AI NIC",有望为人工智能工作负载带来六倍的性能提升。到了今年 4 月,AMD确认新产品已经正式上市,并向客户发货。
登录后才可以发布评论哦
打开小程序可以发布评论哦