快科技 7 月 15 日消息,AI 基础设施企业 TensorWave 宣布,已经完成了北美地区最大 AI 训练基地的建设与部署,采用了多达 8192 块 AMD Instinct MI325X AI 加速卡。
同时,这也是全球首个已公开的采用直触液冷散热的大型 AI 数据中心。
AMD MI325X 是去年刚刚发布的,采用 5nm 制造工艺,拥有 304 个计算单元 ( 19456 个核心 ) 、1530 亿个晶体管,FP8 精度算力 2.6 千万亿次计算每秒,搭配 256GB HBM3E 高带宽内存 ( 显存 ) ,带宽 6TB/s。
虽然 AMD 最新发布了 MI350X、MI355X,但部署尚需时日,MI325X 仍然是已落地的最先进的 AMD AI 加速卡。
8192 块放在一个系统内,总的核心数就到了几乎 1.6 亿个,FP8 性能达到恐怖的 2100 亿亿次浮点每秒。
同时,显存总容量多达 2048TB,总带宽超过 2PB/s!
单卡功耗就有 1000W,满载情况下一个小时就是 8000 多度电,确实需要配液冷,所有节点的 GPU 都使用了 TensorWave 自有的芯片直触液冷循环系统,确保高效带走热量。
这套系统将以云服务的方式,对外提供租赁服务。
这还只是 TensorWave 更宏大工程的第一阶段,预计今年晚些时候引入 AMD MI350X,支持 FP4/FP6 格式,性能和带宽更猛,但功耗也将最高达到 1400W。
登录后才可以发布评论哦
打开小程序可以发布评论哦