驱动之家 昨天
全球首个直触液冷!北美最大AI训练基地配备8192块AMD MI325X加速卡、2048TB显存
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 7 月 15 日消息,AI 基础设施企业 TensorWave 宣布,已经完成了北美地区最大 AI 训练基地的建设与部署,采用了多达 8192 块 AMD Instinct MI325X AI 加速卡。

同时,这也是全球首个已公开的采用直触液冷散热的大型 AI 数据中心。

AMD MI325X 是去年刚刚发布的,采用 5nm 制造工艺,拥有 304 个计算单元 ( 19456 个核心 ) 、1530 亿个晶体管,FP8 精度算力 2.6 千万亿次计算每秒,搭配 256GB HBM3E 高带宽内存 ( 显存 ) ,带宽 6TB/s。

虽然 AMD 最新发布了 MI350X、MI355X,但部署尚需时日,MI325X 仍然是已落地的最先进的 AMD AI 加速卡。

8192 块放在一个系统内,总的核心数就到了几乎 1.6 亿个,FP8 性能达到恐怖的 2100 亿亿次浮点每秒。

同时,显存总容量多达 2048TB,总带宽超过 2PB/s!

单卡功耗就有 1000W,满载情况下一个小时就是 8000 多度电,确实需要配液冷,所有节点的 GPU 都使用了 TensorWave 自有的芯片直触液冷循环系统,确保高效带走热量。

这套系统将以云服务的方式,对外提供租赁服务。

这还只是 TensorWave 更宏大工程的第一阶段,预计今年晚些时候引入 AMD MI350X,支持 FP4/FP6 格式,性能和带宽更猛,但功耗也将最高达到 1400W。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai amd 云服务 基础设施 芯片
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论