快科技 8 月 26 日消息,NVIDIA 一直在准备 Blackwell GPU 的升级版本 "Blackwell Ultra",也就是 B300、GB300,当然还是面向 AI 与高性能计算领域,今年晚些时候就会推出,然后才是下一代全新的 "Rubin"。
Blackwell Ultra 仍然是台积电 4NP 工艺、2080 亿个晶体管,还是两个 Die 通过 NV-HBI 高速界面互连 ( 带宽 10TB/s ) ,配备总计 160 个 SM 单元 ( 每个包含 128 个 CUDA 核心 ) 、640 个第五代 Tensor 核心,共享完全一致性的二级缓存。
GPU、GPU 之间通过 1.8TB/s 带宽的第五代 NVLink 互连,GPU、CPU 之间则是 900GB/s 的 NVLink-C2C 通道,这些都没变。
不同的是,Blackwell Ultra 将首次开放 PCIe 6.0 支持,可用带宽直接翻倍,HBM3E 内存容量也从 192GB 增加到 288GB ( 带宽 8TB/s ) ,不过代价是最大功耗从 1200W 增加至 1400W。
从 NVIDIA 的描述看,Blackwell 本身就支持 PCIe 6.0,只不过在此之前一直没有开放而已。
性能方面,显著提升的一是 NVFP4 dense 稠密性能大幅提升了 50%而来到 15PFlops,不过 sparse 稀疏性能还是 20PFlops。
二是 SFU ( 特殊功能单元 ) EX2 下的注意力加速能力从 5TF/s 来到 10.7TF/s,翻了一番还多。
FP8、FP16、TF16 等数据格式的性能,则基本没有变化。
Blackwell Ultra 的主要部署形势是 GB300 NV72 服务器,液冷机架,每个节点还是包含两颗 B300 GPU、一颗 Grace GPU。
登录后才可以发布评论哦
打开小程序可以发布评论哦