IT之家 08-25
英伟达最强 AI 芯片 Blackwell Ultra GB300:性能较GB200快 50%
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

IT 之家 8 月 25 日消息,英伟达于 8 月 22 日发布博文,深入分析了其最快 AI 芯片 Blackwell Ultra GB300,比上一代 GB200 性能提升 50%。

该芯片采用双光罩(Reticle)设计、2080 亿晶体管、2 万个 CUDA 核心,并配备 288GB HBM3e 显存,带宽达 8TB/s。

GB300 采用双光罩(IT 之家注:芯片光刻时单次曝光的最大尺寸单位,双光罩设计指通过互连技术将两颗大芯片作为一体运行)大芯片设计,通过 NV-HBI 高速互连将两颗芯片以 10TB/s 带宽连接为单颗 GPU。

该芯片基于台积电 4NP 工艺制造,集成 2080 亿晶体管,拥有 160 个 SM 单元,每个 SM 共有 128 个 CUDA 内核,总计 20480 个 CUDA 核心与 640 个第五代 Tensor 核心,并具备 40MB TMEM。

在存储方面,GB300 配备 288GB HBM3e 显存,带宽达 8TB/s,较 GB200 的 192GB 大幅提升,8 组堆叠显存通过 8192-bit 位宽连接,可容纳 3000 亿以上参数模型,支持更长的上下文长度及更高计算效率。

互连方面,Blackwell Ultra 支持第五代 NVLink,实现每 GPU 1.8TB/s 双向带宽,最多支持 576 GPU 互连;PCIe Gen6 接口提供 256GB/s 带宽,并支持与 Grace CPU 的 NVLink-C2C 协同。企业特性还包括多实例 GPU(MIG)分区、安全计算和 AI 预测运维功能。

在系统层面,Grace Blackwell Ultra 超级芯片将一颗 Grace CPU 直连两颗 GPU,构成 GB300 NVL72 机架系统,峰值算力可达 1.1 EFLOPS FP4。

安全与管理方面,GB300 搭载升级版 GigaThread 调度引擎,支持多实例 GPU(MIG)灵活分配显存资源,并引入机密计算与 TEE-I/O 特性保障 AI 模型与数据安全。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

芯片 gpu 英伟达 ai芯片 第五代
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论