快科技 8 月 28 日消息,号称 Superchip 超级芯片 GB10 Grace Blackwell,可以说是 NVIDIA 今年最值得期待的产品,也被视为 NVIDIA 进军桌面 CPU 市场的第一步 ( 笔记本移动端则是 N1 系列 ) ,但它没能在 7 月如期面世。
近日,NVIDIA 官方终于公布了 GB10 芯片的诸多细节,特意强调这是与联发科成功合作的成果。
其实在今年初,NVIDIA 首次宣布代号 Project DIGITS、后命名为 DGX Spark 的桌面迷你 AI 工作站的时候,就曾提及联发科的共同参与,主要贡献了 CPU 和互连部分的设计。
技术规格方面,GB10 采用台积电 3nm 工艺制造、2.5D 封装技术,其中 CPU 部分和内存成为 S-dielet,GPU 部分成为 G-Dielet。
CPU 部分集成 20 个 Armv9.2 架构核心,分为两组,每组 10 个,每个核心都有自己的独立二级缓存 ( 容量没说 ) ,然后每一组共享 16MB 三级缓存。
GPU 部分基于 Blackwell 架构,CUDA 核心数量没说但应该是 6144 个,也就是相当于 RTX 5070,还有第五代 Tensor 核心、24MB 二级缓存,支持光追、DLSS4,FP32 格式算力 31 TFLOPS,NVFP4 格式算力 1000 TOPS。
CPU、GPU 之间是高带宽低功耗的 C2C 通道,基于 NVLink 总线架构。
还有 16MB 系统级缓存,可以作为 CPU 的四级缓存,进一步提高在 CPU、GPU 等不同引擎之间共享数据的效率。
内存是 256-bit 位宽的 LPDDR5X 统一内存,最高频率 9400MHz,原始带宽约 301GB/s。
整体热设计功耗高达 140W,而操作系统是定制的 DGX Base OS,能否运行其他发行版 Linux 甚至 Windows on Arm 尚未可知。
NVIDIA 宣称,搭配 128GB 内存,GB10 可以运行最高 2000 亿参数的 AI 大模型,或者最高 700 亿参数的微调模型。
两台 DGX Spark 可以通过 ConnectX-7 总线互连,大模型参数最高可达 4050 亿。
登录后才可以发布评论哦
打开小程序可以发布评论哦