快科技 12 月 11 日消息,美国日前解禁了 NVIDIA H200 显卡的对华出口,这款显卡相对之前阉割版的 H200 大幅提升,对提升大模型训练推理能力很有帮助。
伴随 H200 解禁还有一个问题值得关注,那就是这款显卡使用的 HBM3e 显存是否也同样解禁了,可惜答案是否——美国对国内企业的 HBM 出口禁令依然存在,并不允许单独出售。
NVIDIA 的 H200 显卡使用了上代的 Hopper 架构,FP32 性能 67TFLOPS,FP16 性能高达 1979TFLOPS,是 H20 显卡的 6 倍,同时也是全球首发 HBM3e 显存的,容量 141GB,带宽高达 4.8TB/s。
国内的 AI 显卡之前在用的还是 HBM2e 标准的,不论容量还是性能已经跟不上顶级 AI 模型的需求了。
不过 HBM3e 虽然还是不能出口,但华为已经有了自研的替代方案,今年 9 月份华为宣布自研了两种 HBM,分别是 HiBL 1.0 和 HiZQ 2.0,可根据不同的场景用于不同的 AI 显卡。
明年上半年的 Ascend?950PR 采用了华为自研的低成本 HBM 技术 HiBL 1.0,相比高性能、高价格的 HBM3e/4e,能够大大降低推理 Prefill 阶段和推荐业务的投资。
明年下半年问世的 Ascend 950DT 采用了 HiZQ 2.0,使内存容量达到 144GB,内存访问带宽达到 4TB/s。同时把互联带宽提升到了 2TB/s。

未来的 Ascend 960、Ascend 970 还会进一步提升容量到 288GB,带宽 9.6TB/s、14.4TB/s,时间点在 2027 到 2028 年。



登录后才可以发布评论哦
打开小程序可以发布评论哦