支持更多数值类型、升级更大内存、实现更高算力。
作者 | ZeR0
编辑 | 漠影
芯东西 9 月 18 日报道,今日,在华为全联接大会 2025 开幕式上,华为副董事长、轮值董事长徐直军发表主题演讲,公布华为昇腾 AI 芯片 4 年 5 款产品路线图。
华为在今年第一季度推出昇腾 910C AI 芯片,预计将于 2026 年第一季度推出昇腾 950PR,2026 年第四季度推出昇腾 950DT,2027 年第四季度推出昇腾 960,2028 年第四季度推出昇腾 970。
▲昇腾芯片路线图(芯东西制表)
昇腾 950 芯片架构新增支持低精度数据格式,FP8、MXFP8、HiF8 精度下 AI 算力可达到 1PFLOPS,MXFP4 精度下 AI 算力可达到 2PFLOPS,互联带宽提升 2.5 倍至 2TB/s。
该系列芯片还提升了向量算力配比,支持 SIMD/SIMT,并支持更精细粒度内存访问(512B → 128B)。
其支持华为自研 HBM。昇腾 950PR采用的是 HiBL 1.0,内存容量为 128GB、带宽为 1.6TB/s;昇腾 950DT采用的是 HiZQ 2.0,内存容量为 144GB、带宽为 4TB/s。
昇腾 950PR提升了推理 Prefill 性能,支持 FP8、MXFP8、HiF8、MXFP4,并优化了推荐业务性能。
昇腾 950DT提升了推理 Decode 性能,支持 FP8、MXFP8、HiF8、MXFP4;还提升了训练性能,支持 FP8、MXFP8、HiF8。
昇腾 960大幅提升训练和推理性能,算力、内存容量、内存带宽、互联端口数均翻倍,内存容量升级到 288GB,内存带宽为 9.6TB/s,支持 40 个互联端口,支持自研 HiF4 数据格式(最优 4bit 精度实现)。
该芯片在 FP8 精度下 AI 算力达到 2PFLOPS,FP4 精度下 AI 算力达到 4PFLOPS。
昇腾 970的训练和推理性能继续翻倍,FP8 精度下 AI 算力达到 4PFLOPS,FP4 精度下 AI 算力达到 8PFLOPS,内存带宽为 14.4TB/s,互联带宽为 4TB/s。
总体而言,昇腾芯片迭代路径是支持更多数值类型、升级更大内存容量与带宽、实现更高算力、更加易用。
登录后才可以发布评论哦
打开小程序可以发布评论哦