驱动之家 昨天
昇腾950首发!华为自研HBM内存正式公布:最大144GB 带宽4TB/s
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 9 月 18 日消息,今日举办的华为全联接大会 2025 上,华为轮值董事长徐直军首次公布了昇腾芯片演进和目标。

他表示,未来三年,华为已经规划了昇腾多款芯片,包括昇腾 950PR、950DT 以及昇腾 960、970。其中昇腾 950PR 2026 年第一季度对外推出,该芯片采用了华为自研 HBM。

根据现场公布的信息,昇腾 950PR 芯片架构新增支持低精度数据格式,其中 FP8/MXFP8/HIF8: 1 PFLOPS,MXFP4: 2 PFLOPS,重点提升向量算力,提升互联宽带 2.5 倍,支持华为自研 HBM 高带宽内存,分为 HiBL 1.0 和 HiZQ 2.0 两个版本。

规格方面,HiBL 1.0 容量 128GB,带宽 1.6TB/s;HiZQ 2.0 容量 144GB,带宽 4TB/s。

其中,昇腾 950PR 芯片采用 950 核心 +HiBL 1.0 内存,可提升推理 Prefill(预填充)性能,提升推荐业务性能。

昇腾 950DT 采用 HiZQ 2.0 内存,可提升推理 Decode(解码)性能,提升训练性能,提升内存容量和带宽。

延伸阅读:

在大模型推理中,Prefill 阶段负责接收完整输入数据(如文本或图像),并计算缓存。这一过程需要强大的算力支持,通常由高性能芯片完成。 该阶段强调算力而非内存带宽,因此更适合在 HBM(高带宽内存)芯片上运行。相比之下,后续的 Decode 阶段更依赖高速内存传输和互联方案。

HBM(High Bandwidth Memory,高带宽内存)是一种基于 3D 堆叠技术的先进 DRAM 解决方案,多层 DRAM 芯片垂直集成,显著提升数据传输效率。具有超高带宽与低延迟、高容量密度、高能效比等优势,能协助快速处理数据密集型的 AI 任务。

美国国际战略研究中心(CSIS)AI 专家艾伦(Gregory Allen)解释,HBM 对于制造先进 AI 芯片至关重要,价值约占整体芯片的一半。

AI 推理需频繁调用海量模型参数(如千亿级权重)和实时输入数据。HBM 的高带宽和大容量允许 GPU 直接访问完整模型,可避免传统 DDR 内存因带宽不足导致的算力闲置。对于千亿参数以上的大模型,HBM 可显著提升响应速度。

当下,HBM 已成为高端 AI 芯片的标配,训练侧渗透率接近 100%,推理侧随模型复杂化加速普及。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

华为 ai ai芯片 芯片 渗透率
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论