如今,HBM 不再是一个小众产品,它已经成为 AI 革命的核心。作为推动 AI 技术飞跃的基础设施,HBM 的崛起不仅仅是一项技术进步,更是对传统内存瓶颈的有效突破。它通过将多个内存 Die 垂直堆叠,大幅提升了带宽和数据传输效率,让处理速度更快、传输路径更短。与传统的 GDDR 和 LPDDR 内存相比,HBM 的迭代速度更是飞跃式的,其带宽增长令人惊叹,远远超越了以往的标准。
HBM 市场竞争格局中,SK 海力士和三星是当之无愧的主角,它们在 2024 年合计占据了超过 90% 的市场份额(SK 海力士 54%,三星 39%)。而美光则扮演着追赶者的角色,占据 7% 的市场份额。
这三家巨头,都在为下一代 " 王牌 " —— HBM4 摩拳擦掌。在 2025 年的闪存峰会(FMS)上,它们纷纷亮出自己的肌肉,给 HBM4 贴上了各种高标签,比如 " 重新定义内存 "、" 下一代里程碑 "。。。HBM4 以箭在弦上,争夺 HBM 领导地位的竞争已成为全球舞台上的一场战略性竞赛。
SK 海力士:性能和效率,我全都要!
随着功耗成为重要限制因素,HBM 正在向着性能和效率的平衡方向发展。SK 海力士认为,HBM 的引入能够显著提升 AI 的性能和质量,甚至超越了传统的内存性能增长速度,从而打破了所谓的 " 内存墙 " 瓶颈。
SK 海力士将 HBM 定位为 " 近内存 "(Near-Memory),即在内存层次结构中,HBM 比传统主内存(DRAM)更接近计算核心(CPU/GPU),因此具有更高的带宽和更快的响应速度。
SK 海力士的底气源于 HBM 的三大结构优势:通过 3D TSV(硅通孔)堆叠实现高容量;通过宽通道并行传输实现高带宽;以及在单位比特传输上比传统 DRAM 更低的能耗,从而实现了更高的能效。这些结构上的创新正是 HBM 能够大幅提升系统性能、尤其是在 AI 等高吞吐量应用中发挥关键作用的核心原因。
在 HBM2E、HBM3、HBM3E 和 HBM4 的代际演进过程中,SK 海力士实现了 HBM 的带宽显著提升,能效越来越高。值得注意的是,在 HBM3E 到 HBM4 的过渡中,带宽增加了 "200%"(即提升到原来的三倍),显示出 HBM4 在带宽上的巨大飞跃。
三星:步步为营
三星也将 HBM 视为近存的一种,三星在 FMS 上介绍了其 HBM 的演进路线,自 2018 年一直到 2027 年,HBM 的带宽不断提升:HBM2 ( 2018 年 ) 带宽为 307 GB/s — >HBM2E ( 2020 年 ) 带宽提升至 461 GB/s — >HBM3 ( 2022 年 ) 带宽大幅提升至 819 GB/s — >HBM3E ( 2024 年 ) 带宽进一步提升至 1.17 TB/s — >HBM4 ( 2026 年 ) 带宽预计将达到 2.048 TB/s。到 2027 年,三星预计其 HBM4E 将超越 HBM4,拥有更大容量、更高带宽、更强的可控性。
三星 HBM 的技术指标
从 HBM2 到 HBM4E,为了实现更高的容量和带宽,芯片尺寸在不断增加。与此同时,功耗的上升是高性能和高带宽带来的必然结果,HBM 的功耗从 12W 增加到了 42.5W,但这确实对散热设计提出了巨大的挑战。
尽管总功耗在增加,但能源效率却在持续降低。从 HBM2 的 6.25 pJ/bit 一直下降到 HBM3E 的 4.05 pJ/bit。值得一提的是,2024 年三星的 HBM3E 的芯片尺寸(121.0 mm2)与 HBM3 保持一致,但能源效率却由 4.12 pJ/bit 下降到了 4.05 pJ/bit。这表明了显著的技术进步,这对于数据中心和 AI 应用至关重要,因为功耗是运营成本和散热设计的一个主要挑战。
三星将 HBM4& HBM4E 是下一代里程碑,据三星的介绍,HBM4 的一个关键的技术变革是从传统工艺到 FinFET 工艺。这种 " 逻辑工艺变革 " 所带来的具体优势有三点:一是提升高达 200%,二是面积减少高达 70%,三是功耗减少高达 50%。
三星还介绍了其用于 HBM 堆叠的创新封装技术—— HCB。其实也就是混合键合技术,HCB 实现了 HBM Die(芯片)之间以及 Die 与中介层(interposer)之间无缝、直接的连接,而不是通过传统的微凸点(micro-bumps)焊接。
采用 HCB 技术相比传统技术 TCB(Thermo-Compression Bonding,热压键合),可以支持 HBM 的堆叠层数提升高达 33%,由于 HCB 的无间隙特性和更小的连接间距,它可以支持更高的堆叠层数,从而在相同面积下实现更大的总容量;热阻提升高达 20%,HCB 的无间隙直接连接,提供了更短、更高效的热传导路径,从而为更高的功耗提供更好的散热支持。
美光:后来者能否追上?
美光对于 HBM4 倒是轻轻带过,介绍了许多其他内存产品,如 G9 QLC/TLC NAND、PCIe 6 SSD。
在这场 HBM 的竞赛中,美光虽然起步稍晚,但步子迈得却很坚定。他们直接跳过了 HBM3,用 HBM3E 直接杀入市场,成为英伟达 H200 GPU 的重要供应商。目前,美光正加速推进 HBM 技术迭代,计划于 2026 年推出 HBM4。
美光的 HBM4 采用 12 层内存 Die 堆叠设计,相较于 HBM3E 的 24 GB 和 36 GB 容量选项,HBM4 以 36 GB 为主要规格。带宽从 HBM3E 的 1.2 TB/s 大幅提升至超过 2 TB/s,配备 2048-bit 超宽接口,能效较前代提升超 20%。
HBM4 之后,美光并未明确 HBM4E 的路线图,只说未来 HBM4E 将持续朝更高带宽、更大容量、更高能效及更强定制化方向发展。
虽然路线图看起来各家都在按部就班的进行,但是需要知道的是,HBM 制造过程非常复杂。按照 SK 海力士的信息,HBM 的生产制造大约需要经过前端和后端的七大主要步骤:1)硅刻蚀— >2)TSV 铜填充— >3)BEOL 金属化— >4)前端凸点形成与焊料回流— >5)临时载体结合和背面研磨— >6)在晶圆背面形成凸点— >7)载体解离、芯片堆叠和封装。(1-4 为前端制程,5-7 为后端制程)
TrendForce 分析师认为,HBM 技术的核心发展策略,主要是通过前端工艺的改进,来提升带宽和单 Die 密度。例如,提升 I/O 数量需要更多的 TSV(硅通孔)和 bumps/pad(凸点 / 焊盘)。TSV 是 HBM 堆叠的关键技术,用于连接垂直堆叠的芯片;提升单 Die 密度同样需要改进前端工艺。不过随着 HBM 的 Die 尺寸持续增大,导致每 GB 成本更高。
但与此同时,后端工艺的进步也是 HBM 技术发展的另一面。后端工艺的核心目标是增加堆叠层数。三大 HBM 供应商采用不同的堆叠技术,其中海力士以 MR-MUF 著称,三星和美光则主要使用 TC-NCF。
HBM 堆叠技术的解读:
TC-NCF(Thermo-Compression Non-Conductive Film):一种使用非导电薄膜进行热压键合的技术,其制造工艺需要在堆叠每一层芯片时都采用高温(>300°C)高压,这会导致更长的循环时间。
MUF(Mass Reflow Underfill):一种在封装过程中使用塑封材料(Underfill)填充芯片之间间隙的技术,海力士在这一领域有独特的优势。与 TC-NCF 相比,MR-MUF 工艺是将所有存储芯片都放置到缓冲芯片上之后,一次性进行大规模回流焊。这个过程采用低温(<300°C),将所有层同时键合。
16 层堆叠的工艺尚不确定,可能是 Hybrid Bonding(混合键合)或继续使用 TC-NCF/TC Bonding。16 层堆叠的 Die 间隙非常小,大约 5 微米,对 Die 的核心高度(20-25 微米)提出了严格要求。
Market and technology Trends 分析师也认为,2026 年,HBM4 ( 12 层 ) 和 HBM4e ( 16 层 ) 可能开始采用新的键合技术。从 2028 年的 HBM5(20 层)开始,晶圆到晶圆(W2W)混合键合将成为主流,而芯片到晶圆(D2W)键合也将在随后的世代中扮演重要角色。
不仅是工艺,HBM 的架构创新也很关键。HBM 正在从 " 标准 HBM"(s-HBM)向 " 定制 HBM"(c-HBM)发展。定制 HBM 将部分原本位于 GPU/ASIC 上的 HBM PHY 和逻辑功能集成到 HBM 的基底芯片中,从而实现更短的通道长度、更少的 I/O 数量和更低的功耗,显著提升系统性能和降低总拥有成本(TCO)。
根据 Yole Group 的数据,无论是从收入、位出货量还是晶圆生产量来看,HBM 市场未来几年都呈现出高速增长的态势。
从收入金额来看,全球 HBM 收入预计将从 2024 年的 170 亿美元增长至 2030 年的 980 亿美元,复合年增长率达 33%。HBM 在 DRAM 市场中的收益份额预计将从 2024 年的 18% 扩大到 2030 年的 50%。
从位出货量来看,HBM 从 2023 年的 1.5 B GB,到 2024 年的 2.8 B GB。到 2030 年,预测将达到 7.6 B GB。HBM 位出货量占 DRAM 市场总出货量的份额,从 2024 年开始快速增长,到 2030 年预测达到 10% 左右。
在 HBM晶圆生产量方面,从 2023 年的 216 K WPM,到 2024 年的 350 K WPM。到 2030 年,预测将达到 590 K WPM。HBM 晶圆生产量占 DRAM 市场总晶圆生产量的份额,到 2030 年预测达到 15% 左右。
尤为注意的是,尽管 HBM 的位出货量占 DRAM 市场的份额(~10%)相对较小,但其收入占比却能达到接近 50%,这凸显了 HBM 的高附加值和高单价,也解释了为什么晶圆生产量(~15%)的占比介于收入和位出货量之间。目前 HBM 的每比特成本是 DDR 的约 3 倍,到 HBM4 时将增至 4 倍。然而,由于高需求,HBM 的定价是 DDR 的约 6 倍(HBM4 将是 8 倍),毛利率远高于 DDR,达到 70%。
不过,MKW Ventures Consulting LLC 的分析师也发出了警告:当新技术热度高涨时,往往伴随着夸大的预期,要警惕过渡炒作的风险。此外,在快速增长的市场中,修正和周期性是常见的:由于主要供应商(SK 海力士、三星、美光)的产能增加,可能导致供应过剩,进而引发市场修正,市场终将进入一个 " 消化 " 阶段,增长减少,没有备用订单,没有库存积累,只有过剩的库存,10% 的下降可能变成 30% 的下降。HBM 市场的超高速增长率将从 2024/2025 年的 100% 下降到 2026 年的 20%。
顺便提一下,半导体(特别是内存市场)即将进入修正期的一些关键指标可以作为参考:
终端客户收入增长的任何小问题:如果终端客户(例如诺基亚)的收入增长因任何原因出现问题,这可能是一个早期信号。
库存增长:终端客户或内存公司的库存开始增长。
位增长,但利润增长放缓:内存公司的位出货量在增长,但利润增长却放缓。这通常是由于竞争加剧导致价格侵蚀。
供应突然增加:新的产能上线,例如三星获得资格或美光的新工厂投产。
" 消化 " 一词的使用:当超大规模数据中心运营商或英伟达开始使用 " 消化 "(Digestion)这个词时,这通常意味着需求放缓。
CFO 的言论:当内存公司 CFO 发表 " 这只是短期调整,细分市场仍然强劲 " 之类的言论时,这可能是一个反向指标。
2026 年底的供过于求:如果 2026 年底出现供过于求,定价将变得激进。
HBM 独特的供应链:HBM 拥有独特的供应链,DDR 和 HBM 之间的灵活性极小 / 很慢。
HBM 毛利率下降:HBM 的毛利率将至少降至 40% 或更低。
因此,尽管 HBM 市场前景光明,但其发展并非一帆风顺,将不可避免地经历周期性的调整。
虽然目前 HBM 还是存储巨头的天下,但是不可忽视的一点,中国正在加大力度实现 HBM 生产的本地化。强大的国内 AI 加速器需求、大量的政府支持以及成熟的产业网络,很可能在未来几年内为中国企业在 HBM 市场赢得重要的立足之地。
登录后才可以发布评论哦
打开小程序可以发布评论哦