半导体行业观察 5小时前
AI芯片竞争,升级
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

AI 计算需求正呈指数级增长,远远超越了摩尔定律,同时功耗和成本压力也在迅速升级。AI 计算效率的核心指标将不再是单个芯片的性能,而是机架级的每瓦性能以及每总拥有成本(TCO)的性能。这标志着更广泛的行业转变:半导体参与者必须从芯片供应商演变为机架和系统级解决方案的提供商。这种转型已经在 AI 数据中心基础设施的每一个层面展开,从存储层的 SSD POD(舱)扩展,到计算和互连层的机架 /POD 级竞争。

在此背景下,ASIC(专用集成电路)设计和服务提供商的竞争格局也在发生变化。本文探讨了英伟达(NVIDIA)和主要 CSP(云服务提供商)如何在 AI 机架 /POD 规模上进行自身定位,以及包括博通(Broadcom)、Marvell、联发科(MediaTek)、创意电子(GUC)和世芯(Alchip)在内的 ASIC 设计商,如何利用 CPO(共封装光学)等互连技术,将其触角从芯片规模扩展到机架 /POD 规模的赛场。

英伟达超越芯片,扩展至 AI 基础设施的每一个层面

首先,一个快速的定义:一个 AI POD(Point of Delivery,计算舱 / 独立交付单元)是一个由计算节点、网络、存储和软件组成的独立 AI 计算单元。Scale-up 互连(单一系统内的垂直扩展)是使多个芯片、乃至跨机架配置能够作为一个单一统一系统以超低延迟运行的技术,它构成了机架 /POD 级集成的基础。

随着 AI 计算的主要单元持续扩大,英伟达在 2026 年 3 月的 GTC 上不仅推出了七款全新的 Rubin 系列芯片,还推出了五款能够将这些芯片集成到单个机架中的 MGX 系列机架,并且机架可以通过交换机相互连接,形成大规模的 Vera Rubin POD。

为了进一步加强其 AI 数据中心硬件产品组合,英伟达近年来从内存互连交换机 IC 厂商 Enfabrica 和 AI 推理 LPU 厂商 Groq 那里获得了关键人才和技术许可,同时还投资了量子计算和光通信组件供应商,这一切都是为了将 POD 级的性能推向极致。

(英伟达 Rubin 系列的七款芯片。来源:英伟达)

(英伟达 Rubin 系列的五款 MGX 机架。来源:英伟达)

谷歌、亚马逊 AWS 和微软围绕效率构建专属 AI 机架 /POD

为了提高 AI 计算性能,CSP 不仅在其推理芯片中采用大型片上 SRAM,还在设计专属的 AI 机架和 POD。谷歌一直是最激进的,早在 2021 年(译注:原文如此,实际应为早期)就采用了自己的 Scale-up 技术 ICI(芯片间互连),在 2021 年引入了 OCS(光路交换机),并计划在 2026 年的 TPU v8 系列中部署其自研的 Axion CPU 和 Boardfly 网络架构。

AWS 计划在 2026 年的 Trainium3 UltraServer 中部署其专属的 NeuronLink 和 Graviton CPU,而微软则计划在其 Maia 200 POD 中部署以太网 Scale-up 网络和 Cobalt 200 CPU。Meta 则采取了完全不同的方法,采用开放的 OCP(开放计算项目)标准来构建标准化的数据中心硬件生态系统,旨在降低整体成本。

ASIC:博通和 Marvell 领先;联发科、创意电子和世芯押注 CPO

CSP 独立设计 AI 机架 /POD 的趋势,推动了 ASIC 设计和服务提供商超越芯片级的供应,向机架 /POD 级的解决方案扩展。对于 ASIC 设计商而言,这创造了一个全新的增量市场。

博通和 Marvell 已经构建了涵盖交换机和网卡(NIC)的全面产品线,同时在 CPO 技术上也取得了早期领先。联发科、创意电子和世芯最初专注于在 AI 芯片开发中建立良好的过往业绩,并计划将 CPO 集成平台作为其进入机架 /POD 规模市场的途径。

正如 TrendForce 的产品线概览所示,CPO 是除 AI 芯片之外,所有六家主要公司都承诺投入的技术赛道,这标志着行业广泛公认 CPO 已成为下一代 AI 机架 /POD 性能的关键分水岭之一。

https://insights.trendforce.com/p/asic-rack-pod-scale

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 英伟达 数据中心 芯片 基础设施
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论