快科技 6 月 8 日消息,瑞穗证券发布了一份调研报告显示,谷歌自研 TPU 芯片正以远超预期的速度冲击 AI 芯片市场,预计 2028 年出货量将突破 3500 万颗,较 2025 年的 240 万颗增长超过 14 倍。
在如此快速增长的背景下,其推理成本比英伟达 GPU 低 30% 以上,正在逐步打破英伟达的垄断格局。
瑞穗预测 2026 年谷歌 TPU 出货量约 430 万颗,2026 至 2028 年的累计出货量将接近 5000 万颗。
高盛研究数据显示,谷歌 TPU 的能效比是英伟达 H100 的 2 到 3 倍。从 TPU v6 升级至 v7,单位 token 推理成本暴降 70%,与英伟达 GB200 NVL72 基本持平。
分析指出,TPU 并非追求单卡峰值性能,而是为大规模在线推理定制,通过 XLA 编译器、环面拓扑网络与软硬件协同设计,实现训练与推理全链路能效最优化。
供应链方面,博通仍是 TPU 核心设计合作方,凭借定制硅片、以太网方案及高速 SerDes 整合能力构筑了深厚护城河。
Google 则在第八代 TPU 中引入双轨策略,让联发科加入供应体系,负责推理芯片 TPU 8i 及 I/O Die 与后段整合,共同分摊 TPU 的设计与制造任务。
需要指出的是,自研 TPU 持续向 HBM4、HBM4e 等高阶内存迭代,内存消耗量不降反增,为三星、SK 海力士、美光带来新增订单。



登录后才可以发布评论哦
打开小程序可以发布评论哦