全天候科技 4小时前
TPU vs GPU:谷歌芯片商业化提速,英伟达护城河能防得住吗?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

当谷歌开始尝试把自研的 AI 芯片 TPU(Tensor Processing Unit)卖向更广阔的市场,这场原本只发生在云端的 " 芯片暗战 " 正在被推到台前,并对 AI 芯片霸主英伟达构成实质性挑战。

科技媒体 The Information 最新文章分析称,英伟达无法忽视的是,全球最先进的两个 AI 模型——来自谷歌和 Anthropic 的模型,完全或部分使用谷歌自研的 TPU 芯片开发,而非英伟达的 GPU。这一现实已促使英伟达最大客户之一 Meta 认真考虑使用谷歌的 TPU 来开发新模型。

这意味着,TPU 的角色已从 " 谷歌内部工具 " 升级为一个可以被大型 AI 公司认真考虑的替代方案。据摩根士丹利此前分析,谷歌计划 2026 年生产超过 300 万片 TPU,2027 年约 500 万片,而英伟达目前的 GPU 产量约为谷歌 TPU 的三倍。

虽然单颗 TPU 不及最强 GPU,但谷歌借助超大规模集群和更高性价比,正在撬动英伟达的定价权和市场控制力。真正的战场在生态与商业模式——英伟达靠 CUDA 锁定用户,谷歌则用 TPU + Gemini 打开新入口。英伟达在通用性和生态成熟度上占据明显优势,但当越来越多头部客户开始 " 试水 "TPU,任何一丝松动,都会被市场迅速放大。

性能对比:单芯片输,系统赢?

从纯粹的算力来看,最先进 TPU(代号 Ironwood)在每秒浮点运算次数(FLOPS)上约为英伟达 Blackwell GPU 的一半。

但这并不意味着 TPU 就处于下风。

The Information 称,谷歌的策略是通过 " 集群化 " 来放大性能优势:数千颗 TPU 可以被串联成一个 " 超级 Pod",在训练超大模型时具备出色的性价比与能效比。而英伟达单个系统最多只能直接连接约 256 颗 GPU 芯片,尽管用户可以通过额外的网络设备扩展规模。

在大模型时代,已经很难用 " 单芯片性能 " 简单定胜负,系统级设计、互连能力和能效比,正在成为新的核心指标。

关键差异:软件生态仍是英伟达护城河

真正构成英伟达 " 护城河 " 的,不只是硬件,而是深度绑定的 CUDA 软件生态。

The Information 文章称,对已使用英伟达 Cuda 编程语言运行 AI 的客户而言,租用英伟达芯片更具成本效益。而有时间和资源重写程序的开发者可通过使用 TPU 节省成本。

对 Anthropic、苹果和 Meta 等技术水平较高的 TPU 客户,使用 TPU 的挑战相对较小,因为它们更善于为 AI 应用编写服务器芯片软件。TPU 在运行针对其优化的谷歌 Gemini 模型时成本效率尤其突出。

然而软件兼容性仍是 TPU 面临的主要挑战。TPU 仅能与 TensorFlow 等特定 AI 软件工具顺畅配合,而大多数 AI 研究人员使用的 PyTorch 在 GPU 上运行效果更佳。多名工程师表示,如果开发者花时间编写定制软件充分利用 GPU,其性能可能超过 TPU。

成本之战:TPU 并非 " 廉价 "

在制造成本上,TPU 与 GPU 其实相差不大。Ironwood 使用了比 Blackwell 更先进、也更昂贵的制程技术,但由于芯片体积更小,同一片晶圆上可切割出更多 TPU,从而部分抵消了成本劣势。

两者都使用高带宽内存(HBM),而在工艺和封装方面,博通扮演了极其关键的角色——不仅参与封装设计,还提供了 SerDes(高速数据传输核心技术)等关键 IP。分析机构估算,博通从 TPU 项目中获得的收益至少达到 80 亿美元。

值得注意的是,英伟达当前的硬件业务毛利率高达 63%,而谷歌云整体只有 24%。这也解释了,为什么英伟达能在价格战中仍保持极强的盈利能力。

产能博弈:台积电的 " 平衡术 "

在晶圆代工端,台积电并不会将所有产能押注在单一客户上。即使英伟达需求极其旺盛,也很难获得 " 无限供应 "。这意味着,市场上始终会留出空间给其他方案——包括 TPU。

根据摩根士丹利的预测,谷歌计划在 2026 年生产 300 万颗 TPU,到 2027 年达到 500 万颗,甚至可能更高。目前,英伟达 GPU 的产量大约是 TPU 的 3 倍左右,差距正在缩小。

当供应开始变得多元化,客户自然也会更加愿意比较、议价与分散风险。

商业化难题:卖芯片远比想象难

The Information 认为,如果谷歌真的想大规模对外销售 TPU,它需要几乎重建一整套产业链——包括服务器厂商、分销网络、企业级售后支持等,这基本就是 " 复制一个英伟达 "。

此外,如果客户把 TPU 部署在自己的数据中心,谷歌将失去部分云服务收入(如存储、数据库服务等),这就意味着:未来 TPU 很可能并不会走 " 低价路线 ",而是通过其他费用来弥补收入缺口。

换句话说,这并不是一门 " 便宜就能赢 " 的生意,而是一场复杂的战略选择。

从更高维度看,TPU 对谷歌的意义并不只在硬件收入本身。更重要的是:可以成为与英伟达谈判的筹码;有助于推广 Gemini 及其 AI 生态让谷歌在 AI 基础设施上拥有更大自主权。只要客户愿意 " 多一个选项 ",英伟达就不再拥有绝对定价权。

这,或许才是谷歌真正想要的。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

英伟达 谷歌 芯片 gpu ai
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论