从谷歌到寒武纪，挑战英伟达的两种路径

文 | 硅基观察

10 月 29 日，英伟达股价大涨，成为全球第一家市值突破 5 万亿美元的企业。而在 2023 年 5 月 30 日，英伟达才刚刚迈入万亿美元市值俱乐部。

英伟达的爆发，再次证明了 " 卖铲人 " 的价值。引爆这一轮 AI 行情的大模型公司们普遍尚未盈利，但英伟达两年赚了超过 1000 亿美元。

在整个生态中，英伟达成为唯一一家赚到巨额实际利润的企业，反映出 AI 产业链并未处于健康状态。但各家公司别无选择，GPU 具备处理大量并行计算的能力，天然适合大模型训练和推理。而 GPU 行业玩家寥寥，英伟达在 AI 计算加速芯片领域处于实质性垄断地位，2024 年全球市场份额超过 80%。

这种情况下，问题出现了：英伟达的垄断优势能保持多久？市场上何时出现一个足以抗衡英伟达的挑战者？

目前来看，除老对手 AMD 外，市面上存在两类挑战者，一类是试图摆脱英伟达 GPU 依赖的国际巨头，以谷歌为代表；另一类则是面临美国 AI 芯片出口制裁困境下，不得不自主研发 AI 计算加速芯片的中国企业，包括华为、寒武纪、摩尔线程、海光信息、壁仞科技等。

这些企业都不愿意接受被英伟达 " 卡脖子 "，因此不断投入资金研发技术或扶持竞争势力。AMD、摩尔线程沿用 GPU 路线，直接正面硬刚；谷歌、华为等企业则选择比 GPU 效率更高的 ASIC 路线，虽然难题不少，但潜力巨大。

从技术和商业层面来看，毫无疑问，英伟达很难长期保持垄断优势，未来行业内必然将出现足以抗衡英伟达的挑战者，剩下的只是时间问题。

国际巨头和国内对手，挑战英伟达

目前来看，这些挑战者与英伟达仍有明显差距，但潜力也不容小觑。

在这些挑战者中，AMD 是英伟达的老对手。据官方数据，AMD 当前量产的最新产品 MI355X 芯片推理性能优于英伟达 B200，仅次于英伟达当前最强量产产品 B300。

但整体来看，MI355X 虽然采用了台积电的 3nm 工艺，但并没有显著领先 4nm 的英伟达 B200，同时在软件生态、互联、数据传输等领域显著落后于英伟达。

除 AMD 外，国内外两类英伟达的挑战者，第一类是以谷歌为代表的国际巨头。

谷歌是 AI 领域的老牌巨头，底蕴深厚，早在 2013 年就开始了 TPU（Tensor Processing Unit，张量处理单元）的研发，这是一款专为机器学习和深度学习任务加速设计的专用集成电路芯片（ASIC），2016 年 5 月首次公开并应用于 AlphaGo 上，目前已经迭代至第 7 代。

今年 4 月发布的 Ironwood TPU v7，在单芯片 FP8 算力、内存配置、内存带宽等方面已经媲美英伟达 B200。同时，超强的规模扩展能力，也被视为谷歌 TPU 的最大优势。目前，推出 Claude 模型的 Anthropic 是谷歌最大的客户之一。

不过，谷歌 TPU 目前并不对外出售商品，仅以谷歌云服务对外出租算力，其生态体系也有待完善，目前客户群体远不如英伟达。

除谷歌之外，几乎所有大型 AI 公司都在加速自研 AI 芯片。如 OpenAI 和 xAI 一边大举购买英伟达芯片，另一边推动自研算力芯片进展，Meta 也被媒体爆出正与博通合作开发定制芯片。

国内则是另一番景象。从 2022 年开始，美国开始限制对中国的 AI 芯片出口，之后不断升级，目前英伟达 H20 可以进入国内市场，但被曝出有 " 漏洞后门 "，存在安全风险，未来市场销售存在较大不确定性，英伟达算力更高的 H100 及更高等级的产品仍被禁止进入国内市场。

在这种情况下，国内企业加速算力替代步伐，形成多条路线，如摩尔线程与英伟达一样主打全功能 GPU，既支持 AI 计算加速，也具备图形渲染、视频解码、物理仿真等功能。

目前，摩尔线程是国内唯一一家量产的全功能 GPU（既能做图形显示渲染也能进行 AI 计算加速）企业，在招股书中，摩尔线程表示，其最新的 S5000 计算加速卡在 FP32 精度上，算力为 32TFlops，这一数据接近英伟达的 H20 的 44TFLOPS。

海光信息、壁仞科技、沐曦股份等企业则与 AMD 类似主打 GPGPU（省去图形功能专做 AI 计算加速），专注执行 AI 计算加速业务。华为海思、寒武纪两者为非 GPU 路线，也采用与谷歌一样的 ASIC 路线，定制 AI 计算加速芯片，推出 NPU（嵌入式神经网络处理器）产品。

华为目前量产的昇腾 910C，据媒体报道其推理性能已经达到英伟达 H100 的 60%。今年 8 月，据华为云 CEO 张平安介绍，华为云服务生产效率已经达到英伟达 H20 芯片的 3 倍。

寒武纪是国内 ASIC 路线先行者，其现有的思元 590 芯片，外界普遍认为其性能达到英伟达 A100 的 80%。

2024 年，国内 AI 计算加速市场，英伟达排名第一，仍占据 54.4% 的市场份额。华为海思份额为 21.4%，AMD 市场份额为 15.3%。

从市场份额来看，华为海思是国内 AI 计算加速芯片龙头，其他国产 AI 芯片企业仍有待突破。在大国竞争的逻辑下，国产算力正在加速发展，成为替代英伟达的另一支重要力量。

综合来看，国内外 AI 计算企业，已经形成了抗衡英伟达的两条主线，在行业发展的迫切需求下，这场挑战英伟达的长期战役已经打响。

ASIC 技术，或为抗衡英伟达的关键

目前来看，英伟达的竞争对手距离英伟达尚有着明显差距，但从技术和商业角度来看，英伟达的垄断地位很难长期保持下去。

技术层面，近年来不断发展的大模型以及备受关注的世界模型，均需对海量数据进行处理，因此对算力的需求持续增长。

展望未来，除非有颠覆性的技术出现，AI 模型必然也需要面对更多各层面数据，从而实现真正的人工智能。这也意味着，AI 行业的算力需求很难停止。

从这个基础出发，用专门定制的 AI 计算芯片（即 ASIC）替代现有的 GPU 更符合半导体芯片的迭代逻辑：效率优先。

" 效率优先 " 的逻辑在半导体行业历史悠久，在目前芯片种类中，能效比排序为 ASIC＞FPGA（现场可编程门阵列）＞GPU＞CPU。在对效率的追求下，行业应用芯片大多遵循上述逻辑进行迭代。

众所周知，人们最早用 CPU 进行图像渲染，之后为了提升效率，出现了专门用于处理像素点的 GPU，更专业的产品带来了更强的处理效率。

在此前的比特币矿机领域也是如此。人们最早用家用电脑 CPU 就能挖比特币，但随着挖矿难度提升，人们转向效率更高的 GPU。

之后，为了进一步提升挖矿效率，企业专门开发出 FPGA。后续随着挖矿算法固定，ASIC 芯片成为最终选择。

GPU 可以运行大量并行计算，通用性和灵活性更强。AI 的计算任务较为单一，ASIC 芯片则完全为 AI 训练和推理定制，计算能力上限更高，具备较强的取代 GPU 的潜力，这也是谷歌、华为等企业选择 ASIC 路线的原因之一。

目前全球表现最为突出的 ASIC 芯片即是前文所说的谷歌 TPU，其纸面实力已经媲美英伟达次旗舰产品 B200，也被市场认为是英伟达的最强对手。

去年 7 月底，苹果公司曾发布过一篇论文，展示苹果公司用谷歌 TPU 芯片训练其 AI 模型。消息一出，英伟达股价暴跌超 7%。

除此之外，国内华为海思、寒武纪的 NPU，在特定领域上也呈现出了对英伟达 GPU 的一定替代作用。

商业层面的逻辑更为简单，基于 AI 行业对算力的庞大需求将长期存在的预期，无论从成本还是供应链安全方面考虑，AI 巨头们必然将持续推动自研 AI 芯片或扶持新的 AI 芯片供应商的进程，这一点将是毫无疑问的。

目前，英伟达也在不断调整布局以应对被替代的风险。技术层面，布局 ASIC 领域。此前有消息称，英伟达已成立 ASIC 部门，将招募超过 1000 名芯片设计、软件开发和 AI 研究人员。

历史发展中，英伟达也曾借鉴谷歌 TPU 推出了 Tensor Core 来进行矩阵运算。在这之后，从 Volta、Ampere、Hopper 到最新的 Blackwell 架构，Tensor Core 数量和尺寸不断增加，从而带来了更强的计算能力。

商业层面，近年来英伟达进行了密集的 AI 领域投资，投资对象不仅有 OpenAI、xAI 这些巨头，也有一些具备潜力的中小型公司，从广泛的投资布局来绑定下游客户、押注潜在的技术路线和发展方向，强化自身生态体系，以抵御可能的发展风险。

不过，从任何角度来看，AI 行业都不想要一个处于垄断地位的英伟达，抗衡英伟达的挑战者的出现，或许只是时间问题。

宙世代

一起剪

相关标签