虎嗅APP 昨天
英伟达“丢掉”的1000亿,国产平替还能继续赚吗?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

本文来自微信公众号:字母榜,作者:赵晋杰,编辑:王靖,题图来自:AI 生成

" 我们可能无法全部恢复先前的库存减计损失,但大多数库存是可以恢复的。新的客户需求和我们现有的库存产品是可以匹配的,所以不能说 100% 恢复,但也不是完全没有可能。"

这是英伟达创始人黄仁勋对 H20 芯片解禁后的最新表态。他在链博会上的上述讲话,无疑给了英伟达国产平替们一记闷棍。

此前,在 2025 年一季度财报电话会上,黄仁勋对外提到,因中国芯片出口限制带来的计提损失一季度 55 亿美元,二季度有望升至 80 亿美元,总损失达到近 1000 亿元人民币。

作为对比,2024 年,英伟达在中国交付了超过 100 万张 H20 芯片。按照彼时单芯片 1.2 万美元到 1.3 万美元的售价计算,仅 H20 就为英伟达贡献了超过 120 亿美元的营收,超过上一财年英伟达中国区的整体营收。

近千亿的潜在亏损,直接影响着英伟达在中国芯片江湖的市场地位。5 月份参加 Computex 2025 期间,黄仁勋对外表示英伟达在中国 AI 芯片的份额已经从 2022 年出口管制期间的 95%,下降至 50%。伴随而来的,则是英伟达在中国的市场的营收占比从 2022 年的约 40%,下降到不到 20%。

国产芯片厂商们,成了英伟达中国市场份额下滑中的最大赢家。以 DeepSeek R1 为代表的推理模型的到来,更是为国产芯片瓜分英伟达平添了一份助力。

2025 年前,大模型行业更多处在预训练阶段,一众国产芯片厂商都难以在训练效率和结果上匹敌英伟达芯片。但进入后训练阶段的推理模式后,调用大模型过程中,随着客户对芯片性能的要求直线下降,落后英伟达好几代的国产芯片厂商们,终于等来一次难得的平替机会。

据字母榜了解,华为在昇腾芯片加持下,一度在今年一季度的 DeepSeek 一体机市场,占据了超 70% 的份额。

寒武纪更是凭借飙涨的订单量,罕见地完成了扭亏为盈。沐曦股份和摩尔线程等初创芯片公司,更是在蜂拥订单助力下,纷纷开启了上市冲刺。

但 H20 芯片解禁消息一出,处在加速度中的国产芯片厂商,不可避免将迎来新一轮业务震荡期。

除了抢占以 DeepSeek 一体机为代表的推理市场,华为还瞄准了英伟达占据核心的训练市场,发起进攻。

在单卡性能不如英伟达的显示前提下,华为采取了以量取胜的笨办法,借助比英伟达更多的多卡集群来补上差距。

4 月份,华为对外推出 CloudMatrix 384 超节点,官方称其已在芜湖数据中心规模上线。据 " 科创板日报 " 报道,华为内部人士称其为核弹级的产品,或将彻底终结算力焦虑。

传统 AI 服务器通常包括 8 张算力卡,一台服务器称为一个节点。在 ChatGPT 掀起大模型浪潮,并验证了缩放法则(Scaling Law)的正确性后,更大的算力集群,便成了训练出更优模型的必备条件。

为此,AI 厂商不得不构建起包括成千上万张 GPU 算力卡的算力集群,这便带来了卡与卡之间互联和通信的新麻烦。

针对上述难题,2024 年 3 月,英伟达率先发布了 NVL72 超节点,支持把 72 张算力卡组成一个超节点,为万亿参数的大模型训练和推理提供服务。

作为对比,华为 CloudMatrix 384 顾名思义便是以 384 张昇腾算力卡组成一个超节点,从而在规模、性能和可靠性上对标英伟达的 NVL72。

华为的野心时刻被黄仁勋看在眼中。在谈及国产芯片竞争时,黄仁勋再度提及华为," 任何低估华为、低估中国制造能力的人,都是极其天真无知的。华为是一家非常强大的公司,我以前见过他们开发出的技术……他们能够做到和我们接近,这说明了一切。"

华为之外,作为当前 GPU 芯片上市第一股的寒武纪,则用更直观的财报数据,向外界展示了是如何瓜分英伟达蛋糕的。

2025 年一季度,寒武纪实现营业收入 11.11 亿元,同比暴涨 4230.22%,接近去年全年营收。归属于上市公司股东的净利润 3.55 亿元,上年同期为亏损 2.27 亿元,实现历史性的扭亏为盈。这也是寒武纪连续第二季度实现盈利,去年第四季度寒武纪归母净利约为 2.81 亿元。

更多创业公司也在暴涨订单助力之下,开始抢夺上市窗口期,包括沐曦股份和摩尔线程在内,都于年内提交了 IPO 申请。

但在国产芯片厂商纷纷争当英伟达平替的另一面,则是他们受限于产能等因素,还无法把到手的订单全部消化。

以寒武纪为例,尽管其一季度营收暴涨超 40 倍,但绝对值上也只有约 11 亿元人民币,相比英伟达一季度 55 亿美元的计提损失,占比不到 3%。

就在国产芯片还在等待产能提升的当下,英伟达 H20 芯片值此解除禁售,等于反过来又抢了一波国产芯片的空窗期。这一变动,将直接影响三季度后的国产芯片厂商整体营收规模,也将抢占国产芯片原本就不大的市场空间。

年初 DeepSeek 爆火带动一众科技大厂加码 To C 应用时,尤其是腾讯元宝因接入 DeepSeek 流量暴涨,有报道称腾讯、字节等向英伟达紧急下单了一批 H20 芯片,以满足 AI 应用的算力消耗。

但随着 4 月份 H20 被禁,上述订单也不了了之。近期 H20 解禁后,外界很快传出字节、腾讯等厂商已经向英伟达下单。对此,黄仁勋否认称,自己还没来得及与任何客户会面。" 需要一些时间来提升 H20 供应链的产能,未来几个月,英伟达将努力加速这一过程。"

之所以仍有一众厂商愿意等待英伟达 H20 芯片,关键原因之一在于,英伟达芯片在多卡串联的并行计算环节,仍然存在较大优势。

微软大中华区 Azure 事业部总经理陶然便曾对外解释道,很多厂商没有能力去实现多卡连接,但多卡并行运算却直接决定着大模型训练所需花费的时间成本," 同样的一套模型,如果训练一次需要花费一周成本为 100 万美元,但如果带宽太小最终耗时两周,那成本就将乘以 2。"

在崇尚效率的大模型赛道,时间有时比金钱更重要。更糟糕的是,即便是在更换国产 GPU 的过程中,国内 AI 厂商眼下也面临无法使用更先进制程工艺芯片的挑战。美国相关部门已经将壁仞、摩尔线程等国产 GPU 公司列入实体清单,这意味着在没有获得许可的情况下,它们既不能进口含有美国公司的任何技术或产品,也不能通过台积电等代工厂生产 14nm 以下的先进芯片。

对国产芯片厂商来说,算得上好消息的一点是,从 2022 年开始的英伟达芯片禁令,把控方向正变得越来越严格,且政策还往往易变。即便 H20 芯片解禁,从供应链稳定和安全的角度考量,部分 AI 厂商也需要这些国产芯片厂商继续供货。

英伟达的麻烦并未随着 H20 的解禁而告一段落。相比上半年近千亿的损失,更令英伟达担忧的,则是大客户纷纷自研芯片的现状。这一景象已经在美国陆续发生。

为了降低用云成本,微软、谷歌等美国头部云厂商开始加速自研服务器芯片和云端 AI 芯片。

" 如果你能制造出针对 AI 进行优化的硅,那前方等待你的将是巨大的胜利。" 研究公司 Forrester 分析师格伦 · 奥唐纳形容道。 

谷歌曾是最早大规模采购 GPU 来进行 AI 计算的公司,但后来研发自己的 AI 专用芯片,在 2016 年就已经发布了第一代 TPU(张量处理单元)。如今,从 AI 绘图公司 Midjourney,到 AI 独角兽公司 Anthropic,都开始使用起了谷歌的算力。

亚马逊也借助 2015 年收购的以色列芯片初创公司 Annapurna Labs,在 2018 年前后推出了基于 Arm 的服务器芯片和 AI 芯片,并开始将自研算力服务器兜售给包括 OpenAI、Anthropic 等在内的 AI 大客户,从而挤占英伟达的市场份额。

就连一贯英伟达强绑定的 OpenAI,也在内部筹划着自研芯片的事情。至少从 2022 年开始,OpenAI 就已经讨论了各种方案,希望能解决芯片又贵又短缺的问题,自研芯片便是方案之一。

对需求量大的国内科技大厂而言,成本压力也是华为、阿里、百度、字节、腾讯等自研芯片的原因之一。国信证券在一份研报中称,处理器芯片占服务器 BOM(物料清单)成本约 40%。

在阿里、百度相继推出各自的平头哥和昆仑芯计划之后,2021 年 3 月,媒体曝出字节跳动正在自主研发云端 AI 芯片和 Arm 服务器芯片。字节跳动随后证实,正在组建芯片团队。

几乎在同一时间,腾讯也被曝出多个芯片研发岗位的招聘信息。官方随后回应,腾讯正在研发的并非通用芯片,而是基于一些业务需要,在特定领域展开的协处理器研发尝试,比如 AI 加速和视频编解码等。

类比当前智能手机领域的芯片竞争格局,展望未来的 AI 芯片领域,未必不会达成部分复杂场景用英伟达芯片,部分简单场景用自研和国产芯片的混合计算架构局面。

但想要维持上述局面的一大前提是,黄仁勋得避免让英伟达芯片再度迎来出口禁令。

本文来自微信公众号:字母榜,作者:赵晋杰

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

英伟达 芯片 华为 黄仁勋 一体机
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论