出品 | 虎嗅科技组
作者 | 丸都山
编辑 | 苗正卿
头图 | 视觉中国
7 月 16 日,黄仁勋在北京出席了 " 链博会 ",罕见地以一身唐装示人,并首次尝试使用中文演讲。
" 中国的开发者、创业者正在推动 AI 的快速创新,现在有 100 万名开发者投身这一领域,像 DeepSeek、阿里巴巴、MiniMax、百度,他们开发的产品都是世界级的,推动了全球人工智能的发展。"
自黄仁勋抵达北京以来,对于中国 AI 产业及厂商的赞美,贯穿于每一次公开露面中。
这并不难理解,就在两天前,这位英伟达掌舵人表示,美国政府已批准此前被禁止出口的 H20 芯片,可以再度销往中国。
鉴于国内 AI 厂商的 " 算力焦虑 ",那些已经被英伟达在财报中列入 " 计减损失 " 的价值 45 亿美元的库存积压,恐怕此刻正被紧急清点、打包,不日即可送到中国客户手中。
不过,几乎在黄仁勋高调示好中国市场的同一时间,美国商务部部长霍华德 · 卢特尼克却站出来摆了一道。
" 中国企业无法得到最好的芯片,也不是第二好(second best),甚至不是第三好(even third best)",在接受美媒采访时,卢特尼克直言不讳地表示,该策略是为了向中国企业出售足够多的 AI 芯片,以形成对美国的技术依赖。
这番言论直白地阐述了一个立场:在当前对华半导体限制的基调下,无论政策是否松动,位于中国的下游产业链都无法取得符合预期的产品。
而此次到访中国的黄仁勋,也并没有用太多篇幅去渲染英伟达 GPU 的重要性,至少在中国市场,英伟达的叙事,正在发生些微妙的转变。
英伟达,等不起
综合多方信息来看,卢特尼克的表态很大程度上也是一种挽尊之举。
一方面,中国通过稀土出口等反制手段开始取得效果;另一方面,自今年 4 月以来,美国半导体产业链对于特朗普政府反复进行游说及施压。
其中,英伟达的反应尤为激烈,由于 " 特供版 "H20 芯片无法销往他处,如果不解除禁售,将不得不面对真金白银的损失。
在昨天下午的媒体沟通会上,黄仁勋也谈到了关于 H20 的问题:" 英伟达可能无法全部恢复先前的库存计减损失,但大部分资产并未永久报废,回收率可能达不到 100%,但也不会是 0。"
而相比于财报上的数字,真正让黄仁勋担心的应该是英伟达 GPU 芯片留出的真空期。
可以横向对比下,过去三个月中国 AI 芯片行业发生了哪些变化。
以英伟达直接竞争对手华为为例,今年 5 月华为在鲲鹏昇腾开发者大会上正式推出 "CloudMatrix385 超节点 " 算力平台,它基于 384 张昇腾芯片实现了业界最大规模的高速总线互联。
诚然,昇腾芯片在硬件参数上要逊于英伟达芯片,但作为通信起家的公司,华为通过全互联对等架构的研发,实现了对英伟达 NVL 72 在稠密 BF16 算力、网络互联总带宽的反超。
媒体沟通会上,当被问到如何看待华为等竞争对手时,黄仁勋坦言," 我们已经做了 30 年,他们(华为)才做几年,现在没有哪家公司比英伟达付出更多精力来建造 AI 生态,而华为已经能和我们相提并论,这说明了一些问题。"
同样在近期抓住机会的还有寒武纪。根据此前发布的一季度财报,这家公司的营收从去年同期的 0.26 亿暴增至 11.11 亿,并首次在单季度实现盈利。尽管这段时期与英伟达 H20 的对华禁售并不完全重叠,但考虑到下游厂商的备货周期,已经足够说明问题。
面对国产 AI 算力芯片的汹涌来袭,黄仁勋和他的英伟达,恐怕等不起。
更重要的是,正如虎嗅本月 15 日文章《黄仁勋释怀了》所指出的,大模型向国产算力平台迁移是个 " 单向 " 的过程,随着这个过程的推进,无论从经营成本来看,还是从风险管控来看,在迁移部署完成后都不大可能再回归英伟达生态当中。
因此,当下的黄仁勋才会迫不及待地表态,并高调宣布英伟达高算力芯片重新回归国内市场。
押宝中国具身智能
如无意外,在 H20 芯片积压的库存消耗殆尽后,这款产品将不会再继续生产,黄仁勋昨天也侧面证实了这一点。
对于未来中国市场,英伟达预计将主推基于 Blackwell 架构打造的 "B30 芯片 ",需要说明的是,这同样是一枚中国特供版芯片,而且极有可能是一次 " 反向升级 "。
根据 Wccftech 的爆料,围绕 B30 构建的机架级解决方案相比于 H20 部分性能有所削弱,但预计能效会比后者高出 30%,采购成本降低 40%,而价格降低是建立在 HBM 芯片改用 GDDR7 的基础上。
鉴于大模型预训练阶段已基本结束,除非 B30 芯片在推理场景中的能效比有着大幅提高,不然 B30 芯片对于国内厂商的需求可能并没有那么高。
而此次黄仁勋在北京期间,也并没有透露这枚芯片的进展。与之形成鲜明对比的是,围绕 " 人形机器人 " 领域的表态却异常密集,成为此次行程的另一大焦点。
在被问到如何看待中国人形机器人产业时,黄仁勋表示有三个关键点:
第一,全球都面临严重的劳动力短期,制造业缺口甚至达到千万级,提高自动化水平将显著推动全球 GDP 增长。
第二,人形机器人与 AI 的技术结合正合时宜,两个领域同步推进。
第三,中国已拥有非常优秀的 AI 技术,在机电一体化上做的非常出色,而且还有庞大的制造业基础来部署这些机器人。
" 因此,我对中国人形机器人的发展非常乐观。"
不过,可能黄仁勋没有提到的一个原因是,在中国市场推广英伟达的人形机器人服务,其实是一项非常 " 因地制宜 " 的策略。
一方面,人形机器人供应链暂时没有被明确列入到对华出口限制中;另一方面,英伟达在人形机器人领域有着庞大且完整的技术栈,即便在充满不确定的地缘政治中,也完全可以做到 " 狡兔三窟 "。
比如要部署在端侧的计算机,英伟达有 Jeston Thor;如果需要做仿真训练,英伟达有 Omniverse 平台;如果需要让机器人通过模仿学习或通过试错与强化学习的反馈来学习新技能,英伟达还有 Isaac Lab。
哪怕连基础模型都搞不定的话,没关系,英伟达还有 GROOT N1。
如果说在生成式 AI 时代,英伟达是行业背后的 " 卖铲人 ",那么到了具身智能时期,英伟达可能想的是将所有生产工具全部包办。
在具身智能创业如火如荼的中国,英伟达未来的市场潜力不言自明。
值得一提的是,过去两年的 GTC 大会上,黄仁勋曾展示了多款来自国内厂商的人形机器人,而在这次的 " 链博会 " 展台上,英伟达则带来了诸如 " 加速进化 "、" 智平方 " 等人形机器人新秀企业,主打一个 " 一碗水端平 "。
CUDA,被动兼容?
在昨天的媒体沟通会上,黄仁勋还有一番表态让人颇感意外。
当被问到英伟达是否会考虑开源 CUDA 时,黄仁勋表示," 如果一个平台与 CUDA 兼容,我觉得是没问题的。实际上,CUDA 本身就比较开发,你可以查阅 CUDA 的详细版本,然后基于此开发兼容版本。因此,从某种程度上来说,CUDA 已经是开源的。"
" 这和 X86 架构不同,如果你开发兼容 X86 的产品,他们可能会不满,但如果你开发兼容 CUDA 的产品,我完全不会介意。" 话毕,黄仁勋还不忘隔空 cue 下英特尔。
不过,过去英伟达在 CUDA 的兼容问题上是较为敏感的。
比如在去年 3 月,英伟达就在 CUDA 11.6 更新版本的最终用户许可协议(EULA)中加入了一个条款:不得对使用 SDK 组件生成的软件产品的任何部分进行逆向工程、反编译或反汇编,以便转换此类软件产品、从而在非英伟达平台上运行。
那么在实际产品开发中,是否有企业这么做呢?应该说,不止一家公司实践过。
比如 AMD ROCm 的就是在 API 接口协议和编译器层面与 CUDA 保持一致的基础上,开发具有自主知识产权的工具库、技术栈。
还有一些国内厂商则更加直接,通过调用 CUDA 函数来让未经修改的二级制文件运行在第三方卡上,这的确切实伤害了英伟达的利益。
但从黄仁勋昨日的公开表态中,不难察觉英伟达在 " 被动兼容 CUDA" 这一关键问题上的心态已悄然发生转变。
这种转变背后存在双重现实考量:一方面,正如前文所提及的,英伟达当前最忧心的是,在美国政府政策持续摇摆的背景下,其在潜力巨大的中国市场可能被迫让渡出 " 市场真空 ",进而给竞品创造可乘之机。
另一方面,正如黄仁勋强调的,英伟达是全球少数几家能够实现从算法架构、系统软件、硬件系统、网络技术直至芯片设计的全栈创新的企业,即便硬件销售上有所损失,只要能牢牢掌控 CUDA 生态的核心影响力,依然可以通过软件授权、技术服务等路径实现商业价值回流。
登录后才可以发布评论哦
打开小程序可以发布评论哦