钛媒体 昨天
黄仁勋要靠梁文锋逼单
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 | 源 Byte,作者 | 柯基的柯

穿着皮衣顶着北京的大太阳,英伟达 CEO 黄仁勋可不想自己今年第三次的中国之行,就仅仅收获一张跟小米创始人雷军的合影。

次日,也就是 7 月 15 日,黄仁勋宣布 H20 芯片恢复对华销售,声称将缓解中国市场的算力瓶颈,算是帮 DeepSeek 创始人梁文锋解了围。

据知情人士爆料,DeepSeek 的 R2 模型因 H20 芯片禁售而延迟发布,官网流量暴跌 70%,用户流失至第三方平台,梁文锋急需 R2 模型来稳住局面。

作为垄断全球算力的硬核狠人,黄仁勋出手 " 搭救 " 梁文锋可能更多是从商业层面考虑,毕竟放眼全球,只有眼前这位广东靓仔依靠 " 阉割版 " 的基建,就能对 OpenAI、谷歌等一系列国际巨头持续施压。

01  相爱相杀

黄仁勋与梁文锋的关系,可以用 " 亦敌亦友 " 来概括。

黄仁勋掌舵的英伟达,是全球 AI 算力基础设施的 " 军火商 ",是支撑顶级大模型发展的核心引擎。而梁文锋创立的 DeepSeek,则以 " 低成本、高性价比 " 为标签,通过算法创新将大模型训练成本压缩至行业平均水平的 1/20。

在 DeepSeek 年初爆火出圈的那段时间,它不止颠覆了技术路径,更动摇了 " 算力霸权 = 商业成功 " 的旧秩序,一度让英伟达的市值蒸发千亿美元。

但如果追根溯源的话,两人的关系起点应该是合作,2021 年,梁文锋着手提前卡位,意图购买 1 万张 A100 显卡,为 DeepSeek 后续研发奠定基础。彼时的美国还尚未将该型号列入禁售清单。

在后来的台北国际电脑展大会上,黄仁勋还公开称赞 DeepSeek,他认为,DeepSeek-R1 对人们理解 AI 和推理有巨大的影响,对行业和世界作出了巨大贡献。

对于老辣的黄仁勋来说,DeepSeek 的崛起让他看到了新的市场机遇。2025 年春节后的第一周,搭载 8 块 H20 的服务器价格从年前的 100 万元飙升至 110 万元,甚至有客户愿意加价 5 万元锁定现货,随后,这款显卡一路飙升,截止黄仁勋本年度第三次来华之前,市场价格已经来到了 180 万元。

英伟达芯片概念图 | 源 Byte 制

这款专为中国市场设计的芯片,虽在浮点运算能力上仅有旗舰产品 H100 的 1/10,但其 96GB 显存和 900GB/s 的 NVLink 带宽,恰好击中了推理场景的命门。

当 DeepSeek 以 560 万美元的训练成本叫板行业巨头时,其开源策略点燃了企业部署 AI 的热情,但也带来了副作用:推理服务的稳定性成为致命短板,而 H20 的 " 错位竞争 " 策略恰好填补了这一需求空白,其 4.0TB/s 的显存带宽足以支撑数十个推理任务并行,而价格仅为 H100 的 1/3。

也就是说,DeepSeek 的崛起反而让 H20 完美地适配了中国大模型市场,黄仁勋这一次的中国行虽没有带来顶级 " 尖儿 " 货,但带来了最具性价比的选择。

还是黄仁勋的算盘打得精,在 DeepSeek 彻底将中国大模型市场定位在弯道超车的性价比路线后,英伟达极有可能将类似 H100 这类顶级显卡卖给海外顶级大模型公司,待其升级迭代数月后,再将 " 阉割版 "、" 特供版 " 大批量地出售给中国大模型公司,让其继续对海外公司保持竞争力。

毕竟,有竞争才有压力,有压力才会让这些大模型公司不断提升对算力的需求。

02  梁文锋又要杀回来了

在 R2 接连跳票的这段日子里,梁文锋的日子并不好过。

一度在大模型内卷中 " 掉队 " 的百度率先发难,百度创始人李彦宏早在 4 月就公开吐槽 DeepSeek" 慢且贵 ",称其 API 调用价格远高于市场平均水平。

在外界都以为,梁文锋掏出 R2 模型将文心一言按在地上摩擦之时,仅仅在 5 月底推出了 DeepSeekR1 的改款,但是后续市场反响平平,并未帮助 DeepSeek 止住颓势。

截图来源于 DeepSeek 官网

根据国际半导体研究机构 Semianalysis 最新报告,DeepSeek 的全球用户使用率已从 2025 年 1 月的 50% 骤降至 7 月的 3%,官网访问量在 2 月至 5 月期间下滑 63%。另一家 AI 模型集成平台 Poe 的统计显示,其核心模型 R1 的使用率在 2 月至 4 月间腰斩,从 7% 跌至 3%,而同期 ChatGPT 和谷歌 Gemini 的使用率分别增长 40.6% 和 85.8%。

眼见 R2 模型一拖再拖,一度让 DeepSeek 彻底挤下牌桌的 "X 小龙 " 们又活跃起来,6 月中旬更新的 MiniMax-M1 模型,号称世界上第一个开源的大规模混合架构推理模型,其号称整个强化学习阶段只用到 512 块 H800 三周的时间,租赁成本只有 53.47 万美金。

来到 7 月,月之暗面上线的 KimiK2 模型,同样选择了开源,并成为国内开源领域首个总参数量达到 1 万亿的 MoE 架构基础模型。

截图来源于 KimiK2 官网

一个有趣的现象似乎可以印证 "X 小龙 " 们在 R2 缺位这段时间内的心情起伏,在 BOSS 直聘等招聘渠道上,5 月份的主流岗位还是各类应用的产品经理,进入到 6 月就纷纷将其撤下,换成各类工程师与研究员。

毕竟,在为效率买单的 AI 付费体系尚未成熟的阶段,各类应用前途不明,倒不如在 R2 缺位的阶段,在大模型领域再搏一把。即便是 Mauns 这种一度火出半边天的爆款,并未在国内市场淘出几个金块,在近期甚至传出 " 跑路 " 去新加坡的消息。

甚至,部分国内大厂似乎看到了对 DeepSeek 取而代之的希望,赶工加点地推出产品,一度让行业从从 " 卷技术 " 转向 " 卷参数 ",技术标准逐渐模糊化,甚至闹出了一连串的套壳抄袭事件。

就在 7 月初,华为盘古大模型被曝与阿里通义千问的代码相似度高达 92.7%,华为的回应堪称教科书级别的公关话术—— " 严格遵循开源许可 ",但开源社区的开发者们并不买账。这场风波并非孤例。月之暗面与阿里通义的纠纷也被旧事重提,尽管细节模糊,却足以让行业陷入信任危机。

" 即便 R2 无法完全超越这些顶级大模型,但至少会给整个行业的发展路径定调,就是给大家一个如何接近和赶超顶级大模型的路径,省得只能在这里无效卷参数。" 有开发者对源 Byte 坦言。

" 虽然是一边唱衰 DeepSeek,但行业还是离不开(DeepSeek),毕竟只有幻方知道如何赶超顶级大模型。" 上述开发者表示,相比其他国产大模型,DeepSeek 至少不会盲目卷参数,且清楚地知道这条追赶之路是什么状况。

就当友商们似乎见到光明之时,黄仁勋直接掐灭了火种,他为梁文锋带来了期盼已久的 H20。据知情人士透露,DeepSeek 团队近几个月一直在密集推进 R2 模型开发,但梁文锋目前对模型的能力仍不满意,内部仍在继续提升性能,相应模型尚未准备好正式投用。

黄仁勋带来的 H20,虽然在性能仅为 H100 的 15%-20%,谈不上雪中送炭,倒也间接地帮助国产大模型结束抄袭、套壳、参数注水的乱象。

03  芯片解禁,谁的救命稻草?

虽然梁文锋的 R2 模型在某种程度上,未来极有可能成为黄仁勋向 OpenAI 等公司逼单的筹码,但天下终究苦英伟达久矣,这位钟爱皮衣的男人同样需要盟友。

翻开 " 反英伟达联盟 " 的名单,既有 OpenAI、Meta、微软、谷歌、亚马逊等深度依赖英伟达芯片的科技巨头,也包括英特尔、AMD、高通等英伟达的直接竞争对手。

来到今年 6 月,在 AdvancingAI 2025 大会现场,OpenAI 的 CEO 萨姆 · 奥特曼明确表示,OpenAI 未来将使用 AMD 的 AI 芯片。正在构建 " 芯片 - 模型 - 生态 " 三位一体的全新生态。

这种顶级 AI 模型厂商与芯片厂商深度合作的模式,可能会引发其他 AI 领军企业效仿,加速它们在芯片领域的布局。

AMD 作为英伟达的老对手,在苏姿丰的带领下,凭借在 CPU 和 GPU 方面的建树,提供在性能上能与市场领导者匹敌甚至在某些单点上有所超越、但在成本上更具优势的产品,以此吸引那些对价格敏感或者寻求替代供应商的客户。

因此,H20 这种性能被打了折扣的产品,恰好与 AMD 的芯片来到了同一赛道。据财报数据,2025 年第一季度,英伟达营收达 440 亿美元,在独立显卡市场占据超 90% 的份额;AMD 同期营收 74.4 亿美元,同比增长 35.9%(年增 36%),超出市场预期的 71 亿美元,增长势头强劲。

英伟达已被 OpenAI、谷歌、Meta 等头部机构的大模型训练(如 GPT-4、PaLM)验证,形成 " 成功案例→行业信任→更多采用 " 的正向循环;而 AMD 在超大规模大模型(千亿参数以上)的公开成功案例较少,企业在选择时需承担 " 试错成本 "。

就在黄仁勋宣布 H20 的第二天,AMD 当即表示,在美国宣布将批准销售后,公司计划重启向中国出口其 MI308 芯片。AMD 的 MI308 芯片是专为中国市场设计的 AI 加速器,基于其 MI300 系列架构,性能足以满足垂类模型训练和推理需求。

因此,OpenAI 与 AMD 的合作,在某种程度上为 AMD 的产品和服务打样,倘若继续 " 禁售 " 下去,势必助长 AMD 在争取 DeepSeek 等一众国产大模型的优势。

对于黄仁勋来说,这块最适配 H20 的市场,又是增速最为迅猛的市场,错过这一波行情,不知下一次是何年。

根据 IDC 发布的《中国模型即服务 ( MaaS ) 及 AI 大模型解决方案市场追踪,2024H2》报告显示,2024 年中国 MaaS 市场呈现爆发式增长,全年规模达 7.1 亿元人民币,较 2023 年实现 215.7% 的同比激增,其中 2024 下半年市场规模达 4.6 亿元人民币。展望 2024-2029 年,该市场将以 66.1% 的年均复合增长率高速扩容,预计 2029 年市场规模将达到 90 亿元人民币。

黄仁勋必须要在友商即将要起势的关键阶段,果断出手来打乱节奏,积极游说美国政府调整政策。

肉眼可见,英伟达将在中国市场狂赚一笔了。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

英伟达 ai 黄仁勋 芯片 中国市场
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论